百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

python:抽样和抽样方法(python随机抽样)

off999 2024-11-15 23:07 14 浏览 0 评论

学习目标

  • 目标
  • 知道总体、样本、样本大小、样本数量
  • 知道样本统计量和总体统计量
  • 知道总体分布、样本分布和抽样分布
  • 知道常用的抽样方法

某糖果公司研发了一种超长效口香糖,为了得到口味持续时间的数据,公司聘请了试吃者帮忙完成检验,结果却让人大跌眼镜!

没文化,真可怕!我该怎么办? 有时候数据很容易收集,例如参加健身俱乐部的人的年龄,后这一家游戏公司的销售数据。但有时候不太容易,该怎么办呢? 是时候拿出终极武器了— 抽样

1.抽样相关概念

总体:是指研究对象的整个群体。

公司生产的一批糖果

样本:是从总体中选取的一部分,用于代表总体的整体情况。

在这批糖果中随机抽取50颗糖果

样本数量:又叫样本空间,是表示有多少个样本。

在这批糖果中随机抽取50颗糖果,抽5次:样本数量=5

样本大小:也叫样本容量,表示每个样本里有多少个数据。

每个样本50颗糖果:样本大小=50

统计量:

统计量是对数据进行统计得到的量,例如:均值、方差、标准差、比例等。

  • 总体统计量:总体XX

对总体进行统计得到的统计量

  • 总体均值$\mu$:整批所有糖果数据的均值
  • 总体方差$\sigma^2$:整批所有糖果数据的方差
  • 样本统计量:样本XX

对样本进行统计得到的统计量

  • 样本均值$\bar{X}$:抽取的某个样本糖果数据的均值
  • 样本方差$S^2$:抽取的某个样本糖果数据的方差

分布:

  • 总体分布

总体数据的概率分布:整批所有糖果数据的概率分布

  • 往往未知,很多时候无法获得总体所有元素的观测值
  • 可以通过理论计算进行假定
  • 样本分布

抽取的样本中数据的概率分布:抽取的某个样本糖果数据的概率分布

  • 假设总体大小为m,样本大小为n,n趋近于m时,样本分布趋近于总体分布
  • 样本分布又称经验分布

注意:样本分布与总体分布近似(抽样正确的前提下)

  • 抽样分布

对样本统计量概率分布的一种描述:所有样本均值的概率分布

2.抽样方法

? 抽样的目的是为了通过样本获得总体的信息,所以关键点是怎么抽样才能保证获得的样本具有代表性,下面,我们简单介绍几种常用的抽样方法。

  • 简单随机抽样(simple random sampling)。原理和我们抽扑克牌、抽奖一样,就是从一个固定的总体中(比如有N个对象),利用抽签或其他随机方法(如随机数表)抽取n个对象。所谓随机,是指总体中每一个对象被抽中的概率相等。假设两个人抽扑克牌比大小,两个人抽中大王的概率其实一样,都是1/54。
  • 系统抽样(systematic sampling)。这种抽样方法的核心在于确定一个所谓的“抽样间隔”。比如将总体对象随机编号,从1至100,我们只抽取编号个位数是7的对象,即编号为7,17,27,…的样本,本质上他们相邻的编号有一个固定的间隔——10。
  • 分层抽样(stratified sampling),是指先将总体按照某种特征分为若干层,比如按照性别分为男女两层,然后再从每一层内进行简单随机抽样。分层的目的就在于提升样本对总体的代表性,提高估计的精确度,比如一般的理工院校男生多女生少,采用分层抽样可以保证男性和女性样本都能被抽中。
  • 整群抽样(cluster sampling),是将总体分成几个群,比如我国开展的大型调查一般会以省或地区为群,先采用简单随机抽样的方法抽取群,然后从抽中的群中再抽取相关的个体进行研究。现实过程中可以将抽中的群中的所有对象作为研究样本,也可以在群内部再次进行抽样获得部分调查对象作为样本。

3.小结

  • 抽样相关概念 【知道】
  • 总体:是指研究对象的整个群体。
  • 样本:从总体中选取的一部分
  • 样本大小:每个样本里有多少个数据
  • 样本数量:表示有多少个样本。
  • 统计量
  • 总体XX
  • 总体均值$\mu$
  • 总体方差$\sigma^2$
  • 样本XX
  • 样本均值$\bar{X}$
  • 样本方差$S^2$
  • 分布:
  • 总体分布
  • 样本分布
  • 抽样分布
  • 抽样方法 【知道】
  • 简单随机抽样:随机抽
  • 系统抽样:等间隔抽
  • 分层抽样:每种分别抽
  • 整群抽样:直接抽一拨

相关推荐

PYTHON-简易计算器的元素介绍

[烟花]了解模板代码的组成importPySimpleGUIassg#1)导入库layout=[[],[],[]]#2)定义布局,确定行数window=sg.Window(&#...

如何使用Python编写一个简单的计算器程序

Python是一种简单易学的编程语言,非常适合初学者入门。本文将教您如何使用Python编写一个简单易用的计算器程序,帮助您快速进行基本的数学运算。无需任何高深的数学知识,只需跟随本文的步骤,即可轻松...

用Python打造一个简洁美观的桌面计算器

最近在学习PythonGUI编程,顺手用Tkinter实现了一个简易桌面计算器,功能虽然不复杂,但非常适合新手练手。如果你正在学习Python,不妨一起来看看这个项目吧!项目背景Tkint...

用Python制作一个带图形界面的计算器

大家好,今天我要带大家使用Python制作一个具有图形界面的计算器应用程序。这个项目不仅可以帮助你巩固Python编程基础,还可以让你初步体验图形化编程的乐趣。我们将使用Python的tkinter库...

用python怎么做最简单的桌面计算器

有网友问,用python怎么做一个最简单的桌面计算器。如果只强调简单,在本机运行,不考虑安全性和容错等的话,你能想到的最简单的方案是什么呢?我觉得用tkinter加eval就够简单的。现在开整。首先创...

说好的《Think Python 2e》更新呢!

编程派微信号:codingpy本周三脱更了,不过发现好多朋友在那天去访问《ThinkPython2e》的在线版,感觉有点对不住呢(实在是没抽出时间来更新)。不过还好本周六的更新可以实现,要不就放一...

构建AI系统(三):使用Python设置您的第一个MCP服务器

是时候动手实践了!在这一部分中,我们将设置开发环境并创建我们的第一个MCP服务器。如果您从未编写过代码,也不用担心-我们将一步一步来。我们要构建什么还记得第1部分中Maria的咖啡馆吗?我们正在创...

函数还是类?90%程序员都踩过的Python认知误区

那个深夜,你在调试代码,一行行检查变量类型。突然,一个TypeError错误蹦出来,你盯着那句"strobjectisnotcallable",咖啡杯在桌上留下了一圈深色...

《Think Python 2e》中译版更新啦!

【回复“python”,送你十本电子书】又到了周三,一周快过去一半了。小编按计划更新《ThinkPython2e》最新版中译。今天更新的是第五章:条件和递归。具体内容请点击阅读原文查看。其他章节的...

Python mysql批量更新数据(兼容动态数据库字段、表名)

一、应用场景上篇文章我们学会了在pymysql事务中批量插入数据的复用代码,既然有了批量插入,那批量更新和批量删除的操作也少不了。二、解决思路为了解决批量删除和批量更新的问题,提出如下思路:所有更新语...

Python Pandas 库:解锁 combine、update 和compare函数的强大功能

在Python的数据处理领域,Pandas库提供了丰富且实用的函数,帮助我们高效地处理和分析数据。今天,咱们就来深入探索Pandas库中四个功能独特的函数:combine、combine_fi...

记录Python3.7.4更新到Python.3.7.8

Python官网Python安装包下载下载文件名称运行后选择升级选项等待安装安装完毕打开IDLE使用Python...

Python千叶网原图爬虫:界面化升级实践

该工具以Python爬虫技术为核心,实现千叶网原图的精准抓取,突破缩略图限制,直达高清资源。新增图形化界面(GUI)后,操作门槛大幅降低:-界面集成URL输入、存储路径选择、线程设置等核心功能,...

__future__模块:Python语言版本演进的桥梁

摘要Python作为一门持续演进的编程语言,在版本迭代过程中不可避免地引入了破坏性变更。__future__模块作为Python兼容性管理的核心机制,为开发者提供了在旧版本中体验新特性的能力。本文深入...

Python 集合隐藏技能:add 与 update 的致命区别,90% 开发者都踩过坑

add函数的使用场景及错误注意添加单一元素:正确示例:pythons={1,2}s.add(3)print(s)#{1,2,3}错误场景:试图添加可变对象(如列表)会报错(Pytho...

取消回复欢迎 发表评论: