数据的收集
2.掌握分层抽样的一般步骤,会用分层抽样抽取样本.
3.能解决分层抽样中的计算问题.
4.掌握数据收集的基本方法.
1.分层抽样
(1)将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
(2)当总体由差异明显的几部分组成时,往往选用分层抽样的方法.
(3)分层抽样的优点是使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的抽样法.
归纳总结
使用分层抽样抽取样本时,需注意以下几个问题:(1)必须先判断所考察的总体中的个体是否具有明显的差异,若是,则用分层抽样,若不是,则应用简单随机抽样或系统抽样.
(2)为获取各层入样数目,需先正确计算出抽样比 .若k与某层个体数的积不是整数时,可四舍五入取整.
(3)分层抽样仍属于等可能抽样.
【做一做1】 为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样
B.按性别分层抽样
C.按学段分层抽样
D.系统抽样
解析:因为学段层次差异较大,所以按学段分层抽样.
答案:C
2.分层抽样的步骤
(1)将总体按一定标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层的个体数占总体的个体数的比确定各层应抽取的样本个体数;
(4)在每一层进行抽样(可用简单随机抽样或系统抽样).
【做一做2】 课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8.若用分层抽样抽取6个城市,则丙组中应抽取的城市数为 .
解析:抽样比为 $\frac{6}{24}=\frac{1}{4}$,故在丙组中应抽取的城市数为$8 \times \frac{1}{4}=2$.
3.数据的收集
在实际统计调查时,一般先要确定调查的目的、对象,也就是统计调查要解决的问题和需要调查的总体;还要确定好调查的项目,也就是要统计的变量.接下来就可以开始收集数据了.收集数据的方式主要有做试验、查阅资料、设计调查问卷等几种方式.
【做一做3】 下列数据适合用试验的方法得到的有( )
A.2015年的全国人口总数
B.某学校抽烟的学生在总人数中所占的比例
C.某班男生的平均身高
D.顾客对某种产品的满意程度
答案:C
1.辨析比较三种常用抽样方法
剖析:
类别
共同点
各自特点
相互联系
适用范围
简单
随机
抽样
①抽样过程中每个个体被抽取的可能性相等;②总体中的个体数有限;③逐个进行抽取;④都是不放回抽样
从总体中逐个抽取
总体中的个体数较少
系统
抽样
将总体均分成几部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层
抽样
将总体分成几层,按各层个体数与总体个体数之比进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
2.分层抽样中各层的入样要求
剖析:当已知总体由差异明显的几部分组成时,应将总体分成互不交叉的几部分,然后按照各部分所占的比例,从各部分中独立抽取一定数量的个体,再将各部分抽出的个体合在一起作为样本,这就是分层抽样.其中所分成的每一部分称为层.
由于层与层之间有明显的区别,而层内个体间差异很小,为了使样本更能充分地反映总体的情况,抽取样本时,必须照顾到各个层中的个体.因此,每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即
这样抽取能使所得到的样本与总体基本相同,可以提高样本对总体的代表性.
在实际操作时,应先计算出抽样比,
获得各层入样数的比例,再按抽样比确定每层需要抽取的个体数.
如:一批灯泡400只,其中20 W,40 W,60 W的数目分别为200只、150只和50只,现用分层抽样的方法获取一个容量为40的样本,则三种灯泡依次抽取的个数可按如下方法确定:求出抽样比,则应抽取各种瓦数的灯泡只数分别为$20 \mathrm{W} : 200 \times \frac{1}{10}=20$(只);$40 \mathrm{W} : 150 \times \frac{1}{10}=15$(只);$60 \mathrm{W} : 50 \times \frac{1}{10}=5$(只).
名师点拨在实际操作中,抽样方法经常交叉起来使用,使样本更具有代表性,比如,分层抽样时,若每层中个体数量仍然很大,则可辅以系统抽样,而系统抽样在分组后第一组中又可采用简单随机抽样.
分层抽样的概念
【例1】 某企业共有3 200名职工,其中,中年、青年、老年职工的比例为$5 : 3 : 2$,为了调查职工的身体状况,现从所有职工中抽取一个样本容量为400的样本,应采用哪种抽样方法更合理?且中年、青年、老年职工应分别抽取多少人?
分析:总体由差异明显的几部分组成,应采用分层抽样.
反思
解决有关分层抽样的概念问题,需要抓住分层抽样的特点,即适用于由差异较大的几个部分组成的总体的抽样,根据这个特点来确定分层抽样的应用范围,再由分层抽样的定义,可以判断出所给的抽样方法是否属于分层抽样.
【变式训练1】 下列问题中,最适合用分层抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.某社区有300户家庭,其中高收入的家庭75户,中等收入的家庭180户,低收入的家庭45户,为了了解生活购买力的某项指标,要从中抽取一个容量为50的样本
C.从1 000名工人中,抽取100人调查上班途中所用的时间
D.从生产流水线上,抽取样本检查产品质量
分层抽样的方案设计
【例2】 某县共有320个自然村,其中山区32个,丘陵地区240个,平原地区48个.为调查村民收入状况,要从中抽出20个村进行调查,试设计一种比较合理的抽样方案,并简述抽样过程.
反思
对于个体差异较为明显的总体,用分层抽样法抽取样本,所得样本的代表性较好,在按比例确定各层抽取个体数后,在各层中又可以采用简单随机抽样或系统抽样抽取样本.
【变式训练2】 某工厂有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级部门为了了解机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.
分层抽样中的计算问题
【例3】 (1)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n的值为( )
A.9 B.10 C.12 D.13
反思
如果总体容量为$N$,样本容量为$n, N_{i}(i=1,2,3, \cdots, k)$是第$i$层中的个体数,$n_{i}(i=1,2,3, \cdots, k)$是第$i$层中应抽取的个体数,那么必有:
(1) $\frac{n}{N}=\frac{n_{i}}{N_{i}}(i=1,2,3, \cdots, k)$
(2) $n_{i}=\frac{n}{N} \cdot N_{i}(i=1,2,3, \cdots, k)$
【变式训练3】 某社区对居民进行某车展知晓情况的分层抽样调查.已知该社区的青年人、中年人和老年人分别有800人、1 600人、1 400人.若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是___________.
抽样综合问题
【例4】 为了检验某厂生产的篮球的质量,针对以下问题,选择合适的抽样方法抽样,并写出(3)(4)的抽样过程.
(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.
(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.
(3)有甲厂生产的300个篮球,抽取10个.
(4)有甲厂生产的300个篮球,抽取30个.
反思
弄清三种抽样方法的实质和适用范围,是灵活选用抽样方法的前提和基础.若用分层抽样,应先确定各层应抽取的个数,然后在各层中用系统抽样或简单随机抽样进行抽取.
【变式训练4】 为了考察某校的教学水平,将抽取这个学校高三年级的部分学生的本学年考试成绩进行考察.为了全面地反映实际情况,采用以下三种方式进行抽查(已知该校高三年级共有20个班,且每班学生已按随机方式编好了学号,假定每班的人数相等):
①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的成绩;
②每个班都抽取1人,共计20人,考察这20个学生的成绩;
③把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知若按成绩分,该校高三优秀生共150人,良好生共600人,普通生共250人).
根据以上的叙述,试回答下面的问题:
(1)上面三种方式中各采用何种抽取样本的方法?
(2)试分别写出用上面三种抽取方式抽取样本的步骤.
真题
1.分层抽样又称为类型抽样,即将相似的个体归入一类(层),然后每层抽若干个个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行( )
A.每层等可能抽样
B.每层不等可能抽样
C.所有层用同一抽样比,每层等可能抽样
D.所有层抽同样多样本容量,等可能抽样
2.某学校有教职工140人,其中教师91人,行政人员28人,总务后勤人员21人.为了了解教职工的某种情况,要从中抽取一个容量为20的样本.下列各方法中,采用简单随机抽样、系统抽样、分层抽样的分别是( )
方法1:将140人从1$\sim 140$编号,然后制作出有编号1$\sim 140$的形状、大小相同的号签,并将号签放入同一箱子里进行均匀搅拌,然后从中抽取20个号签,将编号与号签相同的20个人选出.
方法2:将140人分成20组,每组7人,并将每组7人按1$\sim 7$编号,在第一组采用抽签法抽出k号$(1 \leqslant k \leqslant 7)$,其余各组k号也被抽出,20个人被选出.
方法3:按20∶140=1∶7的比例,从教师中抽出13人,从行政人员中抽出4人,从总务后勤人员中抽出3人.从各类人员中抽取所需人员时,均采用简单随机抽样,可抽到20人.
A.方法2,方法1,方法3 B.方法2,方法3,方法1
C.方法1,方法2,方法3 D.方法3,方法1,方法2
3.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家.为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是( )
A.2 B.3
C.5 D.13
4.某校有学生1 485人,教师132人,其他职工33人.为有效防控甲型H1N1流感,拟采用分层抽样的方法,从以上人员中抽取50人进行相关检测,则在学生中应抽取_________.
5.某工厂生产$A,B,C$三种不同型号的产品,产品数量之比依次为$2 : 3 : 5$,现用分层抽样方法抽取一个容量为$n$的样本,样本中$A$种型号产品有16件,则样本容量$n=$_________.
6.为了对某课题进行讨论研究,用分层抽样的方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见下表:
高 校
相关人数
抽取人数
$A$
$x$
1
$B$
36
$y$
$C$
54
3
(1)求$x,y$;
(2)若从高校B相关的人员中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.