北师大版(2019)必修第一册6-3用样本估计总体分布学案
展开§3 用样本估计总体分布
课前篇·自主梳理知识
【主题1】 从频数到频率
频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数.在实际问题中,如果总体容量比较小,频数也可以较客观地反映总体分布;当总体容量较大时,________就更能客观地反映总体分布.
在统计中,经常要用样本数据的________去估计总体中相应的频率,即对总体分布进行估计.
答案:频率 频率
【主题2】 频率分布直方图
1.根据频率分布表可以画出频率分布直方图.图中每个小矩形的底边长是该组的组距,每个小矩形的高是该组的________与________的比,从而每个小矩形的面积等于该组的________,即每个小矩形的面积=组距×=频率.我们把这样的图叫作频率分布直方图.频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.
频率分布直方图的好处在于:首先,能清楚直观地显示各组频率分布情况及各组频率之间的差别;其次,当考虑数据落在若干个组内的频率之和时,可以用相应矩形________之和来表示.
2.画频率分布直方图的步骤
(1)计算极差;
(2)确定组距与组数;
(3)分组;
(4)列表;
(5)画频率分布直方图.
3.频率折线图
通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的________开始,用线段依次连接各个矩形的________,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图,有时也用它来估计总体的分布情况.
答案:1.频率 组距 频率 面积 3.中点 顶端中点
[自我检测]
1.思维辨析(对的打“√”,错的打“”)
(1)频率分布直方图的纵轴表示频率.( )
(2)用样本频率估计总体分布的过程中,总体容量越小,估计越精确.( )
(3)频率分布直方图中每个小矩形的面积等于相应组的频数.( )
答案:(1) (2) (3)
2.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是( )
A.总体的容量越大,估计越准确
B.总体的容量越小,估计越准确
C.样本的容量越大,估计越准确
D.样本的容量越小,估计越准确
答案:C
解析:根据样本的频率分布可知,样本的频率分布反映的是总体中部分个体的频率分布,只有当样本的容量越大时,估计才越准确.
3.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )
A.5 B.15
C.2 D.80
答案:A
解析:由频数、频率的概念,设该组的频数n,则n=20×0.25=5.
4.在抽查产生的尺寸过程中,将其尺寸分成若干组.[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的频率分布直方图的高为h,则|a-b|等于( )
A.hm B.
C. D.h+m
答案:B
解析:由题意可知,h=,|a-b|=组距,所以|a-b|==.
课堂篇·重难要点突破
研习1 频率分布表、频率分布直方图、频率折线图
[典例1] (1)容量为20的样本数据,分组后的频数如表所示.
分组 | [10,20) | [20,30) | [30,40) | [40,50) | [50,60) | [60,70] |
频数 | 2 | 3 | 4 | 5 | 4 | 2 |
则样本数据落在区间[10,40)的频率为( )
A.0.35 B.0.45 C.0.55 D.0.65
(2)山东省教育厅为了了解和掌握2019年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
105 124 87 131 97 102 123 104 104 128
109 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
①列出频率分布表;
②画出频率分布直方图和折线图;
③估计该省考生数学成绩在[100,120)分之间的比例.
[审题路线图](1)首先确定[10,40)内的频数,再求频率.
(2)频率分布直方图⇒先求极差,根据极差与数据个数确定组距、组数,然后画图并分析求解.
(1)答案:B
解析:样本数据落在区间[10,40)的频数为2+3+4=9,故所求的频率为=0.45.
(2)解:100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为=11.
①频率分布表如下:
分组 | 频数 | 频率 | 频率/组距 |
[80,85) | 1 | 0.01 | 0.002 |
[85,90) | 2 | 0.02 | 0.004 |
[90,95) | 4 | 0.04 | 0.008 |
[95,100) | 14 | 0.14 | 0.028 |
[100,105) | 24 | 0.24 | 0.048 |
[105,110) | 15 | 0.15 | 0.030 |
[110,115) | 12 | 0.12 | 0.024 |
[115,120) | 9 | 0.09 | 0.018 |
[120,125) | 11 | 0.11 | 0.022 |
[125,130) | 6 | 0.06 | 0.012 |
[130,135] | 2 | 0.02 | 0.004 |
合计 | 100 | 1 | 0.2 |
注:表中加上“频率/组距”一列,这是为画频率分布直方图准备的,因为它是频率分布直方图的纵坐标.
②根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示:
③从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.(0.60=60%)
绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
提醒:每个小长方形的面积=组距×=频率.
[练习1]如图是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空:
(1)样本数据落在范围[5,9)的频率为________;
(2)样本数据落在范围[9,13)的频数为________.
答案:(1)0.32 (2)72
解析:(1)0.08×4=0.32.
(2)样本数据落在[9,13)的频率为0.09×4=0.36,
∴频数n=0.36×200=72.
研习2 频率分布直方图的应用
[典例2] 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[55,75)的人数是________.
答案:13
解析:设[55,75)的人数为x,
=(0.040+0.025)×10,
x=13.
[延伸探究] 频率分布直方图中小长方形的高就是这一组的频率吗?
答案:不是,频率分布直方图中小长方形的高是.
频率分布直方图的性质
(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频数=样本容量.
相应的频率
[练习2]某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽样的100根中,有________根棉花纤维的长度小于20 mm.
答案:30
解析:由题意知,棉花纤维的长度小于20 mm的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20 mm的有0.3×100=30(根).
课后篇·演练提升方案
1.在频率分布直方图中,小长方形的面积等于( )
A. B.组距×频率
C.频率 D.样本数据
答案:C
解析:由频率分布直方图的意义知,小长方形的面积是样本的频率.故选C.
2.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组的频数每一组与前一组的比是同一个常数,后6组的频数中每一组与前一组的差是同一个常数,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为( )
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
答案:A
解析:a=0.3×0.1×32=0.27,
第一组人数:0.1×0.1×100=1;
第二组人数:0.3×0.1×100=3;
第三组人数:0.3×0.1×3×100=9;
第四组人数:0.27×100=27,
∵后6组共100-13=87(人),
∴后6组人数分别是27,22,17,12,7,2,
∴b=27+22+17+12=78.
故应选A.
3.一个容量为100的样本,其数据的分组与各组的频数如下:
组别 | (0,10] | (10,20] | (20,30] | (30,40] | (40,50] | (50,60] | (60,70] |
频数 | 12 | 13 | 24 | 15 | 16 | 13 | 7 |
则样本数据落在(10,40]上的频率为( )
A.0.13 B.0.39 C.0.52 D.0.64
答案:C
解析:由表知(10,40]上的频数为52,故样本数据落在(10,40]上的频率为=0.52.故选C.
4.抽样调查30个工人的家庭人均月收入,得到如下数据:(单位:元)
4 040 4 440 5 560 4 300 3 800 4 200 5 000
4 300 4 200 3 840 4 200 4 040 4 240 3 400
4 240 4 120 3 880 4 720 3 580 4 760 3 760
3 960 4 280 4 440 3 660 4 360 3 640 4 380
3 300 4 260
(1)取组距为600,起点为3 200,列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计人均月收入在[4 400,5 000)的家庭所占的百分比.
解:(1)频率分布表如表.
(2)频率分布直方图如图.
(3)人均月收入落在[4 400,5 000)中的家庭所占的频率为:0.13=13%,所以估计人均月收入在[4 400,5 000)的家庭所占的百分比为13%.
[易错误区] 频率分布直方图
[典例] (2020·南阳高一检测)中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则全市高一学生视力在[3.95,4.25)范围内的学生约有________人.
[错解] 由题图知,第五小组的频率为0.5,所以第一小组的频率为0.5×=,
所以全市6万名高一学生中视力在[3.95,4.25)范围内的学生约为60 000×=25 000(人).
[错因分析] 对频率分布直方图理解不正确,纵轴上的0.5并不是第五组的频率,而是.在频率分布直方图中,小长方形的高=,频率=×组距.例如,本题中,0.5×0.3=0.15才是第五小组的频率.
[正解] 由题图知,第五小组的频率为0.5×0.3=0.15,所以第一小组的频率为0.15×=0.125,所以全市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60 000×0.125=7 500(人).
[答案] 7 500