- 第9章统计9.3统计案例-公司员工的肥胖情况调查分析学案含解析 学案 21 次下载
- 第9章统计章末综合提升 课件 课件 31 次下载
- 第10章概率10.1.1有限样本空间与随机事件 课件 课件 30 次下载
- 第10章概率10.1.1有限样本空间与随机事件学案含解析 学案 22 次下载
- 第10章概率10.1.2事件的关系和运算 课件 课件 29 次下载
高中数学人教A版 (2019)必修 第二册第九章 统计本章综合与测试优质学案
展开第九章
类型1 抽样方法
1.高考对抽样方法考查的热点有二:一是两种抽样方法的判断问题,这就要求熟练地掌握两种抽样方法的特征;二是关于分层随机抽样的样本容量的计算问题,特别与其他的问题结合在一起的问题要引起重视.
2.应用各种抽样方法抽样时要注意以下问题:
(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;
(2)利用随机数法时注意编号位数要一致;
(3)在分层随机抽样中,若在某一层按比例应该抽取的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.
【例1】 (1)利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )
A. B. C. D.
(2)假设要检查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将500袋牛奶按000,001,…,499进行编号,使用随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号(从左向右读取数字),随后抽到的5袋牛奶的号码分别是(下面摘取了某随机数表第7行至第9行)____________________.
84421 75331 57245 50688 77047 44767 21763
35025 83921 20676 63016 47859 16955 56719
98105 07185 12867 35807 44395 23879 33211
(1)C (2)025,016,105,185,395 [(1)根据题意,=,解得n=28.
故在整个抽样过程中每个个体被抽到的概率为=.
(2)由已知读取号码的初始值为第7行第5组数中的后3位,第一个号码为047.
凡不在000~499中的数跳过去不取,前面已经取过的也跳过去不取,从而随后抽到的5袋牛奶的编号为025,016,105,185,395.]
1.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层随机抽样的方法从全体师生中抽取一个容量为n的样本,若女学生一共抽取了80人,则n的值为( )
A.193 B.192 C.191 D.190
B [1 000×=80,求得n=192.]
2.某品牌白酒公司在甲、乙、丙三个地区分别有30个、120个、180个代理商.公司为了调查白酒销售的情况,需从这330个代理商中抽取一个容量为11的样本,记这项调查为①;在甲地区有10个特大型超市代理销售该品牌的白酒,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①②这两项调查宜采用的抽样方法依次是__________________________.
分层随机抽样,简单随机抽样 [由于甲、乙、丙三个地区有明显差异,所以在完成①时,需用分层随机抽样.在甲地区有10个特大型超市代理销售该品牌的白酒,没有显著差异,所以完成②宜采用简单随机抽样.]
类型2 频率分布直方图及应用
1.频率分布直方图是高考的热点之一,难度比较小,考查根据频率分布直方图读取需要的数据,能够计算数字特征以及事件的概率,进而作出相应推断.
2.解题常见结论:(1)频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.频率分布直方图中各小长方形的面积之和为1.(2)=频率,此关系式变形为=样本量,样本量×频率=频数.
【例2】 某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:
[107,109),3株;[109,111), 9株;[111,113),13株;
[113,115),16株;[115,117),26株;[117,119),20株;
[119,121),7株;[121,123),4株;[123,125],2株.
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)据上述图表,估计数据在[109,121)范围内的可能性是百分之几?
[解]
分组 | 频数 | 频率 | 累积频率 |
[107,109) | 3 | 0.03 | 0.03 |
[109,111) | 9 | 0.09 | 0.12 |
[111,113) | 13 | 0.13 | 0.25 |
[113,115) | 16 | 0.16 | 0.41 |
[115,117) | 26 | 0.26 | 0.67 |
[117,119) | 20 | 0.20 | 0.87 |
[119,121) | 7 | 0.07 | 0.94 |
[121,123) | 4 | 0.04 | 0.98 |
[123,125] | 2 | 0.02 | 1.00 |
合计 | 100 | 1.00 |
|
(2)频率分布直方图如下:
(3)由上述图表可知数据落在[109,121)范围内的频率为:0.94-0.03=0.91,即数据落在[109,121)范围内的可能性是91%.
在本例中由得到的频率分布直方图估计树苗的高度(cm)的平均数.
[解] 由频率分布直方图可得树苗的高度(cm)的平均数的估计值为
0.03×108+0.09×110+0.13×112+0.16×114+0.26×116+0.20×118+0.07×120+0.04×122+0.02×124=115.46(cm)
3.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.
0.030 3 [∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030.
设身高在[120,130),[130,140),[140,150]三组的学生分别有x,y,z人,则=0.030×10,解得x=30.同理,y=20,z=10.故从[140,150]的学生中选取的人数为×18=3.]
类型3 数据的集中趋势和离散程度的估计
1.这类题目大多直接根据已知数字特征,如众数、中位数、平均数以及方差等的意义进行计算,考查学生对样本数字特征意义的理解,难度不大.
2.解答这类利用数字特征估计总体的问题时要认真审题,注意平均数、标准差、最大值、中位数的定义和意义的合理运用.
【例3】 (2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
[解] (1)由已知得0.70=a+0.20+0.15,故
a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
4.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )
分数 | 5 | 4 | 3 | 2 | 1 |
人数 | 20 | 10 | 30 | 30 | 10 |
A.3 B. C.3 D.
B [∵==3,
∴s2=[(x1-)2+(x2-)2+…+(xn-)2]
=(20×22+10×12+30×12+10×22)==⇒s=.]
5.甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲:82 81 79 78 95 88 93 84;
乙:92 95 80 75 83 80 90 85.
(1)求甲成绩的80%分位数;
(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.
[解] (1)把甲的成绩按照从小到大的顺序排列可得:
78 79 81 82 84 88 93 95
因为一共有8个数据,所以8×80%=6.4,不是整数,所以甲成绩的80%分位数是第7个数据93.
(2)甲=(78+79+81+82+84+88+93+95)=85,
乙=(75+80+80+83+85+90+92+95)=85.
s=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,
∵甲=乙,s<s,∴甲的成绩较稳定,派甲参赛比较合适.
1.(2020·全国卷Ⅲ)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
C [由方差计算公式:x1,x2,…,xn的方差为s2,所以s2=0.01,则ax1,ax2,…,axn的方差为a2s2,则所求为100s2=1.]
2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数 C.方差 D.极差
A [记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.]
3.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
A [设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a,养殖收入与第三产业收入的总和为0.36a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.]
4.(多选题)(2020·新高考全国卷Ⅱ)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )
A.这11天复工指数和复产指数均逐日增加
B.这11天期间,复产指数增量大于复工指数的增量
C.第3天至第11天复工复产指数均超过80%
D.第9天至第11天复产指数增量大于复工指数的增量
CD [由折线图知,第1天至第2天复工指数减少,第7天至第8天复工指数减少,第10天至第11天复工指数减少,第8天至第9天复产指数减少,故A错误;由折线图知,第1天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由折线图知,第3天至第11天复工复产指数均超过80%,故C正确;由折线图知,第9天至第11天复产指数增量大于复工指数的增量,故D正确.综上,选CD.]
5.(2020·全国卷Ⅲ)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且pi=1,则下面四种情形中,对应样本的标准差最大的一组是( )
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
B [对于A,当p1=p4=0.1,p2=p3=0.4时,随机变量X1的分布列为
X1 | 1 | 2 | 3 | 4 |
P | 0.1 | 0.4 | 0.4 | 0.1 |
E(X1)=1×0.1+2×0.4+3×0.4+4×0.1=2.5,D(X1)=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=1.52×0.1+0.52×0.4+0.52×0.4+1.52×0.1=0.65,所以=.
对于B,当p1=p4=0.4,p2=p3=0.1时,随机变量X2的分布列为
X2 | 1 | 2 | 3 | 4 |
P | 0.4 | 0.1 | 0.1 | 0.4 |
E(X2)=1×0.4+2×0.1+3×0.1+4×0.4=2.5,D(X2)=(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.52×0.4+0.52×0.1+0.52×0.1+1.52×0.4=1.85,所以=.
对于C,当p1=p4=0.2,p2=p3=0.3时,随机变量X3的分布列为
X3 | 1 | 2 | 3 | 4 |
P | 0.2 | 0.3 | 0.3 | 0.2 |
E(X3)=1×0.2+2×0.3+3×0.3+4×0.2=2.5,D(X3)=(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.52×0.2+0.52×0.3+0.52×0.3+1.52×0.2=1.05,所以=.
对于D,当p1=p4=0.3,p2=p3=0.2时,随机变量X4的分布列为
X4 | 1 | 2 | 3 | 4 |
P | 0.3 | 0.2 | 0.2 | 0.3 |
E(X4)=1×0.3+2×0.2+3×0.2+4×0.3=2.5,D(X4)=(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.52×0.3+0.52×0.2+0.52×0.2+1.52×0.3=1.45,所以=.所以B中的标准差最大.]
6.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组 | [-0.20,0) | [0,0.20) | [0.20,0.40) | [0.40,0.60) | [0.60,0.80) |
企业数 | 2 | 24 | 53 | 14 | 7 |
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
[解] (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni(yi-)2
=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.026 9,
s==0.02×≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
高中数学人教A版 (2019)必修 第二册第七章 复数本章综合与测试优秀学案: 这是一份高中数学人教A版 (2019)必修 第二册第七章 复数本章综合与测试优秀学案,共6页。
高中数学人教A版 (2019)必修 第二册第六章 平面向量及其应用本章综合与测试优秀导学案: 这是一份高中数学人教A版 (2019)必修 第二册第六章 平面向量及其应用本章综合与测试优秀导学案,共11页。
高中数学人教A版 (2019)必修 第二册第十章 概率本章综合与测试优秀学案: 这是一份高中数学人教A版 (2019)必修 第二册第十章 概率本章综合与测试优秀学案,共9页。