2024高考数学一轮复习讲义(步步高版)第九章 必刷大题18 统计与统计分析
展开必刷大题18 统计与统计分析
1.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩(满分100分),得到了样本的频率分布直方图(如图).
一般学校认为成绩大于等于80分的学生为优秀.
(1)根据频率分布直方图,估计3 000名学生在该次数学考试中成绩优秀的学生数;
(2)依据样本的频率分布直方图,估计总体成绩的众数和平均数.
解 (1)由样本的频率分布直方图可知,
在该次数学考试中成绩优秀的频率是(0.020+0.008)×10=0.28,
则3 000名学生在该次数学考试中成绩优秀的学生数为3 000×0.28=840.
(2)由样本的频率分布直方图可知,总体成绩的众数为=75,
平均数为
0.002×10×35+0.006×10×45+0.012×10×55+0.024×10×65+0.028×10×75+0.020×10×85+0.008×10×95=71.2.
所以总体成绩的众数为75,平均数为71.2.
2.为进一步增强疫情防控期间群众的防控意识,使广大群众充分了解疫情防护知识,提高预防能力,做到科学防护.某组织通过网络进行疫情防控科普知识问答.共有100人参加了这次问答,将他们的成绩(满分100分)分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]这六组,制成如图所示的频率分布直方图.
(1)求图中a的值,并估计这100人问答成绩的中位数和平均数;(同一组数据用该组数据的中点值代替)
(2)用比例分配的分层随机抽样方法从问答成绩在[60,80)内的人中抽取一个容量为5的样本,再从样本中任意抽取2人,求这2人的问答成绩均在[70,80)内的概率.
解 (1)由图可知,10×(2×0.005+a+0.02+0.025+0.03)=1,
解得a=0.015.
设中位数为x,
则0.05+0.15+0.2+0.03×(x-70)=0.5,
所以x=.
这100人问答成绩的平均数为
45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
(2)用比例分配的分层随机抽样方法从问答成绩在[60,80)内的人中抽取一个容量为5的样本,
则问答成绩在[60,70)内的有×5=2(人),分别记为A,B;
问答成绩在[70,80)内的有×5=3(人),分别记为a,b,c.
从中任意抽取2人,则试验的样本空间
Ω={(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c)},共有10个样本点.
设事件A为2人的问答成绩均在[70,80)内,
则A={(a,b),(a,c),(b,c)},共有3个样本点,
所以这2人的问答成绩均在[70,80)内的概率P(A)=.
3.为弘扬劳动精神,树立学生“劳动最美,劳动最光荣”的观念,某校持续开展“家庭劳动大比拼”活动.某班统计了本班同学1~7月份的人均月劳动时间(单位:小时),并建立了人均月劳动时间y关于月份x的经验回归方程=x+4,y与x的原始数据如表所示:
月份x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
人均月劳动时间y | 8 | 9 | m | 12 | n | 19 | 22 |
由于某些原因导致部分数据丢失,但已知iyi=452.
(1)求m,n的值;
(2)求该班6月份人均月劳动时间数据的残差值(残差即样本数据与预测值之差).
参考公式:在经验回归方程=x+中,= ,=-.
解 (1)由表知,=×(1+2+3+4+5+6+7)=4,=×(8+9+m+12+n+19+22)=,
所以-72=12+22+32+42+52+62+72-7×42=28,
所以==,
即m+n=43-7,①
因为经验回归直线恒过点(,),
所以=4+4,
即m+n=28-42,②
由①②,得=,m+n=26,③
因为iyi=8+18+3m+48+5n+114+154=452,
所以3m+5n=110,④
由③④,得m=10,n=16.
(2)由(1)知,经验回归方程为=x+4,
所以当x=6时,预测值=×6+4=,
此时残差为19-=.
4.为推动更多人去阅读和写作,联合国教科文组织确定每年的4月23日为“世界读书日”,其设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,这200人中通过电子阅读与纸质阅读的人数之比为3∶1.将这200人按年龄(单位:岁)分组,统计得到通过电子阅读的居民的频率分布直方图如图所示.
(1)求a的值及通过电子阅读的居民的平均年龄;
(2)把年龄在[15,45) 内的居民称为中青年,年龄在[45,65]内的居民称为中老年,若选出的200人中通过纸质阅读的中老年有30人,请完成下面2×2列联表,并依据小概率值α=0.025的独立性检验,分析阅读方式是否与年龄有关.
| 电子阅读 | 纸质阅读 | 合计 |
中青年 |
|
|
|
中老年 |
|
|
|
合计 |
|
|
|
附:χ2=,n=a+b+c+d.
α | 0.15 | 0.1 | 0.05 | 0.025 | 0.01 |
xα | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 |
解 (1)由频率分布直方图可得10×(0.01+0.015+a+0.03+0.01)=1,
解得a=0.035,
所以通过电子阅读的居民的平均年龄为
20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).
(2)这200人中通过电子阅读的人数为200×=150,
通过纸质阅读的人数为200-150=50.
因为(0.01+0.015+0.035)∶(0.03+0.01)=3∶2,
所以通过电子阅读的中青年的人数为150×=90,
中老年的人数为150-90=60.
2×2列联表为
| 电子阅读 | 纸质阅读 | 合计 |
中青年 | 90 | 20 | 110 |
中老年 | 60 | 30 | 90 |
合计 | 150 | 50 | 200 |
零假设为H0:阅读方式与年龄无关.
由表中数据,得χ2=≈6.061>5.024=x0.025,
所以依据小概率值α=0.025的独立性检验,推断H0不成立,即认为阅读方式与年龄有关.
5.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加.图1所示的条形图反映了某省某年1~7月份煤改气、煤改电的用户数量.
图1
图2
(1)在图2给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和样本相关系数说明y与t之间具有线性相关性;
(2)建立y关于t的经验回归方程(系数精确到0.01),预测该年11月份该省煤改气、煤改电的用户数量.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程=u+的斜率和截距的最小二乘估计公式分别为==,=-.
参考数据:i=9.24,iyi=39.75,≈0.53,≈2.646.
样本相关系数r=.
解 (1)作出散点图如图所示.
由条形图数据和参考数据得,
=4,(ti-)2=28,≈0.53,
(ti-)(yi-)=iyi-i=39.75-4×9.24=2.79,
所以r≈≈0.99.
y与t的样本相关系数近似为0.99,说明y与t的线性相关性相当高,
从而可以用线性回归模型拟合y与t的关系.
(2)由==1.32,
又由(1)得==≈0.10,
=-≈1.32-0.10×4=0.92,
所以y关于t的经验回归方程为=0.92+0.10t.
将t=11代入经验回归方程得=0.92+0.10×11=2.02.
所以预测该年11月份该省煤改气、煤改电的用户数量达到2.02万户.
6.在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长.已知某地区2015年年底到2022年年底新能源汽车保有量的数据统计表如下:
年份(年) | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
年份代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
保有量y/千辆 | 1.95 | 2.92 | 4.38 | 6.58 | 9.87 | 15.00 | 22.50 | 33.70 |
(1)根据统计表中的数据画出散点图(如图),请判断y=bx+a与y=ecx+d哪一个更适合作为y关于x的经验回归模型(给出判断即可,不必说明理由),并根据你的判断结果建立y关于x的经验回归方程;
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2022年年底该地区传统能源汽车保有量为500千辆,预计到2027年年底传统能源汽车保有量将下降10%.试估计到哪一年年底新能源汽车保有量将超过传统能源汽车保有量.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程=u+的斜率和截距的最小二乘估计公式分别为==,=-.
参考数据:=12.1,=2.1,=204,iyi=613.7,iti=92.4,其中ti=ln yi,lg 2≈0.30,lg 3≈0.48,lg e≈0.43.
解 (1)根据散点图显示的该地区新能源汽车保有量的增长趋势知,应选择的函数模型是y=ecx+d,因为t=ln y,则=x+,
因为=×(1+2+3+4+5+6+7+8)=4.5,=204,iti=92.4,=2.1,
所以====0.4,
=-=2.1-0.4×4.5=0.3,
所以=0.4x+0.3,
即=e0.4x+0.3.
(2)设传统能源汽车保有量每年下降的百分比为r,依题意得,500(1-r)5=500(1-10%),解得1-r=,
设从2022年底起经过x年后的传统能源汽车保有量为y千辆,
则有y=500(1-r)x=,
设从2022年底起经过x年后新能源汽车的保有量将超过传统能源汽车保有量,
则有e0.4(x+8)+0.3>,
所以(0.4x+3.5)lg e>3-lg 2+0.2x(2lg 3-1),
解得x>≈6.64,
故从2022年年底起经过7年后,即2029年年底新能源汽车的保有量将超过传统能源汽车保有量.
满分之路(备战2024高考)高考数学二轮复习之必刷大题18 统计与统计分析: 这是一份满分之路(备战2024高考)高考数学二轮复习之必刷大题18 统计与统计分析,共20页。
(新高考)高考数学一轮复习讲练测第9章必刷大题18统计与统计分析: 这是一份(新高考)高考数学一轮复习讲练测第9章必刷大题18统计与统计分析,共8页。
2024高考数学一轮复习讲义(步步高版)第十章 必刷大题20 概率与统计: 这是一份2024高考数学一轮复习讲义(步步高版)第十章 必刷大题20 概率与统计,共9页。