《新高考数学大二轮复习课件》专题五 第3讲 统计与统计案例
展开
这是一份《新高考数学大二轮复习课件》专题五 第3讲 统计与统计案例,共60页。PPT课件主要包含了内容索引,考点一统计图表,考点二回归分析,考点三独立性检验,专题强化练等内容,欢迎下载使用。
KAO QING FEN XI
高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、线性回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.
2.在频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例1 (1)(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是A.该地农户家庭年收入低于4.5万元 的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
解析 对于A,根据频率分布直方图可知,家庭年收入低于4.5万元的农户比率约为(0.02+0.04)×1×100%=6%,故A正确;
对于B,根据频率分布直方图可知,家庭年收入不低于10.5万元的农户比率约为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;
对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;
对于D,根据频率分布直方图可知,家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.
(2)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下扇形统计图:
则下面结论中不正确的是A.新农村建设后,种植收入略有增加B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入不变D.新农村建设后,种植收入在经济收入中所 占比重大幅下降
解析 因为该地区经过一年的新农村建设,农村的经济收入增加了一倍,不妨设建设前的经济收入为m,则建设后的经济收入为2m,A选项,从扇形统计图中可以看到,新农村建设后,种植收入比建设前增加2m×37%-m×60%=m×14%,故A正确;B选项,新农村建设后,其他收入比建设前增加2m×5%-m×4%=m×6%>m×4%,即增加了一倍以上,故B正确;
C选项,养殖收入的比重在新农村建设前与建设后相同,但建设后总收入为之前的2倍,所以建设后的养殖收入也是建设前的2倍,故C错误;D选项,新农村建设后,种植收入在经济收入中所占比重由建设前的60%降为37%,故D正确.
(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为是频率.
跟踪演练1 (1)构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向.某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1),(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好).下列说法正确的是A.高三(2)班五项评价得分的极差为1.5
B.除体育外,高三(1)班的各项评价得分均高于高 三(2)班对应的得分C.高三(1)班五项评价得分的平均数比高三(2)班 五项评价得分的平均数要高D.各项评价得分中,这两班的体育得分相差最大
解析 对于A,高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5,所以极差为9.5-8.5=1,A错误;对于B,两班的德育分相等,B错误;
对于D,两班的体育分相差9.5-9=0.5,而两班的劳育得分相差9.25-8.5=0.75, D错误.
(2)(多选)(2021·绵阳模拟)在统计学中,同比增长率一般是指和去年同期相比较的增长率,环比增长率一般是指和上一时期相比较的增长率.根据下图,2020年居民消费价格月度涨跌幅度统计折线图,下列说法正确的是A.2020年全国居民每月消费价格 与2019年同期相比有涨有跌B.2020年1月至2020年12月全国居 民消费价格环比有涨有跌C.2020年1月全国居民消费价格同 比涨幅最大D.2020年我国居民消费价格中3月消费价格最低
解析 对于A,观察图中同比曲线,除11月份同比为-0.5,其余均是正值,所以2020年全国居民每月消费价格与2019年同期相比有涨有跌,A正确;对于B,观察图中环比曲线,有
正有负,如2月份0.8,3月份-1.2,环比有涨有跌,B正确;对于C,观察图中同比曲线,1月份同比增加5.4,大于其他月份同比值,故2020年1月全国居民消费价格同比涨幅最大,C正确;对于D,观察图中环比曲线,3月份环比值-1.2,4月份-0.9,易知4月份消费价格比3月份低,故D错误.
求线性回归方程的步骤(1)依据样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(4)写出线性回归方程.
例2 某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:
(1)请用相关系数说明销售量y与月份代码t有很强的线性相关关系;
解 由统计表中的数据和参考数据得
因为0.99>0.75,所以销售量y与月份代码t有很强的线性相关关系.
(2)求y关于t的线性回归方程(系数精确到0.01);
由14.3720.5,解得x≥13,预计上市13个月时,即最早在2022年8月,市场占有率能超过0.5%.
独立性检验的一般步骤(1)根据样本数据列2×2列联表;
(3)查表比较K2与临界值的大小关系,作统计判断.K2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
例3 (2020·新高考全国Ⅰ改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
解 由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+6+18+8=64,
(2)根据所给数据,完成下面的2×2列联表:
解 由所给数据,可得2×2列联表:
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
解 根据2×2列联表中的数据可得
≈7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
(1)K2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.(2)在犯错误的概率不超过0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
跟踪演练3 (2021·德州模拟)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如表所示:表一
(1)请根据所提供的数据,完成上面的2×2列联表(表二),判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系;
解 2×2列联表如下:
所以有99%的把握认为对“云课堂”倡议的了解情况与性别有关.
(2)用样本估计总体,将频率视为概率,在男性市民和女性市民中各随机抽取4人,记“4名男性中恰有3人了解云课堂倡议”的概率为P1,“4名女性中恰有3人了解云课堂倡议”的概率为P2.试求出P1与P2,并比较P1与P2的大小.附:临界值参考表及参考公式:
解 用样本估计总体,将频率视为概率,根据2×2列联表得出,
1.若干年前,某老师刚退休的月退休金为4 000元,月退休金各种用途占比统计图如右面的条形图.该老师退休后加强了体育锻炼,目前月退休金的各种用途占比统计图如右面的折线图.已知目前的月就医费比刚退休时少100元,则目前该老师的月退休金为A.5 000元 B.5 500元C.6 000元 D.6 500元
解析 刚退休时就医费用为4 000×15%=600(元),现在的就医费用为600-100=500(元),占退休金的10%,
2.(2021·郑州模拟)某种产品的广告费支出x与销售额y(单位:万元)之间有如表所示的关系,y与x的线性回归方程为 =6.5x+17.5,当广告支出5万元时,随机误差的残差为
A.10 B.20 C.30 D.40
由表格知当广告支出5万元时,销售额为60万元,
所以随机误差的残差为60-50=10.
3.空气质量指数AQI是反映空气质量状况的指数,其对应关系如下表:
为监测某化工厂排放废气对周边空气质量指数的影响,某科学兴趣小组在校内测得10月1日~20日AQI指数的数据并绘成折线图如下:
下列叙述正确的是A.这20天中AQI指数值的中位数略大于150B.这20天中的空气质量为优的天数占C.10月6日到10月11日,空气质量越来越好D.总体来说,10月中旬的空气质量比上旬的空气质量好
解析 由折线图知,AQI指数值在100以上的有10个,在100以下的有10个,中位数是100两边两个数的均值,观察比100大的数离100远点,因此两者平均值大于100但小于150,A错误;
10月6日到10月11日,空气质量越来越差,C错误;10月上旬的空气质量AQI指数值在100以下的多,
中旬的空气质量AQI指数值在100以上的多,上旬的空气质量比中旬的空气质量好,D错误.
4.某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成五组:第一组[13,14),第二组[14,15),……,第五组[17,18].如图是按上述分组方法得到的频率分布直方图,若成绩低于a即为优秀,如果优秀的人数为14,则a的估计值是A.14 B.14.5 C.15 D.15.5
测试结果位于[13,14)的频率为0.060.14,所以a∈(14,15),由题意可得0.06+(a-14)×0.16=0.14,解得a=14.5.
5.我国引领的5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应和波及效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图是某单位结合近年数据,对今后几年的5G经济产出所做的预测.结合图,下列说法不正确的是A.5G的发展带动今后几年的总经济产 出逐年增加B.设备制造商的经济产出前期增长较快, 后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势
解析 由条形图可得,5G的发展带动今后几年的总经济产出逐年增加,故A正确;设备制造商的经济产出前期增长较快,后期放缓,故B正确;
设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C不正确;2025年开始信息服务商与运营商的经济产出的差距有逐步拉大的趋势,故D正确.
A.12人 B.6人 C.10人 D.18人
若有95%的把握认为喜欢某视频APP和性别有关,
A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多
注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.
7.(2021·郑州模拟)调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论正确的是
所以占三成以上,故A正确;对于B,互联网行业中仅90后从事技术岗位的人数占总人数的56%×39.6%=22.176%>20%,所以超过总人数的20%,故B正确;对于C,互联网行业中90后从事运营岗位的人数占总人数的56%×17%=9.52%,而80前从事互联网行业的人数占总人数的3%,故互联网行业中从事运营岗位的人数90后比80前多,故C正确;
解析 对于A,互联网行业从业人员中仅90后从事技术和运营岗位的人数占总数的56%×(39.6%+17%)=31.696% > 30%,
对于D,由于80后中从事技术岗位的人数所占比例不确定,所以互联网行业中从业人员中90后与80后,从事技术岗位的人数无法比较,故D不正确.
8.2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年12月至2020年12月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2019年12月~2020年12月)
并得到以下一些统计量的值:
解析 对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相关关系,故A不正确;
所以可以预测2021年3月在售二手房均价约为1.050 9万元/平方米,故B正确;
对于D,R2越大,拟合效果越好,由0.9233.841,所以我们有95%的把握认为男、女生对该食堂服务的评价有差异,故③正确,④错误.
13.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
解 由表格中的数据易得
所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.
14.2020年,国庆“遇上”中秋,中国人把这个“超长黄金周”过出了年味.假期期间,全国各大旅游景点、车站、机场人头攒动的景象也吸引了世界的目光.外国媒体、专家和网友“实名羡慕”,这一派热闹景象证明了抗疫的成功,也展示了中国经济复苏的劲头.抗疫的成功离不开国家强大的医疗卫生体系,下表是某省2013年至2019年医疗卫生机构数y(单位:万个):
(2)规定若某年的实际医疗卫生机构数与估计值的差的绝对值不超过500个,则称该年是“吻合”年.利用(1)的结果,假设2020年该省医疗卫生机构数的估计值为实际值,现从2013年至2020年这8年中任选3年,其中“吻合”年的个数为X,求X的分布列与均值.
解 2013年至2019年这7年该省医疗卫生机构数的估计值与实际值(单位:万个)如下表所示:
则2013年至2020年这8年中“吻合”年有2013年,2015年,2018年,2020年,共4年, 故X的所有可能取值为 0,1,2,3,
相关课件
这是一份2023届高考数学二轮复习专题4第1讲统计与统计案例课件,共60页。PPT课件主要包含了专题四统计与概率,考情分析,真题热身,2列联表,感悟高考,考点一统计图表,典例1,考点二回归分析,典例2,考点三独立性检验等内容,欢迎下载使用。
这是一份《新高考数学大二轮复习课件》专题五 规范答题5 概率与统计,共9页。PPT课件主要包含了命题分析,步骤要点,规范解答,阅卷细则等内容,欢迎下载使用。
这是一份高考数学一轮复习第9章统计与统计案例第3节统计模型课件,共60页。