所属成套资源:新高考数学二轮复习考点突破学案 (2份打包,原卷版+教师版)
新高考数学二轮复习考点突破学案5.3《统计与成对数据的分析》(2份打包,原卷版+教师版)
展开这是一份新高考数学二轮复习考点突破学案5.3《统计与成对数据的分析》(2份打包,原卷版+教师版),文件包含新高考数学二轮复习考点突破学案53《统计与成对数据的分析》原卷版doc、新高考数学二轮复习考点突破学案53《统计与成对数据的分析》原卷版pdf、新高考数学二轮复习考点突破学案53《统计与成对数据的分析》教师版doc、新高考数学二轮复习考点突破学案53《统计与成对数据的分析》教师版pdf等4份试卷配套教学资源,其中试卷共54页, 欢迎下载使用。
考点一 统计图表
核心提炼
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示eq \f(频率,组距),频率=组距×eq \f(频率,组距).
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例1 (1)(多选)某中学举行党史知识竞赛,对全校参赛的1 000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )
A.图中的x值为0.020
B.这组数据的极差为50
C.得分在80分及以上的人数为400
D.这组数据的平均数的估计值为77
答案为:ACD
解析:由(0.005+x+0.035+0.030+0.010)×10=1,解得x=0.020,故选项A正确;
频率分布直方图无法看出这组数据的最大值和最小值,故选项B不正确;
得分在80分及以上的人数的频率为(0.030+0.010)×10=0.4,
故人数为1 000×0.4=400,故选项C正确;
这组数据的平均数的估计值为55×0.05+65×0.2+75×0.35+85×0.3+95×0.1=77.
故选项D正确.
(2)(多选)2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方计划建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如图所示,
经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区( )
A.2030年煤的消费量相对2020年减少了
B.2030年天然气的消费量是2020年的5倍
C.2030年石油的消费量相对2020年不变
D.2030年水、核、风能的消费量是2020年的7.5倍
答案为:BD
解析:设2020年该地区一次能源消费总量为a,则2020年煤的消费量为0.6a,
规划2030年煤的消费量为a×2.5×0.3=0.75a>0.6a,故A错误;
2020年天然气的消费量为0.1a,规划2030年天然气的消费量为a×2.5×0.2=0.5a=5×0.1a,故B正确;
2020年石油的消费量为0.2a,规划2030年石油的消费量为a×2.5×0.2=0.5a>0.2a,故C错误;
2020年水、核、风能的消费量为0.1a,规划2030年水、核、风能的消费量为a×2.5×0.3=0.75a=7.5×0.1a,故D正确.
易错提醒 (1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)频率分布直方图中纵坐标不要误以为是频率.
跟踪演练1 (1)(多选)某市共青团委统计了甲、乙两名同学近十期“青年大学习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是( )
A.甲得分的30%分位数是31
B.乙得分的众数是48
C.甲得分的中位数小于乙得分的中位数
D.甲得分的极差等于乙得分的极差
答案为:BCD
解析:对于A,甲得分从小到大排列为27,28,31,39,42,45,55,55,58,66,而10×30%=3,
所以甲得分的30%分位数是35,A不正确;
对于B,乙的得分中有两个48,其余分数值均只有一个,因此,乙得分的众数是48,B正确;
对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确;
对于D,甲得分的极差、乙得分的极差都是39,
D正确.
(2)(多选)2021年1月11日,国家统计局发布2020年全国居民消费价格指数(CPI)相关数据,指出2020年较好地实现了“居民消费价格涨幅3.5%左右”的物价调控目标.2020年全国居民消费价格涨跌幅如折线图所示,则( )
A.从环比看,CPI由2020年11月份的环比下降0.6%在12月份转为环比上涨0.7%
B.2020年1月份CPI同比增长最多
C.2020年CPI环比上涨的月份数比下跌的月份数多
D.2020年全年CPI同比平均比2019年上涨约2.5%
答案为:ABD
解析:由图中环比折线图可以看出,2020年11月份的环比为﹣0.6%,12月份的环比为+0.7%,
所以CPI由2020年11月份的环比下降0.6%在12月份转为环比上涨0.7%,故选项A正确;
由同比折线图可以看出,2020年1月份的CPI同比增长5.4%,全年最高,故选项B正确;
从环比折线图可以看出,2020年CPI环比上涨的月份数为6,环比下跌的月份数也为6,
故选项C错误;
由同比折线图可知,2020年全年CPI同比平均比2019年上涨eq \f(1,12)×(5.4%+5.2%+4.3%+3.3%+2.4%+2.5%+2.7%+2.4%+1.7%+0.5%﹣0.5%+0.2%)≈2.5%,选项D正确.
考点二 回归分析
核心提炼
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出eq \x\t(x),eq \x\t(y),eq \(a,\s\up6(^)),eq \(b,\s\up6(^)).
(3)写出经验回归方程.
例2 为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为2022年7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2022年7月10日至7月14日时段中的相关数据,这5天的第x天到该电商平台专营店购物的人数y(单位:万人)的数据如下表:
(1)依据表中的统计数据,请判断该电商平台直播的第x天与到该电商平台专营店购物的人数y(单位:万人)是否具有较高的线性相关程度?(注:若0.3<|r|<0.75,则线性相关程度一般,若|r|>0.75,则线性相关程度较高,计算r时精确度为0.01)
(2)求购买人数y与直播的第x天的经验回归方程;用样本估计总体,请预测从2022年7月10日起的第38天到该专营店购物的人数(单位:万人).
附:eq \i\su(i=1,5, )(yi﹣eq \x\t(y))2=434,eq \i\su(i=1,5, )(xi﹣eq \x\t(x))(yi﹣eq \x\t(y))=64,eq \r(4 340)≈65.879.
样本相关系数r=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2\i\su(i=1,n, )yi-\x\t(y)2)),经验回归方程的斜率eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),截距eq \(a,\s\up6(^))=eq \x\t(y)﹣eq \(b,\s\up6(^))eq \x\t(x).
解 (1)由表中数据可得eq \x\t(x)=3,eq \x\t(y)=90,所以eq \i\su(i=1,5, )(xi﹣eq \x\t(x))2=10,
又eq \i\su(i=1,5, )(yi﹣eq \x\t(y))2=434,eq \i\su(i=1,5, )(xi﹣eq \x\t(x))(yi﹣eq \x\t(y))=64,所以r=eq \f(\i\su(i=1,5, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,5, )xi-\x\t(x)2\i\su(i=1,5, )yi-\x\t(y)2))=eq \f(64,\r(4 340))≈0.97>0.75,
所以该电商平台直播的第x天与到该电商平台专营店购物的人数y具有较高的线性相关程度.
(2)由(1)知可用一元线性回归模型拟合购买人数y与直播的第x天之间的关系.
eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,5, )xi-\x\t(x)2)=eq \f(64,10)=6.4,则eq \(a,\s\up6(^))=eq \x\t(y)﹣eq \(b,\s\up6(^))eq \x\t(x)=90﹣6.4×3=70.8,所以eq \(y,\s\up6(^))=6.4x+70.8,
令x=38,可得eq \(y,\s\up6(^))=6.4×38+70.8=314(万人).
预测从2022年7月10日起的第38天到该专营店购物的人数为314万人.
易错提醒
(1)样本点不一定在经验回归直线上,但点(eq \x\t(x),eq \x\t(y))一定在经验回归直线上.
(2)求eq \(b,\s\up6(^))时,灵活选择公式,注意公式的推导和记忆.
(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小.
(4)区分样本相关系数r与决定系数R2.
(5)通过经验回归方程求的都是估计值,而不是真实值.
跟踪演练2 (1)(多选)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是( )
A.样本相关系数r变大
B.残差平方和变大
C.决定系数R2变小
D.解释变量x与响应变量y的相关性变强
答案为:AD
解析:由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,
所以样本相关系数r的值变大,决定系数R2的值变大,残差平方和变小.
(2)(多选)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如下表所示:
根据表中的数据可得经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+14.4,则下列正确的是( )
A.样本相关系数r>0
B.eq \(b,\s\up6(^))=﹣0.32
C.若该产品价格为35元/kg,则日需求量大约为3.2 kg
D.第四个样本点对应的残差为﹣0.4
答案为:BCD
解析:对A,B,由表中的数据可知,
eq \x\t(x)=eq \f(10+15+20+25+30,5)=20,eq \x\t(y)=eq \f(11+10+8+6+5,5)=8,
将eq \x\t(x),eq \x\t(y)代入eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+14.4,得eq \(b,\s\up6(^))=﹣0.32,所以A选项错误,B选项正确;
对C,将x=35代入eq \(y,\s\up6(^))=﹣0.32x+14.4得eq \(y,\s\up6(^))=3.2,所以日需求量大约为3.2 kg,
所以C选项正确;对D,第四个样本点对应的残差为y4﹣eq \(y,\s\up6(^))4=6﹣(﹣0.32×25+14.4)=﹣0.4,所以D选项正确.
考点三 独立性检验
核心提炼
独立性检验的一般步骤
(1)根据样本数据列2×2列联表.
(2)根据公式χ2=eq \f(nad-bc2,a+bc+da+cb+d),计算χ2的值.
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
例3 为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模式.某校对高一新生是否适应寄宿生活做调查,从高一新生中随机抽取了100人,其中男生占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%.学校为了考查学生对寄宿生活适应与否是否与性别有关,构建了如下2×2列联表:
(1)请将2×2列联表补充完整,并依据小概率值α=0.010的独立性检验,是否可以推断适应寄宿生活与否与性别有关;
(2)从男生中以“是否适应寄宿生活”为标准采用分层随机抽样的方法抽取10人,再从这10人中随机抽取2人,若所选2名学生中的“不适应寄宿生活”人数为X,求随机变量X的分布列及均值.
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
解 (1)补充列联表如下:
零假设为H0:适应寄宿生活与否与性别无关.
根据列联表中的数据得,χ2=eq \f(100×8×28-32×322,40×60×40×60)≈11.111>6.635=x0.010,
根据小概率值α=0.010的独立性检验,推断H0不成立,可以推断适应寄宿生活与否与性别有关联.
(2)由题意知,抽取的10人中,有2人不适应寄宿生活,有8人适应寄宿生活,
故随机变量X的取值可以是0,1,2,
P(X=0)=eq \f(C\\al(2,8),C\\al(2,10))=eq \f(28,45),P(X=1)=eq \f(C\\al(1,8)C\\al(1,2),C\\al(2,10))=eq \f(16,45),P(X=2)=eq \f(C\\al(2,2),C\\al(2,10))=eq \f(1,45),
随机变量X的分布列为
因此,E(X)=0×eq \f(28,45)+1×eq \f(16,45)+2×eq \f(1,45)=eq \f(2,5).
易错提醒
(1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
跟踪演练3 《2021新锐品牌数字化运营白皮书》中,我国提出了新锐品牌的概念,全称是国货新锐品牌.对这个名称进行拆解:国货、新、锐.新有两个层面,一是针对企业本身,指2011年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需求),形成了细分化的品类.锐:是在短期内实现大大高于传统品牌的爆发式增长,并且占据了一定的消费者心智.如图是11月份中国某信息网发布的我国A市2021年上半年新锐品牌人群用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以及商品详情页的人群)性别分析数据.A市从购买家电类新锐品牌人群中随机调查了100位男性顾客和100位女性顾客,统计出每位顾客购买家电消费金额,根据这些数据得到如图所示的频数分布表:
(1)若以我国A市2021年上半年新锐品牌人群用户性别分析数据作为A市抽取新锐品牌人群性别概率,从A市新锐品牌人群中随机抽取四人,X为四人中男性的人数,求X的概率分布列和均值;
(2)根据A市统计购买家电消费金额数据频数分布表,完成下列2×2列联表,并依据小概率值α=0.010的独立性检验,分析购买家电类新锐品牌人群消费金额千元以上是否与性别有关?
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.
解 (1)若以我国A市2021年上半年新锐品牌人群用户性别比例数据作为A市抽取新锐品牌人群性别概率,则A市新锐品牌人群中随机抽取一人为男性的概率为75%,为女性的概率为25%,且X服从二项分布,X的所有可能取值为0,1,2,3,4,
P(X=0)=Ceq \\al(0,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))4=eq \f(1,256),P(X=1)=Ceq \\al(1,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))1×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))3=eq \f(3,64),P(X=2)=Ceq \\al(2,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))2×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))2=eq \f(27,128),
P(X=3)=Ceq \\al(3,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))3×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))1=eq \f(27,64),P(X=4)=Ceq \\al(4,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))4=eq \f(81,256),得X分布列为
E(X)=4×eq \f(3,4)=3.
(2)根据所给数据,可得2×2列联表:
零假设为H0:购买家电类新锐品牌人群消费金额千元以上与性别无关.
根据列联表得χ2=eq \f(200×80×40-20×602,100×100×140×60)≈9.524>6.635=x0.010,
根据小概率值α=0.010的独立性检验,推断H0不成立,即认为购买家电类新锐品牌人群消费金额千元以上与性别有关.
专题强化练
一、单项选择题
1.某公司2022年1月至7月空调销售完成情况如图,如7月份销售量是190台,若月份为x,销售量为y,由统计数据(xi,yi)(i=1,2,…,7)得到散点图,下面四个经验回归方程类型中最适合作为销售量y和月份x的经验回归方程类型的是( )
A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+bln x
答案为:B
解析:由散点图分布可知,散点图分布在一个二次函数的图象附近,因此,最适合作为销售量y和月份x的经验回归方程类型的是y=a+bx2.
2.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
答案为:B
解析:对于A,讲座前问卷答题的正确率的中位数是eq \f(70%+75%,2)=72.5%,所以A错误;
对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;
对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;
对于D,讲座前问卷答题的正确率的极差是95%﹣60%=35%,讲座后问卷答题的正确率的极差是100%﹣80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.
3.某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐四种树苗共计1 200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别为600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏的数量为( )
A.34 B.46 C.50 D.70
答案为:C
解析:由扇形统计图知,购买的1 200棵树苗中,侧柏的数量为1 200×25%=300,
依题意知,高一、高二、高三分到的侧柏的棵数比为600∶400∶200=3∶2∶1,所以高三年级应分得侧柏的数量为eq \f(1,3+2+1)×300=50.
4.从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型y=(其中e为自然对数的底数)拟合,设z=ln y,其变换后得到一组数据:
由上表可得经验回归方程z=0.2x+a,则当x=60时,蝗虫的产卵量y的估计值为( )
A.e6 B.10 C.6 D.e10
答案为:D
解析:由表格数据知,eq \x\t(x)=eq \f(1,5)×(20+23+25+27+30)=25,
eq \x\t(z)=eq \f(1,5)×(2+2.4+3+3+4.6)=3,∵(eq \x\t(x),eq \x\t(z))满足z=0.2x+a,
得a=3﹣0.2×25=﹣2,∴z=0.2x﹣2,即ln y=0.2x﹣2,∴y=e0.2x﹣2,
∴当x=60时,y=e10,故当x=60时,蝗虫的产卵量y的估计值为e10.
5.某车间从生产的一批产品中随机抽取了1 000个零件进行一项质量指标的检测,整理检测结果得此项质量指标的频率分布直方图如图所示,则下列结论错误的是( )
A.a=0.005
B.估计这批产品该项质量指标的众数为45
C.估计这批产品该项质量指标的中位数为60
D.从这批产品中随机选取1个零件,其质量指标在[50,70)的概率约为0.5
答案为:C
解析:(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,故A正确;
频率最大的一组为第二组,中间值为eq \f(40+50,2)=45,所以众数为45,故B正确;
质量指标大于等于60的有两组,频率之和为(0.020+0.010)×10=0.3<0.5,
所以60不是中位数,故C错误;
由于质量指标在[50,70)之间的频率之和为(0.03+0.02)×10=0.5,
可以近似认为从这批产品中随机选取1个零件,其质量指标在[50,70)的概率约为0.5,故D正确.
6.为庆祝中国共产主义青年团成立100周年,某校甲、乙两个班共70人(甲班40人,乙班30人)参加了共产主义青年团知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为( )
A.74 B.128 C.138 D.136
答案为:C
解析:记甲班成绩的平均数为eq \x\t(x),方差为seq \\al(2,x),乙班成绩的平均数为eq \x\t(y),方差为seq \\al(2,y),
甲、乙两班全部同学成绩的平均数为eq \x\t(z),方差为s2.
则eq \x\t(x)=77,seq \\al(2,x)=123,eq \x\t(y)=70,seq \\al(2,y)=130,eq \x\t(z)=eq \f(40,40+30)×77+eq \f(30,40+30)×70=74,
s2=eq \f(1,70){40[seq \\al(2,x)+(eq \x\t(x)﹣eq \x\t(z))2]+30[seq \\al(2,y)+(eq \x\t(y)﹣eq \x\t(z))2]}
=eq \f(1,70)×{40×[123+(77﹣74)2]+30×[130+(70﹣74)2]}=138.
二、多项选择题
7.据新华社报道,“十三五”以来,中国建成了全球规模最大的信息通信网络,光纤宽带用户占比从2015年底的56%提升至94%,行政村通光纤和4G的比例均超过了99%;中国移动网络速率在全球139个国家和地区中排名第4位;在5G网络方面,中国已初步建成全球最大规模的5G移动网络.如图是某科研机构对我国2023﹣2029年5G用户规模和年增长率发展的预测图,则下列结论正确的是( )
2023﹣2029年中国5G用户规模和年增长率发展预测图
A.2023﹣2029年,我国5G用户规模逐年增加
B.2023﹣2028年,我国5G用户规模后3年的方差小于前3年的方差
C.2023﹣2026年,我国5G用户规模的年增长率逐年下降
D.2023﹣2029年,我国5G用户规模年增长最多的是2025年
答案为:ABC
解析:由题图可知,2023﹣2029年,我国5G用户规模逐年增加,故A正确;
2023﹣2028年,我国5G用户规模前3年比后3年的分散,方差比后3年的大,故B正确;
2023﹣2026年,我国5G用户规模的年增长率逐年下降,故C正确;
2023﹣2029年,我国5G用户规模年增长最多的是2024年,增加了35 978.6万人,而2025年我国5G用户规模增加了27 317.4万人,所以D错误.
8.某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”的号召,建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如下表:
根据上表,可得y关于x的经验回归方程为eq \(y,\s\up6(^))=0.24x+eq \(a,\s\up6(^)),下列结论正确的有( )
A.eq \(a,\s\up6(^))=4.68
B.借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7
C.y与x的样本相关系数r>0
D.2023年的借阅量一定不少于6.12万册
答案为:ABC
解析:对于A,因为eq \x\t(x)=eq \f(1,5)×(1+2+3+4+5)=3,eq \x\t(y)=eq \f(1,5)×(4.9+5.1+5.5+5.7+5.8)=5.4,
所以5.4=0.24×3+eq \(a,\s\up6(^)),得eq \(a,\s\up6(^))=4.68,所以A正确;
对于B,因为5×75%=3.75,所以借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7,所以B正确;
对于C,因为0.24>0,所以y与x的样本相关系数r>0,所以C正确;
对于D,由选项A可知经验回归方程为eq \(y,\s\up6(^))=0.24x+4.68,
当x=6时,eq \(y,\s\up6(^))=0.24×6+4.68=6.12,所以2023年的借阅量约为6.12万册,而且这只是预测值,不能确定2023年的借阅量一定是多少,所以D错误.
9.为了解高中生选科时是否选物理与数学成绩之间的关系,某教研机构随机抽取了50名高中生,通过问卷调查,得到以下数据:
由以上数据,计算得到χ2=eq \f(50×13×20-10×72,23×27×20×30)≈4.844,根据临界值表,以下说法正确的是( )
参考数据:
A.依据小概率值α=0.05的独立性检验认为是否选择物理与数学成绩有关
B.在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩无关
C.95%的数学成绩优异的同学选择物理
D.若表格中的所有数据都扩大为原来的10倍,在相同条件下,结论不会发生变化
答案为:AB
解析:因为4.844>3.841=x0.05,所以依据小概率值α=0.05的独立性检验认为是否选择物理与数学成绩有关;因为4.844<6.635=x0.01,所以在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩无关;若表中的数据都扩大为原来的10倍,
χ2=eq \f(500×130×200-100×702,230×270×200×300)≈48.44,又48.44>10.828,故结论发生变化.
10.一组数据x1,x2,…,x10是公差为﹣1的等差数列,若去掉首末两项x1,x10后,则( )
A.平均数变大 B.中位数没变 C.方差变小 D.极差没变
答案为:BC
解析:由题意可知,对于选项A,原数据的平均数为eq \x\t(x)=eq \f(1,10)(x1+x2+…+x10)=eq \f(1,10)×5(x5+x6)=eq \f(1,2)(x5+x6),去掉x1,x10后的平均数为eq \x\t(x)′=eq \f(1,8)(x2+x3+…+x9)=eq \f(1,8)×4(x5+x6)=eq \f(1,2)(x5+x6)=eq \x\t(x).即平均数不变,故选项A错误;
对于选项B,原数据的中位数为eq \f(1,2)(x5+x6),去掉x1,x10后的中位数仍为eq \f(1,2)(x5+x6),即中位数没变,故选项B正确;
对于选项C,设公差为d,则原数据的方差为
s2=eq \f(1,10)eq \b\lc\{\rc\ (\a\vs4\al\c1(\b\lc\[\rc\](\a\vs4\al\c1(x1-\f(1,2)x5+x6))2+\b\lc\[\rc\](\a\vs4\al\c1(x2-\f(1,2)x5+x6))2))eq \b\lc\ \rc\}(\a\vs4\al\c1(+…+\b\lc\[\rc\](\a\vs4\al\c1(x10-\f(1,2)x5+x6))2))
=eq \f(1,10)eq \b\lc\[\rc\ (\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(9,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(7,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(5,2)d))2+))eq \b\lc\ \rc\ (\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(3,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(3,2)d))2+))
eq \b\lc\ \rc\](\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(\f(5,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(7,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(9,2)d))2))=eq \f(33,4),
去掉x1,x10后的方差为
s′2=eq \f(1,8)eq \b\lc\{\rc\ (\a\vs4\al\c1(\b\lc\[\rc\](\a\vs4\al\c1(x2-\f(1,2)x5+x6))2+\b\lc\[\rc\](\a\vs4\al\c1(x3-\f(1,2)x5+x6))2))eq \b\lc\ \rc\}(\a\vs4\al\c1(+…+\b\lc\[\rc\](\a\vs4\al\c1(x9-\f(1,2)x5+x6))2))
=eq \f(1,8)eq \b\lc\[\rc\ (\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(7,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(5,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(3,2)d))2+))eq \b\lc\ \rc\](\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(3,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(5,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(7,2)d))2))=eq \f(21,4),
即方差变小,故选项C正确;
对于选项D,原数据的极差为x1﹣x10=﹣9d=9,
去掉x1,x10后的极差为x2﹣x9=﹣7d=7,即极差变小,故选项D错误.
三、填空题
11.某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据(x,y),如表所示.(残差=观测值﹣预测值)
根据表中数据,得出y关于x的经验回归方程为eq \(y,\s\up6(^))=0.7x+eq \(a,\s\up6(^)).据此计算出在样本(4,3)处的残差为﹣0.15,则表中m的值为________.
答案为:4.5
解析:因为样本(4,3)处的残差为﹣0.15,即y﹣eq \(y,\s\up6(^))=3﹣(0.7×4+eq \(a,\s\up6(^)))=﹣0.15,所以eq \(a,\s\up6(^))=0.35,
所以经验回归方程为eq \(y,\s\up6(^))=0.7x+0.35,因为eq \x\t(x)=eq \f(3+4+5+6,4)=4.5,
eq \x\t(y)=eq \f(2.5+3+4+m,4)=eq \f(9.5+m,4),又样本中心点(eq \x\t(x),eq \x\t(y))在经验回归直线上,
所以eq \f(9.5+m,4)=0.7×4.5+0.35,解得m=4.5.
12.某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成五组:第一组[13,14),第二组[14,15),…,第五组[17,18].如图是按上述分组方法得到的频率分布直方图,若成绩低于a即为优秀,如果优秀的人数为14,则a的估计值是________.
答案为:14.5
解析:优秀人数所占的频率为eq \f(14,100)=0.14,测试结果位于[13,14)的频率为0.06<0.14,
测试结果位于[13,15)的频率为0.06+0.16>0.14,所以a∈(14,15),
由题意可得0.06+(a﹣14)×0.16=0.14,解得a=14.5.
四、解答题
13.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本均值分别记为eq \x\t(x)和eq \x\t(y),样本方差分别记为seq \\al(2,1)和seq \\al(2,2).
(1)求eq \x\t(x),eq \x\t(y),seq \\al(2,1),seq \\al(2,2);
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果eq \x\t(y)﹣eq \x\t(x)≥2eq \r(\f(s\\al(2,1)+s\\al(2,2),10)),则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
解 (1)由表格中的数据易得eq \x\t(x)=eq \f(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3,10)+10.0=10.0,eq \x\t(y)=eq \f(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5,10)+10.0=10.3,
seq \\al(2,1)=eq \f(1,10)×[(9.7﹣10.0)2+2×(9.8﹣10.0)2+(9.9﹣10.0)2+2×(10.0﹣10.0)2+(10.1﹣10.0)2+2×(10.2﹣10.0)2+(10.3﹣10.0)2]=0.036,
seq \\al(2,2)=eq \f(1,10)×[(10.0﹣10.3)2+3×(10.1﹣10.3)2+(10.3﹣10.3)2+2×(10.4﹣10.3)2+2×(10.5﹣10.3)2+(10.6﹣10.3)2]=0.04.
(2)由(1)中数据可得eq \x\t(y)﹣eq \x\t(x)=10.3﹣10.0=0.3,而2eq \r(\f(s\\al(2,1)+s\\al(2,2),10))=eq \r(\f(2,5)s\\al(2,1)+s\\al(2,2))=eq \r(0.030 4),显然有eq \x\t(y)﹣eq \x\t(x)>2eq \r(\f(s\\al(2,1)+s\\al(2,2),10))成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.
日期
7月10日
7月11日
7月12日
7月13日
7月14日
第x天
1
2
3
4
5
人数y(单位:万人)
75
84
93
98
100
x
10
15
20
25
30
y
11
10
8
6
5
不适应寄宿生活
适应寄宿生活
合计
男生
女生
合计
α
0.025
0.010
0.001
xα
5.024
6.635
10.828
不适应寄宿生活
适应寄宿生活
合计
男生
8
32
40
女生
32
28
60
合计
40
60
100
X
0
1
2
P
eq \f(28,45)
eq \f(16,45)
eq \f(1,45)
消费金额(元)
[0,100]
(100,1 000]
(1 000,5 000]
(5 000,10 000]
(10 000,+∞)
女性顾客人数
50
30
10
6
4
男性顾客人数
20
40
24
10
6
不超千元
千元以上
合计
女性顾客
男性顾客
合计
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
X
0
1
2
3
4
P
eq \f(1,256)
eq \f(3,64)
eq \f(27,128)
eq \f(27,64)
eq \f(81,256)
不超千元
千元以上
合计
女性顾客
80
20
100
男性顾客
60
40
100
合计
140
60
200
x
20
23
25
27
30
z
2
2.4
3
3
4.6
年份
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
年借阅量y(万册)
4.9
5.1
5.5
5.7
5.8
选物理
不选物理
数学成绩优异
20
7
数学成绩一般
10
13
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
x
3
4
5
6
y
2.5
3
4
m
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
相关试卷
这是一份新高考数学二轮复习考点突破学案6.1《直线与圆》(2份打包,原卷版+教师版),文件包含新高考数学二轮复习考点突破学案61《直线与圆》原卷版doc、新高考数学二轮复习考点突破学案61《直线与圆》原卷版pdf、新高考数学二轮复习考点突破学案61《直线与圆》教师版doc、新高考数学二轮复习考点突破学案61《直线与圆》教师版pdf等4份试卷配套教学资源,其中试卷共43页, 欢迎下载使用。
这是一份新高考数学二轮复习考点突破学案1.6《函数与导数》培优点(2份打包,原卷版+教师版),文件包含新高考数学二轮复习考点突破学案16《函数与导数》培优点原卷版doc、新高考数学二轮复习考点突破学案16《函数与导数》培优点原卷版pdf、新高考数学二轮复习考点突破学案16《函数与导数》培优点教师版doc、新高考数学二轮复习考点突破学案16《函数与导数》培优点教师版pdf等4份试卷配套教学资源,其中试卷共67页, 欢迎下载使用。
这是一份新高考数学二轮复习考点突破学案1.5《导数的综合应用》(2份打包,原卷版+教师版),文件包含新高考数学二轮复习考点突破学案15《导数的综合应用》原卷版doc、新高考数学二轮复习考点突破学案15《导数的综合应用》原卷版pdf、新高考数学二轮复习考点突破学案15《导数的综合应用》教师版doc、新高考数学二轮复习考点突破学案15《导数的综合应用》教师版pdf等4份试卷配套教学资源,其中试卷共55页, 欢迎下载使用。