2022高考数学一轮复习 第九章 强化训练11 统计中的综合问题
展开1.为确保食品安全,某市质检部门检查了1 000袋方便面的质量,抽查总量的2%,在这个问题中,下列说法正确的是( )
A.总体是指这1 000袋方便面
B.个体是1袋方便面
C.样本是按2%抽取的20袋方便面
D.样本容量为20
答案 D
解析 总体是指这1 000袋方便面的质量,A中说法错误;个体是指1袋方便面的质量,B中说法错误;样本是指按照2%抽取的20袋方便面的质量,C中说法错误;样本容量为20,D中说法正确.
2.总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
50 44 66 44 21 66 06 58 05 62 61 65 54 35 02 42 35 48 96 32 14 52 41 52 48 22 66 22 15 86 26 63 75 41 99 58 42 36 72 24 58 37 52 18 51 03 37 18 39 11
A.23 B.21 C.35 D.32
答案 B
解析 随机数表第1行的第6列和第7列数字为6,4,所以从这两个数字开始,由左向右依次选取两个数字如下,64,42,16,60,65,80,56,26,16,55,43,50,24,23,54,89,63,21,45,…,其中落在编号01,02,…,39,40内的有16,26,24,23,21,…,故第5个编号为21.
3.设样本数据x1,x2,x3,…,x19,x20的平均数和方差分别为2和8,若yi=2xi+m(m为非零常数,i=1,2,3,…,19,20),则y1,y2,y3,…,y19,y20的平均数和标准差为( )
A.2+m,32 B.4+m,4eq \r(2)
C.2+m,4eq \r(2) D.4+m,32
答案 B
解析 设样本数据xi的平均数为eq \x\t(x),方差为s2,标准差为s,则新样本yi=2xi+m的平均数为2eq \x\t(x)+m,方差为22s2,标准差为2s,所以eq \x\t(y)=2eq \x\t(x)+m=4+m,s2=8,所以标准差为s=2eq \r(2),所以2s=2×2eq \r(2)=4eq \r(2).
4.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1 000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x(分钟),这个区间上的人数为y(人),易见两变量x,y线性相关,那么一定在其线性回归直线上的点为( )
A.(1.5,0.10) B.(2.5,0.25)
C.(2.5,250) D.(3,300)
答案 C
解析 由频率分布直方图可知,第一个区间中点坐标,x1=1.0,y1=0.10×1 000=100,第二个区间中点坐标,x2=2.0,y2=0.21×1 000=210,第三个区间中点坐标,x3=3.0,y3=0.30×1 000=300,第四个区间中点坐标,x4=4.0,y4=0.39×1 000=390,则eq \x\t(x)=eq \f(1,4)(x1+x2+x3+x4)=2.5,eq \x\t(y)=eq \f(1,4)(y1+y2+y3+y4)=250,则一定在其线性回归直线上的点为(eq \x\t(x),eq \x\t(y))=(2.5,250).
5.(多选)每年的台风都对泉州地区的渔业造成较大的经济损失.某保险公司为此开发了针对渔船的险种,并将投保的渔船分为Ⅰ,Ⅱ两类,两类渔船的比例如图所示.经统计,2019年Ⅰ,Ⅱ两类渔船的台风遭损率分别为15%和5%.2020年初,在修复遭损船只的基础上,对Ⅰ类渔船中的20%进一步改造.保险公司预估这些经过改造的渔船2020年的台风遭损率将降为3%,而其他渔船的台风遭损率不变.假设投保的渔船不变,则下列叙述中错误的是( )
A.2019年投保的渔船的台风遭损率为10%
B.2019年所有因台风遭损的投保的渔船中,Ⅰ类渔船所占的比例不超过80%
C.预估2020年Ⅰ类渔船的台风遭损率会小于Ⅱ类渔船的台风遭损率的两倍
D.预估2020年经过进一步改造的渔船因台风遭损的数量少于Ⅱ类渔船因台风遭损的数量
答案 ABC
解析 设全体投保的渔船为t艘.2019年投保的渔船的台风遭损率为60%·15%+40%·5%=11%,故A错;2019年所有因台风遭损的投保的渔船中,Ⅰ类渔船所占的比例为eq \f(60%·15%,60%·15%+40%·5%)=eq \f(9,11)>eq \f(8,10),故B错;预估2020年Ⅰ类渔船的台风遭损率为20%·3%+80%·15%=12.6%>2×5%,故C错;预估2020年经过进一步改造的渔船因台风遭损的数量t·60%·20%·3%少于Ⅱ类渔船因台风遭损的数量t·40%·5%,故D正确.
6.(多选)某产品的广告费用x与销售额y的统计数据如下表:
根据上表可得线性回归方程为eq \(y,\s\up6(^))=6.3x+eq \(a,\s\up6(^)),下列说法错误的是( )
A.回归直线eq \(y,\s\up6(^))=6.3x+eq \(a,\s\up6(^))必经过样本点(2,19),(6,44)
B.这组数据的样本点中心(eq \x\t(x),eq \x\t(y))未必在回归直线eq \(y,\s\up6(^))=6.3x+eq \(a,\s\up6(^))上
C.回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元
D.据此模型预报广告费用为7万元时销售额为50.9万元
答案 ABC
解析 回归直线eq \(y,\s\up6(^))=6.3x+eq \(a,\s\up6(^)),不一定经过任何一个样本点,故A错;由最小二乘法可知,这组数据的样本点中心(eq \x\t(x),eq \x\t(y))一定在回归直线eq \(y,\s\up6(^))=6.3x+eq \(a,\s\up6(^))上,故B错;回归系数6.3的含义是广告费用每增加1万元,预测销售额增加6.3万元,故C错;eq \x\t(x)=eq \f(1,5)(2+3+4+5+6)=4,eq \x\t(y)=eq \f(1,5)(19+25+34+38+44)=32,将(4,32)代入eq \(y,\s\up6(^))=6.3x+eq \(a,\s\up6(^))可得eq \(a,\s\up6(^))=6.8,则回归方程为eq \(y,\s\up6(^))=6.3x+6.8,当x=7时,eq \(y,\s\up6(^))=6.3×7+6.8=50.9,故D正确.
7.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
由表中数据,得到线性回归方程eq \(y,\s\up6(^))=-2x+eq \(a,\s\up6(^))(eq \(a,\s\up6(^))∈R),由此估计出山高为72(km)处的气温为________ ℃.
答案 -6
解析 由题意可得eq \x\t(x)=10,eq \x\t(y)=40,所以eq \(a,\s\up6(^))=eq \x\t(y)+2eq \x\t(x)=40+2×10=60,所以eq \(y,\s\up6(^))=-2x+60,当eq \(y,\s\up6(^))=72时,-2x+60=72,解得x=-6.
8.检测600个某产品的质量(单位:g),得到的频率分布直方图中,前三组的长方形的高度成等差数列,后三组所对应的长方形的高度成公比为0.5的等比数列,已知检测的质量在100.5~105.5之间的产品数为150,则质量在115.5~120.5的长方形高度为________.
答案 eq \f(1,60)
解析 由题意知,产品质量在100.5~105.5之间的频率为eq \f(150,600)=eq \f(1,4),则前3个矩形的面积和为eq \f(3,4),后两个矩形的面积和为eq \f(1,4).设中间矩形的面积为x,则后两个矩形的面积为eq \f(1,2)x,eq \f(1,4)x,则eq \f(1,2)x+eq \f(1,4)x=eq \f(1,4),所以x=eq \f(1,3),最后一个矩形的面积为eq \f(1,12),所以长方形的高度为eq \f(1,60).
9.已知一组数据10,5,4,2,2,2,x,且这组数据的平均数与众数的和是中位数的2倍,则x所有可能的取值为________.
答案 -11或3或17
解析 由题意可得这组数据的平均数为eq \f(10+5+4+2+2+2+x,7)=eq \f(25+x,7),
众数为2,若x≤2,可得eq \f(25+x,7)+2=4,可得x=-11;
若2≤x≤4,则中位数为x,可得2x=eq \f(25+x,7)+2,可得x=3;
若x≥4,则中位数为4,可得2×4=eq \f(25+x,7)+2,可得x=17.
10.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,40岁以上调查了50人,不高于40岁调查了50人,所得数据制成如下列联表:
已知工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为eq \f(3,5),则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.
参考公式与临界值表:K2=eq \f(nad-bc2,a+bc+da+cb+d).
答案 95%
解析 设“从所有人中任意抽取一个取到喜欢西班牙队的人”为事件A,
由已知得P(A)=eq \f(q+35,100)=eq \f(3,5),
所以p=25,q=25,a=40,b=60,
K2=eq \f(100×25×35-25×152,40×60×50×50)=eq \f(25,6)≈4.167>3.841,
故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.
11.成都是全国闻名的旅游城市,有许多很有特色的旅游景区.某景区为了提升服务品质,对过去100天每天的游客数进行了统计分析,发现这100天每天的游客数都没有超出八千人,统计结果见下面的频率分布直方图:
(1)估计该景区每天游客数的中位数和平均数;
(2)为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了5天,统计出这5天的游客数(千人)分别为0.8,3.7,5.1,5.6,6.8,已知这5天的最高气温(℃)依次为8,18,22,24,28.
(ⅰ)根据以上数据,求游客数y关于当天最高气温x的线性回归方程(系数保留一位小数);
(ⅱ)根据(ⅰ)中的回归方程,估计该景区这100天中最高气温在20~26 ℃内的天数(保留整数).
参考公式:由最小二乘法所得回归直线的方程是eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^));
其中,eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2)=eq \f(\i\su(i=1,n,x)iyi-n\x\t(x)\x\t(y),\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2) ,eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
参考数据:eq \i\su(i=1,5, )(xi-eq \x\t(x))(yi-eq \x\t(y))=70,eq \i\su(i=1,5, )(xi-eq \x\t(x))2=232.
解 (1)左边三个矩形的面积之和为0.32,左边四个矩形的面积之和大于0.5,故中位数在第四个矩形中,
所以中位数为3+eq \f(0.18,0.24)×1=3.75.
平均数为0.5×0.07+1.5×0.09+2.5×0.16+3.5×0.24+4.5×0.18+5.5×0.14+6.5×0.07+7.5×0.05=3.82,
所以,该景区这一百天中每天游客数的中位数约为3 750人,平均数约为3 820人.
(2)(ⅰ)eq \x\t(x)=20,eq \x\t(y)=4.4,eq \(b,\s\up6(^))=eq \f(70,232)≈0.3,eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=4.4-0.3×20=-1.6,
所以eq \(y,\s\up6(^))=0.3x-1.6.
(ⅱ)当最高气温在20~26 ℃内时,
当x=20时,eq \(y,\s\up6(^))=0.3×20-1.6=4.4;
当x=26时,eq \(y,\s\up6(^))=0.3×26-1.6=6.2.
根据eq \(y,\s\up6(^))=0.3x-1.6得游客数在4.4~6.2内,
直方图中这个范围内方块的面积为(5-4.4)×0.18+0.14+(6.2-6)×0.07=0.262,
天数为0.262×100≈26,
所以,这100天中最高气温在20~26 ℃内的天数约为26天.
12.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.各种传染疾病的潜伏期不同,数小时、数天、甚至数月不等.某市疾病预防控制中心统计了该市200名传染病患者的相关信息,得到如下表格:
(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.
(2)将200名患者的潜伏期超过6天的频率视为该市每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该市疾病预防控制中心随机调查了该地区30名患者,其中潜伏期超过6天的人数为X,求随机变量X的均值和方差.
附:
K2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
解 (1)由题意得列联表:
由上表可得K2=eq \f(20075×55-25×452,120×80×100×100)=18.75>6.635,
所以有99%的把握认为该传染病的潜伏期与患者年龄有关.
(2)由题意可知,一名患者潜伏期超过6天的概率为P=eq \f(80,200)=eq \f(2,5),
随机变量服从X~Beq \b\lc\(\rc\)(\a\vs4\al\c1(30,\f(2,5))),
所以E(X)=30×eq \f(2,5)=12.
D(X)=30×eq \f(2,5)×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,5)))=eq \f(36,5).
13.如图是2020年2月15日至3月2日武汉市新冠肺炎新增确诊病例的折线统计图.则下列说法不正确的是( )
A.武汉市新冠肺炎疫情防控取得了阶段性的成果,但防控要求不能降低
B.2020年2月19日武汉市新增新冠肺炎确诊病例大幅下降至三位数
C.2020年2月15日到3月2日武汉市新冠肺炎新增确诊病例最多的一天比最少的一天多1 549人
D.2020年2月19日至3月2日武汉市新增新冠肺炎确诊病例低于400人的有8天
答案 C
解析 由折线图数据分析得知ABD正确,1 690-111=1 579,故C不正确.
14.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
已知销售量y与售价x之间有较强的线性相关关系,其线性回归方程是eq \(y,\s\up6(^))=-3.2x+40,且m+n=20,则其中的m=________.
答案 10
解析 依题意得eq \x\t(x)=eq \f(40+m,5),eq \x\t(y)=eq \f(30+n,5),
代入线性回归方程得eq \f(30+n,5)=-3.2×eq \f(40+m,5)+40,①
根据题意知m+n=20,②
解①②组成的方程组得m=n=10.
15.已知一组数据丢失了其中一个,另外六个数据分别是10,8,8,11,16,8,若这组数据的平均数、中位数、众数依次成等差数列,则丢失数据的所有可能值的和为( )
A.12 B.20 C.25 D.27
答案 D
解析 设这个数字是x,则平均数为eq \f(61+x,7),众数是8,
若x≤8,则中位数为8,此时x=-5,
若8
所有可能值为-5,9,23,其和为27.
16.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得eq \i\su(i=1,20,x)i=80,eq \i\su(i=1,20,y)i=4 000,eq \i\su(i=1,20, )(xi-eq \x\t(x))2=80,eq \i\su(i=1,20, )(yi-eq \x\t(y))2=8 000,eq \i\su(i=1,20, )(xi-eq \x\t(x))(yi-eq \x\t(y))=700.
(1)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;
(2)求y关于x的线性回归方程;
(3)某科研机构研发了两款垃圾处理机器,其中甲款机器每台售价100万元,乙款机器每台售价80万元,下表是以往两款垃圾处理机器的使用年限统计表:
根据以往经验可知,某县城每年可获得政府支持的垃圾处理费用为50万元,若仅考虑购买机器的成本和每台机器的使用年限(使用年限均为整年),以频率估计概率,该县城选择购买一台哪款垃圾处理机器更划算?
参考公式:相关系数r=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2\i\su(i=1,n, )yi-\x\t(y)2)) ,对于一组具有线性相关关系的数据(xi,yi)(i=1,2,3,…,n),其回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距用最小二乘法估计计算公式分别为:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
解 (1)由题意知相关系数r=eq \f(\i\su(i=1,20, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,20, )xi-\x\t(x)2\i\su(i=1,20, )yi-\x\t(y)2))=eq \f(700,\r(80×8 000))=eq \f(7,8)=0.875,
因为y与x的相关系数接近1,
所以y与x之间具有较强的线性相关关系,可用线性回归模型进行拟合.
(2)由题意可得,eq \(b,\s\up6(^))=eq \f(\i\su(i=1,20, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,20, )xi-\x\t(x)2)=eq \f(700,80)=8.75,
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=eq \f(4 000,20)-8.75×eq \f(80,20)=200-8.75×4=165,
所以eq \(y,\s\up6(^))=8.75x+165.
(3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用X(单位:万元)的分布列为
E(X)=-50×0.1+0×0.4+50×0.3+100×0.2=30(万元).
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用Y(单位:万元)的分布列为
E(Y)=-30×0.3+20×0.4+70×0.2+120×0.1=25(万元).
因为E(X)>E(Y),所以该县城选择购买一台甲款垃圾处理机器更划算.广告费用x(万元)
2
3
4
5
6
销售额y(万元)
19
25
34
38
44
气温x(℃)
18
13
10
-1
山高y(km)
24
34
38
64
不喜欢西班牙队
喜欢西班牙队
总计
40岁以上
p
q
50
不高于40岁
15
35
50
总计
a
b
100
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
潜伏期(单位:天)
[0,2]
(2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,14]
人数
17
43
60
50
26
3
1
潜伏期≤6天
潜伏期>6天
总计
50岁以上(含50岁)
100
50岁以下
55
总计
200
P(K2≥k0)
0.05
0.025
0.010
k0
3.841
5.024
6.635
潜伏期≤6天
潜伏期>6天
总计
50岁以上(含50岁)
75
25
100
50岁以下
45
55
100
总计
120
80
200
售价x
8.5
9
m
11
11.5
销售量y
12
n
6
7
5
1年
2年
3年
4年
合计
甲款
5
20
15
10
50
乙款
15
20
10
5
50
X
-50
0
50
100
P
0.1
0.4
0.3
0.2
Y
-30
20
70
120
P
0.3
0.4
0.2
0.1
2023-2024年新高考数学一轮复习培优教案10.6《概率与统计的综合问题》 (2份打包,原卷版+教师版): 这是一份2023-2024年新高考数学一轮复习培优教案10.6《概率与统计的综合问题》 (2份打包,原卷版+教师版),文件包含2023-2024年新高考数学一轮复习培优教案106《概率与统计的综合问题》教师版doc、2023-2024年新高考数学一轮复习培优教案106《概率与统计的综合问题》原卷版doc等2份教案配套教学资源,其中教案共22页, 欢迎下载使用。
新高考数学一轮复习精品教案第32讲 概率与统计综合问题(含解析): 这是一份新高考数学一轮复习精品教案第32讲 概率与统计综合问题(含解析),共30页。
新高考数学一轮复习精品教案第11讲 导数综合问题:证明不等式、恒成立问题、零点问题(含解析): 这是一份新高考数学一轮复习精品教案第11讲 导数综合问题:证明不等式、恒成立问题、零点问题(含解析),共24页。教案主要包含了知识点总结,典型例题,技能提升训练等内容,欢迎下载使用。