2025年高考数学二轮复习课时精练学案必刷大题18 统计与统计分析(2份打包,原卷版+含解析)
展开一般学校认为成绩大于等于80分的学生为优秀.
(1)根据频率分布直方图,估计3 000名学生在该次数学考试中成绩优秀的学生数;
(2)依据样本的频率分布直方图,估计总体成绩的众数和平均数(每组数据以所在区间的中点值为代表).
解 (1)由样本的频率分布直方图可知,
在该次数学考试中成绩优秀的频率是(0.020+0.008)×10=0.28,
则估计3 000名学生在该次数学考试中成绩优秀的学生有3 000×0.28=840(名).
(2)由样本的频率分布直方图可知,估计总体成绩的众数为eq \f(70+80,2)=75,
平均数为0.002×10×35+0.006×10×45+0.012×10×55+0.024×10×65+0.028×10×75+0.020×10×85+0.008×10×95=71.2.所以估计总体成绩的众数为75,平均数为71.2.
2.实验发现,猴痘病毒与天花病毒有共同抗原,两者之间有很强的血清交叉反应和交叉免疫,故猴痘流行的时候可接种牛痘疫苗预防.某医学研究机构对120个接种与未接种牛痘疫苗的密切接触者进行医学观察后,统计了感染病毒情况,得到下面的2×2列联表:
(1)根据上表,分别估计在未接种牛痘疫苗和已接种牛痘疫苗的情况下,感染猴痘病毒的概率;
(2)是否能依据小概率值α=0.01的独立性检验,认为密切接触者未感染猴痘病毒与接种牛痘疫苗有关?
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.
解 (1)由题意可知,估计未接种牛痘疫苗者感染猴痘病毒的概率为P1=eq \f(20,20+30)=eq \f(2,5),
已接种牛痘疫苗者感染猴痘病毒的概率为P2=eq \f(10,10+60)=eq \f(1,7).
(2)列联表如表所示:
零假设为H0:密切接触者未感染猴痘病毒与接种牛痘疫苗无关.
则χ2=eq \f(120×20×60-10×302,30×90×50×70)≈10.286>6.635=x0.01,
所以根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为密切接触者未感染猴痘病毒与接种牛痘疫苗有关,此推断犯错误的概率不超过0.01.
3.“绿水青山就是金山银山”的口号已经深入民心,人们对环境的保护意识日益增强,质检部门也会不时地对一些企业的生产污染情况进行排查,并作出相应的处理,本次排查了30个企业,共查出510个污染点,其中造成污染点前10名的企业分别造成的污染点数为58,36,36,35,33,32,28,26,24,22.
(1)求这30个企业造成污染点的第80百分位数;
(2)已知造成污染点前10名的企业的方差为92.4,其他20个企业造成污染点的方差为44.7,求这30个企业造成污染点的总体方差.
解 (1)根据定义可得,此30个数据从小到大排列,且30×80%=24,
所以这30个企业造成污染的第80百分位数是第24个数据与第25个数据的平均数,即前10名中第六名与第七名数据的平均数,即eq \f(28+32,2)=30.
(2)按照企业造成的污染点数从小到大排列,记为x1,x2,…,x20,其平均数记为eq \x\t(x),方差记为seq \\al(2,x);
把剩下10个数据记为y1,y2,…,y10,其平均数记为eq \x\t(y),方差记为seq \\al(2,y);
把总样本数据的平均数记为eq \x\t(z),方差记为s2.由题意可知,eq \x\t(z)=eq \f(510,30)=17,
eq \x\t(y)=eq \f(1,10)×(58+36+36+35+33+32+28+26+24+22)=eq \f(1,10)×330=33,则eq \x\t(x)=eq \f(1,20)×(510-330)=9,
由题知seq \\al(2,x)=44.7,seq \\al(2,y)=92.4,s2=eq \f(1,30)×{20[seq \\al(2,x)+(eq \x\t(x)-eq \x\t(z))2]+10[seq \\al(2,y)+(eq \x\t(y)-eq \x\t(z))2]}
代入数据可得s2=eq \f(1,30)×{20×[44.7+(9-17)2]+10×[92.4+(33-17)2]}=188.6,
所以这30个企业造成污染点的总体方差为188.6.
4.某电商平台统计了近七年小家电的年度广告费支出xi(万元)与年度销售量yi(万台)的数据,如表所示:
其中eq \i\su(i=1,7,x)iyi=279.4,eq \i\su(i=1,7,x)eq \\al(2,i)=708.
(1)若用线性回归模型拟合y与x的关系,求出y关于x的经验回归方程;
(2)若用y=c+deq \r(x)模型拟合得到的回归方程为eq \(y,\s\up6(^))=1.63+0.99eq \r(x),经计算(1)中的回归模型及该模型的R2分别为0.75和0.88,请根据R2的数值选择更好的回归模型拟合y与x的关系,进而计算出年度广告费x为何值时,利润eq \(z,\s\up6(^))=200y-x的预报值最大?参考公式:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\x\t(x)\x\t(y),\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2)=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
解 (1)由题意可得eq \x\t(x)=eq \f(1+2+4+6+11+13+19,7)=8,
eq \x\t(y)=eq \f(1.9+3.2+4.0+4.4+5.2+5.3+5.4,7)=4.2,
所以eq \(b,\s\up6(^))=eq \f(\i\su(i=1,7,x)iyi-7\x\t(x)\x\t(y),\i\su(i=1,7,x)\\al(2,i)-7\x\t(x)2)=eq \f(279.4-7×8×4.2,708-7×82)=0.17,eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=4.2-0.17×8=2.84,
y关于x的经验回归方程为eq \(y,\s\up6(^))=0.17x+2.84.
(2)因为0.75<0.88,R2越大拟合效果越好,所以选用回归方程eq \(y,\s\up6(^))=1.63+0.99eq \r(x)更好,
eq \(z,\s\up6(^))=200(1.63+0.99eq \r(x))-x=-x+198eq \r(x)+326=-(eq \r(x)-99)2+10 127,
即当eq \r(x)=99,即x=9 801时,利润的预报值最大.
5.国内某大学想了解本校学生的运动状况,采用简单随机抽样的方法从全校学生中抽取2 000人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[0,3],记平均每天运动的时间不少于2小时的学生为“运动达人”,少于2小时的学生为“非运动达人”.整理分析数据得到的列联表如表所示(单位:人):
零假设为H0:运动时间与性别之间无关联.根据列联表中的数据,算得χ2≈31.746,根据小概率值α=0.001的χ2独立性检验,则认为运动时间与性别有关,此推断犯错误的概率不大于0.001.
(1)如果将表中所有数据都缩小为原来的eq \f(1,10),在相同的检验标准下,再用独立性检验推断运动时间与性别之间的关联性,结论还一样吗?请用统计语言解释其中的原因;
(2)采用按样本性别比例分配的分层随机抽样的方法抽取20名同学,并统计每位同学的运动时间,统计数据为男生运动时间的平均数为2.5,方差为1;女生运动时间的平均数为1.5,方差为0.5,求这20名同学运动时间的均值与方差.
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
解 (1)方法一 改变数据之后的列联表为
则调整后的χ2=eq \f(200×110×20-30×402,150×50×140×60)=eq \f(200,63)≈3.175<10.828=x0.001.
则根据小概率值α=0.001的独立性检验,没有充分证据推断运动时间与性别有关.
与之前结论不一样,
原因是每个数据都缩小为原来的eq \f(1,10),相当于样本容量缩小为原来的eq \f(1,10),导致推断结论发生了变化,
当样本容量越大,用样本估计总体的准确性会越高.
方法二 调整后的χ2=eq \f(\f(n,10)\b\lc\(\rc\)(\a\vs4\al\c1(\f(a,10)·\f(d,10)-\f(b,10)·\f(c,10)))2,\b\lc\(\rc\)(\a\vs4\al\c1(\f(a,10)+\f(b,10)))\b\lc\(\rc\)(\a\vs4\al\c1(\f(c,10)+\f(d,10)))\b\lc\(\rc\)(\a\vs4\al\c1(\f(a,10)+\f(c,10)))\b\lc\(\rc\)(\a\vs4\al\c1(\f(b,10)+\f(d,10))))
=eq \f(1,10)eq \f(nad-bc2,a+bc+da+cb+d)=eq \f(χ2,10)≈3.175<10.828=x0.001,
根据小概率值α=0.001的独立性检验,没有充分证据推断运动时间与性别有关.
与之前结论不一样,原因是每个数据都缩小为原来的eq \f(1,10),相当于样本容量缩小为原来的eq \f(1,10),导致推断结论发生了变化,
当样本容量越大,用样本估计总体的准确性会越高.
(2)男生抽取eq \f(1 400,2 000)×20=14(人),女生抽取eq \f(600,2 000)×20=6(人),
由已知男生运动时间的平均数为eq \x\t(x)=2.5,样本方差为seq \\al(2,1)=1;女生运动时间的平均数为eq \x\t(y)=1.5,样本方差为seq \\al(2,2)=0.5.记样本均值为eq \x\t(w),则eq \x\t(w)=eq \f(14×2.5+6×1.5,20)=2.2,
记样本方差为s2,则s2=eq \f(14×[1+2.5-2.22]+6×[0.5+1.5-2.22],20)=1.06,
所以这20名同学运动时间的均值为2.2,方差为1.06.
6.近年来,我国新能源汽车发展进入新阶段.某品牌2018年到2022年新能源汽车年销量w(万辆)如表所示,其中2018年~2022年对应的年份代码t为1~5.
(1)判断两个变量是否线性相关,并计算样本相关系数(精确到0.001);
(2)①假设变量x与变量Y的n对观测数据为(x1,y1),(x2,y2),…,(xn,yn),两个变量满足一元线性回归模型eq \b\lc\{\rc\ (\a\vs4\al\c1(Y=bx+e,,Ee=0,De=σ2))(随机误差ei=yi-bxi),请写出参数b的最小二乘估计;
②令变量x=t-eq \x\t(t),y=w-eq \x\t(w),则变量x与变量Y满足一元线性回归模型eq \b\lc\{\rc\ (\a\vs4\al\c1(Y=bx+e,,Ee=0,De=σ2,))利用①中结论求y关于x的经验回归方程,并预测2025年该品牌新能源汽车的销售量.
附:样本相关系数r=eq \f(\i\su(i=1,n, )ti-\x\t(t)wi-\x\t(w),\r(\i\su(i=1,n, )ti-\x\t(t)2)\r(\i\su(i=1,n, )wi-\x\t(w)2)),eq \i\su(i=1,5, )(ti-eq \x\t(t))(wi-eq \x\t(w))=51,eq \i\su(i=1,5, )(wi-eq \x\t(w))2=262,eq \i\su(i=1,5, )(ti-eq \x\t(t))2=10,eq \r(655)≈25.6.
解 (1)通过作散点图如图所示,发现样本点大致分布在一条直线附近,
因此是线性相关.
r=eq \f(\i\su(i=1,5, )ti-\x\t(t)wi-\x\t(w),\r(\i\su(i=1,5, )ti-\x\t(t)2)\r(\i\su(i=1,5, )wi-\x\t(w)2))=eq \f(51,\r(262)×\r(10))≈eq \f(51,51.2)≈0.996,∴两变量有较强的正相关.
(2)①Q=eq \i\su(i=1,n,e)eq \\al(2,i)=eq \i\su(i=1,n, )(yi-bxi)2=eq \i\su(i=1,n, )(yeq \\al(2,i)-2bxiyi+b2xeq \\al(2,i))=b2eq \i\su(i=1,n,x)eq \\al(2,i)-2beq \i\su(i=1,n,x)iyi+eq \i\su(i=1,n,y)eq \\al(2,i),
要使残差平方和最小,当且仅当eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi,\i\su(i=1,n,x)\\al(2,i)).
②∵x=t-eq \x\t(t),y=w-eq \x\t(w),由①知eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5,x)iyi,\i\su(i=1,5,x)\\al(2,i))=eq \f(\i\su(i=1,5, )ti-\x\t(t)wi-\x\t(w),\i\su(i=1,5, )ti-\x\t(t)2)=eq \f(51,10)=5.1,
∴y关于x的经验回归方程为y=5.1x,∴w-eq \x\t(w)=5.1(t-eq \x\t(t)),
∵eq \x\t(t)=3,eq \x\t(w)=14,∴w=5.1(t-eq \x\t(t))+eq \x\t(w)=5.1t-1.3,
当t=8时,w=5.1×8-1.3=39.5(万辆),
因此,预计2025年该品牌新能源汽车的销售量将达到39.5万辆.感染猴痘病毒
未感染猴痘病毒
未接种牛痘疫苗
20
30
已接种牛痘疫苗
10
60
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
感染猴痘病毒
未感染猴痘病毒
合计
未接种牛痘疫苗
20
30
50
已接种牛痘疫苗
10
60
70
合计
30
90
120
年份
2016
2017
2018
2019
2020
2021
2022
广告费支出x
1
2
4
6
11
13
19
销售量y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
性别
运动时间
合计
“运动达人”
“非运动达人”
男生
1 100
300
1 400
女生
400
200
600
合计
1 500
500
2 000
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
性别
运动时间
合计
“运动达人”
“非运动达人”
男生
110
30
140
女生
40
20
60
合计
150
50
200
年份代码t
1
2
3
4
5
销量w(万辆)
4
9
14
18
25
2025年高考数学二轮复习课时精练学案必刷大题9 解三角形(2份打包,原卷版+含解析): 这是一份2025年高考数学二轮复习课时精练学案必刷大题9 解三角形(2份打包,原卷版+含解析),文件包含2025年高考数学二轮复习课时精练学案必刷大题9解三角形原卷版doc、2025年高考数学二轮复习课时精练学案必刷大题9解三角形含解析doc等2份试卷配套教学资源,其中试卷共7页, 欢迎下载使用。
2025年高考数学二轮复习课时精练学案必刷大题6 导数的综合问题(2份打包,原卷版+含解析): 这是一份2025年高考数学二轮复习课时精练学案必刷大题6 导数的综合问题(2份打包,原卷版+含解析),文件包含2025年高考数学二轮复习课时精练学案必刷大题6导数的综合问题原卷版doc、2025年高考数学二轮复习课时精练学案必刷大题6导数的综合问题含解析doc等2份试卷配套教学资源,其中试卷共7页, 欢迎下载使用。
2025年高考数学二轮复习课时精练学案 必刷小题1 集合、常用逻辑用语、不等式(2份打包,原卷版+含解析): 这是一份2025年高考数学二轮复习课时精练学案 必刷小题1 集合、常用逻辑用语、不等式(2份打包,原卷版+含解析),文件包含2025年高考数学二轮复习课时精练学案必刷小题1集合常用逻辑用语不等式原卷版doc、2025年高考数学二轮复习课时精练学案必刷小题1集合常用逻辑用语不等式含解析doc等2份试卷配套教学资源,其中试卷共8页, 欢迎下载使用。