【最新版】高中数学高三培优小题练第94练 高考大题突破练——概率与统计
展开考点一 离散型随机变量及其分布列
1.(2022·重庆模拟)某中学在该校高一年级开设了选修课《中国数学史》.经过一年的学习,为了解同学们在数学史课程的学习后,学习数学的兴趣是否浓厚,该校随机抽取了200名高一学生进行调查,得到统计数据如下:
(1)求2×2列联表中的数据x,y,m,n的值,并确定能否在犯错误的概率不超过0.15的前提下认为对数学兴趣浓厚与选学《中国数学史》课程有关;
(2)在选学了《中国数学史》的120人中按对数学是否兴趣浓厚,采用分层抽样的方法抽取12人,再从12人中随机抽取3人做进一步调査.若初始总分为10分,抽到的3人中,每有一人对数学兴趣薄弱减1分,每有一人对数学兴趣浓厚加2分.设得分结果总和为X,求X的分布列和均值.
附:K2=eq \f(nad-bc2,a+ba+cc+db+d),n=a+b+c+d.
解 (1)由题意得x=60,y=20,m=40,n=80.则K2=eq \f(200×100×20-20×602,160×40×120×80)=eq \f(25,12)≈2.083>2.072,所以能在犯错误的概率不超过0.15的前提下认为对数学兴趣浓厚与选学《中国数学史》课程有关.
(2)在选学了《中国数学史》的120人中按对数学是否兴趣浓厚,采用分层抽样的方法抽取12人,可知其中对数学兴趣浓厚有10人,对数学兴趣薄弱有2人,再从12人中抽取3人,当这3人中恰有2人对数学兴趣薄弱时,X=10;当这3人中恰有1人对数学兴趣薄弱时,X=13;当这3人都对数学兴趣浓厚时,X=16,
故P(X=10)=eq \f(C\\al(2,2)C\\al(1,10),C\\al(3,12))=eq \f(1,22),
P(X=13)=eq \f(C\\al(1,2)C\\al(2,10),C\\al(3,12))=eq \f(9,22),
P(X=16)=eq \f(C\\al(0,2)C\\al(3,10),C\\al(3,12))=eq \f(6,11),
所以X的分布列为
X的均值E(X)=10×eq \f(1,22)+13×eq \f(9,22)+16×eq \f(6,11)=eq \f(29,2).
考点二 用样本估计总体
2.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2 000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.
(1)求第七组的频率,并完成频率分布直方图;
(2)用样本数据估计该校的2 000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);
(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.
解 (1)由频率分布直方图得第七组的频率为
1-(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.
完成频率分布直方图如图所示.
(2)用样本数据估计该校的2 000名学生这次考试成绩的平均分为
70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.
(3)样本成绩属于第六组的有0.006×10×50=3(人),样本成绩属于第八组的有0.004×10×50=2(人),
从样本成绩属于第六组和第八组的所有学生中随机抽取2名,
基本事件总数n=10,
他们的分差的绝对值小于10分包含的基本事件个数m=4,
∴他们的分差的绝对值小于10分的概率
p=eq \f(m,n)=eq \f(4,10)=eq \f(2,5).
考点三 回归分析
3.新个体经济是中国经济社会数字化转型条件下出现的新生事物,指微商电商、网络直播、职业创作者等,下表是2022年1至4月份某市新增“微商电商”的统计数据:
(1)请利用所给数据求新增微商电商个数y与月份x之间的线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),并预测该市2022年5月新增“微商电商”的个数(结果用四舍五入法保留整数);
(2)一般认为当|r|≥0.9时,线性回归方程的拟合效果非常好;当0.75≤|r|<0.9时,线性回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.
参考公式:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\x\t(x)\x\t(y),\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2)=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),
r=eq \f(\i\su(i=1,n,x)iyi-n\x\t(x)\x\t(y),\r(\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2\i\su(i=1,n,y)\\al(2,i)-n\x\t(y)2))
=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2\i\su(i=1,n, )yi-\x\t(y)2)),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x),
参考数据:eq \r(290)≈17.029 4,eq \r(330)≈18.165 9,eq \r(370)≈19.235 4.
解 (1)eq \x\t(x)=eq \f(1+2+3+4,4)=eq \f(5,2),
eq \x\t(y)=eq \f(90+105+125+140,4)=115,
则eq \(b,\s\up6(^))=eq \f(\i\su(i=1,4,x)iyi-4\x\t(x)\x\t(y),\i\su(i=1,4,x)\\al(2,i)-4\x\t(x)2)=eq \f(1 235-1 150,30-25)=17,
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=115-17×eq \f(5,2)=72.5,
故所求线性回归方程为eq \(y,\s\up6(^))=17x+72.5,
令x=5,则eq \(y,\s\up6(^))=17×5+72.5=157.5≈158(个),
预测该市2022年5月新增“微商电商”的个数约为158.
(2)eq \i\su(i=1,4,x)iyi-4eq \x\t(x)eq \x\t(y)=1 235-1 150=85,
eq \i\su(i=1,4,x)eq \\al(2,i)-4eq \x\t(x)2=5,eq \i\su(i=1,4,y)eq \\al(2,i)-4eq \x\t(y)2=1 450,
所以r=eq \f(\i\su(i=1,4,x)iyi-4\x\t(x)\x\t(y),\r(\i\su(i=1,4,x)\\al(2,i)-4\x\t(x)2\i\su(i=1,4,y)\\al(2,i)-4\x\t(y)2))=eq \f(17,\r(290))
≈eq \f(17,17.029 4)≈0.998>0.9.
故该线性回归方程的拟合效果非常好.
4.(2022·兰州模拟)2021年五一期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握五一期间车辆出行的高峰情况,在某高速公路收费点记录了5月
1日上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费点,它们通过该收费点的时刻的频率分布直方图如图所示,其中时间段9:20~9:40记作区间[20,40),9:40~10:00记作[40,60),10:00~10:20记作[60,80),10:20~10:40记作[80,100].例如:10点04分,记作时刻64.
(1)估计这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均数(同一组中的数据用该组区间的中点数代表);
(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车中随机抽取4辆,设抽到的4辆车中,在9:20~10:00之间通过的车辆数为X,求X的分布列与均值;
(3)由大数据分析可知,车辆在每天通过该收费点的时刻T服从正态分布N(μ,σ2),其中μ可用这600辆车在9:20~10:40之间通过该收费点的时刻的平均值近似代替,σ2可用样本的方差近似代替(同一组中的数据用该组区间的中点值代表),已知5月5日全天共有1 000辆车通过该收费点,估计在9:46~10:40之间通过的车辆数(结果保留到整数).
参考数据:若T~N(μ,σ2),则P(μ-σ
(30×0.005+50×0.015+70×0.020+90×0.010)×20=64,即10点04分.
(2)结合频率分布直方图和分层抽样的方法可知,抽取的10辆车中,在10:00前通过的车辆数就是位于时间分组中在[20,60)这一区间内的车辆数,即(0.005+0.015)×20×10=4,所以X的可能取值为0,1,2,3,4.
所以P(X=0)=eq \f(C\\al(4,6),C\\al(4,10))=eq \f(1,14),
P(X=1)=eq \f(C\\al(3,6)C\\al(1,4),C\\al(4,10))=eq \f(8,21),
P(X=2)=eq \f(C\\al(2,6)C\\al(2,4),C\\al(4,10))=eq \f(3,7),
P(X=3)=eq \f(C\\al(1,6)C\\al(3,4),C\\al(4,10))=eq \f(4,35),
P(X=4)=eq \f(C\\al(0,6)C\\al(4,4),C\\al(4,10))=eq \f(1,210),
所以X的分布列为
所以E(X)=0×eq \f(1,14)+1×eq \f(8,21)+2×eq \f(3,7)+3×eq \f(4,35)+4×eq \f(1,210)=eq \f(8,5).
(3)由(1)可得μ=64,
σ2=(30-64)2×0.1+(50-64)2×0.3+(70-64)2×0.4+(90-64)2×0.2=324,
所以σ=18.
估计在9:46~10:40这一时间段内通过的车辆数,也就是46
P(64-18
趣浓厚
对数学兴
趣薄弱
总计
选学了《中国数学史》
100
20
120
未选学《中国数学史》
x
y
n
总计
160
m
200
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
X
10
13
16
P
eq \f(1,22)
eq \f(9,22)
eq \f(6,11)
月份
1
2
3
4
新增微商电商个数
90
105
125
140
X
0
1
2
3
4
P
eq \f(1,14)
eq \f(8,21)
eq \f(3,7)
eq \f(4,35)
eq \f(1,210)
【最新版】高中数学高三培优小题练第25练 高考大题突破练——极值点偏移问题: 这是一份【最新版】高中数学高三培优小题练第25练 高考大题突破练——极值点偏移问题,共4页。试卷主要包含了已知函数f=x等内容,欢迎下载使用。
【最新版】高中数学高三培优小题练第23练 高考大题突破练——零点问题: 这是一份【最新版】高中数学高三培优小题练第23练 高考大题突破练——零点问题,共4页。试卷主要包含了已知f=x-aex,a∈R.等内容,欢迎下载使用。
【最新版】高中数学高三培优小题练第24练 高考大题突破练——不等式证明: 这是一份【最新版】高中数学高三培优小题练第24练 高考大题突破练——不等式证明,共4页。