高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用课后复习题
展开一、统计图表与正态分布
例1 从某技术公司开发的某种产品中随机抽取200件,测量这些产品的一项质量指标(记为Z),由测量结果得如下频率分布直方图:
(1)公司规定:当Z≥95时,产品为正品;当Z<95时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元.记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和均值;
(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2(同一组中的数据用该区间的中点值作代表).
①利用该正态分布,求P(87.8≤Z≤112.2);
②某客户从该公司购买了500件这种产品,记X表示这500件产品中该项质量指标值位于区间[87.8,112.2]内的产品件数,利用①的结果,求E(X).
附:eq \r(150)≈12.2.
若Z~N(μ,σ2),则P(μ-σ≤Z≤μ+σ)≈0.682 7,
P(μ-2σ≤Z≤μ+2σ)≈0.954 5.
解 (1)由频率估计概率,产品为正品的概率为(0.033+0.024+0.008+0.002)×10=0.67,
所以随机变量ξ的分布列为
所以E(ξ)=90×0.67+(-30)×0.33=50.4.
(2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数μ和样本方差σ2分别为
μ=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,
σ2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150.
①因为Z~N(100,150),
从而P(87.8≤Z≤112.2)=P(100-12.2≤Z≤100+12.2)≈0.682 7.
②由①知,一件产品中该项质量指标值位于区间[87.8,112.2]内的概率约为0.682 7,依题意知X~B(500,0.682 7),所以E(X)=500×0.682 7=341.35.
反思感悟 本题以统计图表为载体,将正态分布、二项分布、频率分布直方图巧妙的融合在一起,体现了知识的整合性与交汇融合性,搞清这些统计图表的含义,掌握好样本特征的计数方法、各类概率的计算方法及均值与方差的运算是解决问题的关键.
二、统计图表与统计分析
例2 一家大型超市委托某机构调查该超市的顾客使用移动支付的情况.调查人员从年龄在20岁至60岁的顾客中,随机抽取了200人,调查结果如图:
(1)为推广移动支付,超市准备对使用移动支付的每位顾客赠送1个环保购物袋.若某日该超市预计有10 000人购物,试根据上述数据估计,该超市当天应准备多少个环保购物袋?
(2)填写下面列联表,并根据列联表判断在小概率值α=0.001的独立性检验下,能否推断使用移动支付与年龄有关?
(3)现从该超市这200位顾客年龄在[55,60]的人中,随机抽取2人,记这两人中使用移动支付的顾客为X人,求X的分布列.
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d)
解 (1)根据图中数据,由频率估计概率,根据已知可预计该超市顾客使用移动支付的概率为:
eq \f(20+25+25+15+15+10+8+7,200)=eq \f(5,8),
∴超市当天应准备的环保购物袋个数为
10 000×eq \f(5,8)=6 250.
(2)补充列联表为
零假设H0:移动支付与年龄无关,则
χ2=eq \f(200×85×65-40×102,125×75×95×105)≈56.17,
∵56.17>10.828,
∴在小概率值α=0.001的独立性检验下,可以认为使用移动支付与年龄有关.
(3)X的可能取值为0,1,2,
P(X=0)=eq \f(C\\al(2,22),C\\al(2,29))=eq \f(33,58),P(X=1)=eq \f(C\\al(1,22)C\\al(1,7),C\\al(2,29))=eq \f(11,29),
P(X=2)=eq \f(C\\al(2,7),C\\al(2,29))=eq \f(3,58),
∴X的分布列为
三、概率统计中的决策问题
例3 某企业打算处理一批产品,这些产品每箱100件,以箱为单位销售.已知这批产品中每箱出现的废品率只有两种:可能10%或者20%,两种可能对应的概率均为0.5.假设该产品正品每件市场价格为100元,废品不值钱.现处理价格为每箱8 400元,遇到废品不予更换.以一箱产品中正品的价格均值作为决策依据.
(1)在不开箱检验的情况下,判断是否可以购买;
(2)现允许开箱,有放回地随机从一箱中抽取2件产品进行检验.
①若此箱出现的废品率为20%,记抽到的废品数为X,求X的分布列和均值;
②若已发现在抽取检验的2件产品中,其中恰有一件是废品,判断是否可以购买.
解 (1)在不开箱检验的情况下,一箱产品中正品的价格均值为:
E(ξ)=100×(1-0.2)×100×0.5+100×(1-0.1)×100×0.5=8 500>8 400,
∴在不开箱检验的情况下,可以购买.
(2)①X的可能取值为0,1,2,
P(X=0)=Ceq \\al(0,2)×0.20×0.82=0.64,
P(X=1)=Ceq \\al(1,2)×0.21×0.81=0.32,
P(X=2)=Ceq \\al(2,2)×0.22×0.80=0.04,
∴X的分布列为
E(X)=0×0.64+1×0.32+2×0.04=0.4.
②设事件A:发现在抽取检验的2件产品中,其中恰有一件是废品,则
P(A)=Ceq \\al(1,2)×0.2×0.8×0.5+Ceq \\al(1,2)×0.1×0.9×0.5=0.25,
一箱产品中,设正品的价格的均值为η,则η=8 000,9 000,
事件B1:抽取的废品率为20%的一箱,
则P(η=8 000)=P(B1|A)=eq \f(PAB1,PA)
=eq \f(C\\al(1,2)×0.2×0.8×0.5,0.25)=0.64,
事件B2:抽取的废品率为10%的一箱,则
P(η=9 000)=P(B2|A)=eq \f(PAB2,PA)
=eq \f(C\\al(1,2)×0.1×0.9×0.5,0.25)=0.36,
∴E(η)=8 000×0.64+9 000×0.36=8 360<8 400,
∴已发现在抽取检验的2件产品中,其中恰有一件是废品,不可以购买.
四、概率统计中的最值问题
例4 某超市计划按月订购一种冰激凌,每天进货量相同,进货成本为每桶5元,售价为每桶7元,未售出的冰激凌以每桶3元的价格当天全部处理完毕,根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关,如果最高气温不低于25 ℃,需求量为600桶,如果最高气温(单位:℃)位于区间[20,25),需求量为400桶,如果最高气温低于20 ℃,需求量为200桶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种冰激凌一天的需求量X(单位:桶)的分布列;
(2)设六月份一天销售这种冰激凌的利润为Y(单位:元),当六月份这种冰激凌一天的进货量n(单位:桶)为多少时,Y的均值取得最大值?
解 (1)由已知得,X的所有可能取值为200,400,600,记六月份最高气温低于20 ℃为事件A1,最高气温(单位:℃)位于区间[20,25)为事件A2,最高气温不低于25 ℃为事件A3,根据题意,结合频数分布表,用频率估计概率,可知
P(X=200)=P(A1)=eq \f(18,90)=eq \f(1,5),
P(X=400)=P(A2)=eq \f(36,90)=eq \f(2,5),
P(X=600)=P(A3)=eq \f(36,90)=eq \f(2,5),
故六月份这种冰激凌一天的需求量X(单位:桶)的分布列为
(2)由题意得,当n≤200时,E(Y)=2n≤400;
当200
当n>600时,
E(Y)=eq \f(1,5)×[200×2+(n-200)×(-2)]+eq \f(2,5)×[400×2+(n-400)×(-2)]+eq \f(2,5)×[600×2+(n-600)×(-2)]=1 760-2n<560.
所以当n=400时,Y的均值取得最大值640.ξ
90
-30
P
0.67
0.33
移动支付
年龄
合计
年龄<40
年龄≥40
使用
不使用
合计
200
α
0.100
0.050
0.010
0.001
xα
2.706
3.841
6.635
10.828
移动支付
年龄
合计
年龄<40
年龄≥40
使用
85
40
125
不使用
10
65
75
合计
95
105
200
X
0
1
2
P
eq \f(33,58)
eq \f(11,29)
eq \f(3,58)
X
0
1
2
P
0.64
0.32
0.04
最高
气温
(℃)
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40]
天数
2
16
36
25
7
4
X
200
400
600
P
eq \f(1,5)
eq \f(2,5)
eq \f(2,5)
高中数学人教A版 (2019)选择性必修 第三册7.4 二项分布与超几何分布当堂达标检测题: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000359_t7/?tag_id=28" target="_blank">7.4 二项分布与超几何分布当堂达标检测题</a>,共4页。
2020-2021学年第八章 成对数据的统计分析8.3 分类变量与列联表同步训练题: 这是一份2020-2021学年第八章 成对数据的统计分析8.3 分类变量与列联表同步训练题,共5页。
高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课后作业题: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课后作业题,共5页。试卷主要包含了给出下列x,y值的数据如下等内容,欢迎下载使用。