2021高三人教B版数学一轮(经典版)教师用书:第11章第9讲 离散型随机变量的均值、方差和正态分布
展开第9讲 离散型随机变量的均值、方差和正态分布
基础知识整合
1.离散型随机变量的均值与方差
(1)若离散型随机变量X的分布列为
X | x1 | x2 | … | xi | … | xn |
P | p1 | p2 | … | pi | … | pn |
①均值
称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
②方差
称D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
(2)均值与方差的性质
①E(aX+b)=aE(X)+b.
②D(aX+b)=a2D(X).(a,b为常数)
③E(k)=k(k为常数).
④E(X1+X2)=E(X1)+E(X2).
⑤D(X)=E(X2)-(E(X))2.
⑥若X1,X2相互独立,则E(X1X2)=E(X1)·E(X2).
⑦D(k)=0(k为常数).
⑧若给定一组数据x1,x2,…,xn,其方差为s2,则ax1,ax2,…,axn的方差为a2s2.
⑨若给定一组数据x1,x2,…,xn,其方差为s2,则ax1+b,ax2+b,…,axn+b的方差为a2s2,特别地,当a=1时,有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.
两点分布与二项分布的均值、方差
| 均值 | 方差 |
变量X服从 两点分布 | E(X)=p | D(X)=p(1-p) |
X~B(n,p) | E(X)=np | D(X)=np(1-p) |
2.正态分布
(1)正态曲线的性质
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.
(2)正态分布的三个常用数据
①P(μ-σ<X≤μ+σ)=0.6826;
②P(μ-2σ<X≤μ+2σ)=0.9544;
③P(μ-3σ<X≤μ+3σ)=0.9974.
1.E(X)是一个实数,由X的分布列唯一确定.随机变量X是可变的,可取不同的值,而E(X)是不变的,它描述X取值的平均状态.
2.变量的方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度,其中标准差与随机变量本身具有相同的单位.
3.方差也是一个常数,它不具有随机性,方差的值一定是非负的.
1.已知随机变量X服从正态分布N(3,σ2),且P(X<5)=0.8,则P(1<x<3)=( )
A.0.6 B.0.4
C.0.3 D.0.2
答案 C
解析 由正态曲线的对称性可知,P(X<3)=P(X>3)=0.5,故P(X>1)=P(X<5)=0.8,所以P(X≤1)=1-P(X>1)=0.2,P(1<X<3)=P(X<3)-P(X≤1)=0.5-0.2=0.3.
2.某街头小摊,在不下雨的日子一天可赚到100元,在下雨的日子每天要损失10元,若该地区每年下雨的日子约为130天,则此小摊每天获利的期望值约是(一年按365天计算)( )
A.60.82元 B.68.02元
C.58.82元 D.60.28元
答案 A
解析 E(ξ)=100×+(-10)×≈60.82,所以选A.
3.(2019·广西名校联考)设整数m是从不等式x2-2x-8≤0的整数解的集合S中随机抽取的一个元素,记随机变量ξ=m2,则ξ的数学期望E(ξ)=( )
A.1 B.5
C.2 D.
答案 B
解析 由x2-2x-8≤0,得-2≤x≤4,∴S={-2,-1,0,1,2,3,4},∵ξ=m2,∴ξ可取的值分别为0,1,4,9,16,相应的概率分别为,,,,,∴ξ的数学期望E(ξ)=0×+1×+4×+9×+16×=5.故选B.
4.(2020·孝感摸底)已知袋中有3个白球、2个红球,现从中随机取出3个球,其中取出1个白球计1分,取出1个红球计2分,记X为取出3个球的总分值,则E(X)=( )
A. B.
C.4 D.
答案 B
解析 由题意,知X的所有可能取值为3,4,5,且P(X=3)==,P(X=4)==,P(X=5)==,所以E(X)=3×+4×+5×=.
5.(2019·安徽六安毛坦厂中学月考)某次考试共有12个选择题,每个选择题的分值为5分,每个选择题四个选项且只有一个选项是正确的,A学生对12个选择题中每个题的四个选择项都没有把握,最后选择题的得分为X分,B学生对12个选择题中每个题的四个选项都能判断其中有一个选项是错误的,对其他三个选项都没有把握,选择题的得分为Y分,则D(Y)-D(X)的值为( )
A. B.
C. D.
答案 A
解析 设A学生答对题的个数为m,则得分X=5m(分),m~B,D(m)=12××=,所以D(X)=25×=,同理设B学生答对题的个数为n,可知n~B,D(n)=12××=,所以D(Y)=×25=,所以D(Y)-D(X)=-=.故选A.
6.一射击测试每人射击三次,每击中目标一次记10分,没有击中目标记0分.某人每次击中目标的概率为,则此人得分的数学期望与方差分别为________.
答案 20,
解析 记此人三次射击击中目标X次,得分为Y分,则X~B,Y=10X,所以E(Y)=10E(X)=10×3×=20,D(Y)=100D(X)=100×3××=.
核心考向突破
精准设计考向,多角度探究突破
考向一 离散型随机变量的均值与方差
角度 与古典概型有关的均值与方差
例1 盒中共有9个球,其中有4个红球、3个黄球和2个绿球,这些球除颜色外完全相同.
(1)从盒中一次随机取出2个球,求取出的2个球颜色相同的概率P;
(2)从盒中一次随机取出4个球,其中红球、黄球、绿球的个数分别记为x1,x2,x3,随机变量X表示x1,x2,x3中的最大数,求X的概率分布和数学期望E(X).
解 (1)取到2个颜色相同的球可能是2个红球、2个黄球或2个绿球,
所以P===.
(2)随机变量X所有可能的取值为2,3,4,{X=4}表示的随机事件是“取到的4个球是4个红球”,
故P(X=4)==;
{X=3}表示的随机事件是“取到的4个球是3个红球和1个其他颜色的球,或3个黄球和1个其他颜色的球”,
故P(X=3)===;
于是P(X=2)=1-P(X=3)-P(X=4)
=1--=.
所以随机变量X的概率分布如下,
X | 2 | 3 | 4 |
P |
因此,随机变量X的数学期望E(X)=2×+3×+4×=.
求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
[即时训练] 1.(2019·江西师大附中模拟)已知某校的数学专业开设了A,B,C,D四门选修课,甲、乙、丙3名学生必须且只需选修其中一门.
(1)求这3名学生选择的选修课互不相同的概率;
(2)若甲和乙要选同一门课,求选修课A被这3名学生选修的人数X的分布列和数学期望.
解 (1)3名学生选择的选修课所有不同选法有43=64种;各人互不相同的选法有A种,故这3名学生选择的选修课互不相同的概率P==.
(2)选修课A被这3名学生选修的人数X的可能取值为0,1,2,3,
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==.
所以X的分布列如下,
X | 0 | 1 | 2 | 3 |
P |
数学期望E(X)=0×+1×+2×+3×=.
角度 与二项分布有关的期望与方差
例2 (2019·天津高考)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.
(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;
(2)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.
解 (1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率为,
故X~B,
从而P(X=k)=Ck3-k,k=0,1,2,3.
所以随机变量X的分布列为
X | 0 | 1 | 2 | 3 |
P |
随机变量X的数学期望E(X)=3×=2.
(2)设乙同学上学期间的三天中7:30之前到校的天数为Y,则Y~B,且M={X=3,Y=1}∪{X=2,Y=0}.
由题意,知事件{X=3,Y=1}与{X=2,Y=0}互斥,且事件{X=3}与{Y=1},事件{X=2}与{Y=0}均相互独立,从而由(1),知
P(M)=P({X=3,Y=1}∪{X=2,Y=0})
=P(X=3,Y=1)+P(X=2,Y=0)
=P(X=3)P(Y=1)+P(X=2)P(Y=0)
=×+×=.
求随机变量X的均值与方差时,可首先分析X是否服从二项分布,如果X~B(n,p),则用公式E(X)=np,D(X)=np(1-p)求解,可大大减少计算量.
[即时训练] 2.张先生家住H小区,他工作在C科技园区,从家开车到公司上班路上有L1,L2两条路线(如图),L1路线上有A1,A2,A3三个路口,各路口遇到红灯的概率均为;L2路线上有B1,B2两个路口,各路口遇到红灯的概率依次为,.
(1)若走L1路线,求最多遇到1次红灯的概率;
(2)若走L2路线,求遇到红灯次数X的数学期望;
(3)按照“平均遇到红灯次数最少”的要求,请你帮助张先生从上述两条路线中选择一条最好的上班路线,并说明理由.
解 (1)设走L1路线最多遇到1次红灯为A事件,
则P(A)=C×3+C××2=.
所以走L1路线,最多遇到1次红灯的概率为.
(2)依题意,X的可能取值为0,1,2.
P(X=0)=×=,
P(X=1)=×+×=,
P(X=2)=×=.
随机变量X的分布列为
X | 0 | 1 | 2 |
P |
E(X)=×0+×1+×2=.
(3)设选择L1路线遇到红灯次数为Y,随机变量Y服从二项分布,即Y~B,所以E(Y)=3×=.
因为E(X)<E(Y),所以选择L2路线上班最好.
考向二 均值与方差的实际应用
例3 (2019·云南昆明质检)某地区为贯彻习近平总书记关于“绿水青山就是金山银山”的精神,鼓励农户利用荒坡种植果树.某农户考察三种不同的果树苗A,B,C,经引种试验后发现,引种树苗A的自然成活率为0.8,引种树苗B,C的自然成活率均为p(0.7≤p≤0.9).
(1)任取树苗A,B,C各一棵,估计自然成活的棵数为X,求X的分布列及E(X);
(2)将(1)中的E(X)取得最大值时p的值作为B种树苗自然成活的概率.该农户决定引种n棵B种树苗,引种后没有自然成活的树苗中有75%的树苗可经过人工栽培技术处理,处理后成活的概率为0.8,其余的树苗不能成活.
①求一棵B种树苗最终成活的概率;
②若每棵树苗引种最终成活后可获利300元,不成活的每棵亏损50元,该农户为了获利不低于20万元,问至少引种B种树苗多少棵?
解 (1)依题意,X的所有可能值为0,1,2,3,
P(X=0)=0.2(1-p)2,
P(X=1)=0.8×(1-p)2+0.2×C×p×(1-p)=0.8(1-p)2+0.4p(1-p)=0.4p2-1.2p+0.8,
P(X=2)=0.2p2+0.8×C×p×(1-p)=0.2p2+1.6p(1-p)=-1.4p2+1.6p,
P(X=3)=0.8p2;
X的分布列为
X | 0 | 1 | 2 | 3 |
P | 0.2p2-0.4p+0.2 | 0.4p2-1.2p+0.8 | -1.4p2+1.6p | 0.8p2 |
所以E(X)=1×(0.4p2-1.2p+0.8)+2×(-1.4p2+1.6p)+3×0.8p2=2p+0.8.
(2)当p=0.9时,E(X)取得最大值.
①一棵B树苗最终成活的概率为0.9+0.1×0.75×0.8=0.96.
②记Y为n棵树苗的成活棵数,M(n)为n棵树苗的利润,
则Y~B(n,0.96),E(Y)=0.96n,M(n)=300Y-50(n-Y)=350Y-50n,
E(M(n))=350E(Y)-50n=286n,要使E(M(n))≥200000,则有n≥699.3.
所以该农户至少引种B种树苗700棵,就可获利不低于20万元.
均值与方差的实际应用
(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;反之,D(X)越小,X的取值越集中在E(X)附近,统计中常用来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
[即时训练] 3.(2019·湖南师大附中考前演练五)随着国内电商的不断发展,快递业也进入了高速发展时期,按照国务院的发展战略布局,以及国家邮政管理总局对快递业的宏观调控,某快递收取快递费的标准是:重量不超过1 kg的包裹收费10元;重量超过1 kg的包裹,在收费10元的基础上,每超过1 kg(不足1 kg,按1 kg计算)需再收5元.某县该快递分代办点将最近承揽的100件包裹的重量统计如下:
重量(单位:kg) | (0,1] | (1,2] | (2,3] | (3,4] | (4,5] |
件数 | 43 | 30 | 15 | 8 | 4 |
对近60天,每天揽件数量统计如下表:
件数范围 | 0~100 | 101~200 | 201~300 | 301~400 | 401~500 |
件数 | 50 | 150 | 250 | 350 | 450 |
天数 | 6 | 6 | 30 | 12 | 6 |
以上数据已做近似处理,将频率视为概率.
(1)计算该代办点未来5天内不少于2天揽件数在101~300之间的概率;
(2)①估计该代办点对每件包裹收取的快递费的平均值;
②根据以往的经验,该代办点将快递费的三分之一作为前台工作人员的工资和公司利润,其余的用作其他费用.目前该代办点前台有工作人员3人,每人每天揽件不超过150件,日工资110元.代办点正在考虑是否将前台工作人员裁减1人,试计算裁员前后代办点每日利润的数学期望,若你是决策者,是否裁减工作人员1人?
解 (1)由题意,可得样本中每天揽件数在101~300之间的天数为36,频率f==,故可估计每天揽件数在101~300之间的概率为,显然未来5天中,每天揽件数在101~300之间的天数X服从二项分布,即X~B,故所求概率为1-P(X=0)-P(X=1)=1-C×5-C××4=.
(2)①样本中快递费用及包裹件数如下表:
包裹重量(单位:kg) | 1 | 2 | 3 | 4 | 5 |
快递费(单位:元) | 10 | 15 | 20 | 25 | 30 |
包裹件数 | 43 | 30 | 15 | 8 | 4 |
故样本中每件包裹收取的快递费的平均值为
=15,
故估计该代办点对每件包裹收取的快递费的平均值为15元.
②代办点不应将前台工作人员裁员1人,理由如下:
根据题意及(2)①,揽件数每增加1,代办点快递收入增加15(元),
若不裁员,则每天可揽件的上限为450件,代办点每日揽件数情况如下:
包裹 件数范围 | 0~100 | 101~200 | 201~300 | 301~400 | 401~500 |
包裹件数 (近似处理) | 50 | 150 | 250 | 350 | 450 |
实际 揽件数 | 50 | 150 | 250 | 350 | 450 |
频率 | 0.1 | 0.1 | 0.5 | 0.2 | 0.1 |
平均 揽件数 | 50×0.1+150×0.1+250×0.5+350×0.2+450×0.1=260 |
故代办点平均每日利润的期望值为260×15×-3×110=970(元),
若裁员1人,则每天可揽件的上限为300件,代办点每日揽件数情况如下:
包裹 件数范围 | 0~100 | 101~200 | 201~300 | 301~400 | 401~500 |
包裹件数 (近似处理) | 50 | 150 | 250 | 350 | 450 |
实际 揽件数 | 50 | 150 | 250 | 300 | 300 |
频率 | 0.1 | 0.1 | 0.5 | 0.2 | 0.1 |
平均 揽件数 | 50×0.1+150×0.1+250×0.5+300×0.2+300×0.1=235 |
则代办点平均每日利润的期望值为235×15×-2×110=955(元),
故代办点不应将前台工作人员裁员1人.
考向三 正态分布
例4 (1)设随机变量ξ服从正态分布N(3,4),若P(ξ<2a-3)=P(ξ>a+2),则a的值为( )
A.5 B.3
C. D.
答案 D
解析 因为ξ服从正态分布N(3,4),P(ξ<2a-3)=P(ξ>a+2),所以x=2a-3与x=a+2关于x=3对称,所以=3,即3a=7,解得a=.故选D.
(2)(2019·山东淄博模拟)设每天从甲地去乙地的旅客人数为随机变量X,且X~N(800,502).则一天中从甲地去乙地的旅客人数不超过900的概率为( )
参考数据:若X~N(μ,σ2),有P(μ-σ<X≤μ+σ)=0.6826,P(μ-2σ<X≤μ+2σ)=0.9544,P(μ-3σ<X≤μ+3σ)=0.9974.
A.0.9772 B.0.6826
C.0.9974 D.0.9544
答案 A
解析 ∵X~N(800,502),∴P(700<X≤900)=0.9544,∴P(X>900)==0.0228,∴P(X≤900)=1-0.0228=0.9772.故选A.
正态分布下的概率计算常见的两类问题
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1的性质.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
[即时训练] 4.若随机变量ξ服从正态分布N(0,1),已知P(ξ<-1.96)=0.025,则P(|ξ|<1.96)=( )
A.0.025 B.0.050
C.0.950 D.0.975
答案 C
解析 由随机变量ξ服从正态分布N(0,1),得P(ξ<1.96)=1-P(ξ≤-1.96),所以P(|ξ|<1.96)=P(-1.96<ξ<1.96)=P(ξ<1.96)-P(ξ≤-1.96)=1-2P(ξ≤-1.96)=1-2P(ξ<-1.96)=1-2×0.025=0.950.
5.设X~N(1,1),其正态分布密度曲线如图所示,那么向正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是( )
注:若X~N(μ,σ2),则P(μ-σ<X<μ+σ)=68.26%,P(μ-2σ<X<μ+2σ)=95.44%.
A.7539 B.6038
C.7028 D.6587
答案 D
解析 ∵X~N(1,1),∴μ=1,σ=1,∵P(μ-σ<X<μ+σ)=68.26%,∴则P(0<X<2)=68.26%,则P(1<X<2)=34.13%,∴阴影部分的面积为1-0.3413=0.6587.∴向正方形ABCD中随机投掷10000个点,落入阴影部分的点的个数的估计值是10000×=6587.故选D.
学科素养培优(二十三)
正态分布与概率、统计的综合题
(2019·安徽六校教育研究会第一次素质测试)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组数据用该区间的中点值作代表,记作xi,i=1,2,…,7);
(2)由频率分布直方图可以认为,这种产品的质量指标值X服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①若使84.13%的产品的质量指标值高于企业制定的合格标准,则合格标准的质量指标值大约为多少?
②若该企业又生产了这种产品1000件,且每件产品相互独立,则这1000件产品质量指标值不低于12.14的件数最有可能是多少?
附:参考数据与公式:(xi-)2hi=3.46,3.46≈×2.632;若X~N(μ,σ2),则P(μ-σ<X≤μ-σ)=0.6826;P(μ-2σ<X≤μ+2σ)=0.9544;P(μ-3σ<X≤μ+3σ)=0.9974.
解 (1)=12×0.04+14×0.12+16×0.28+18×0.36+20×0.10+22×0.06+24×0.04=17.4,
s2=(xi-)2hi×2=3.46×2=6.92.
(2)①由题意X~N(17.4,692),
则P(X>μ-σ)=+≈0.8413,
∴当μ-σ=17.4-2.63=14.77时,满足题意,即合格标准的质量指标值约为14.77.
②由P(X≥12.14)=P(X≥μ-2σ)=0.5+≈0.9772,可知每件产品的质量指标值不低于12.14的事件概率为0.9772,记这1000件产品的质量指标值不低于12.14的件数为ξ,则ξ~B(103,p),其中p=0.9772,
∴恰有k件产品的质量指标值不低于12.14的事件概率P(ξ=k)=Cpk(1-p)1000-k,则=>1,解得k<1001p=978.1772,∴当0≤k≤978时,P(ξ=k-1)<P(ξ=k),当979≤k≤1000时,P(ξ=k-1)>P(ξ=k),由此可知,在这1000件产品中,质量指标值不低于12.14的件数最有可能是978.
答题启示
本题考查正态分布、概率统计问题的综合,是在知识网络的交汇处命制的一道较为新颖的试题.正态分布与统计案例有些知识点是所谓的高考“冷点”,由于考生对这些“冷点”的内容重视不够,复习不全面,一旦这些“冷点”知识出了考题,虽然简单但也做错,甚至根本不会做,因而错误率相当高.此题告诉我们必须全面掌握每一个知识点.
对点训练
(2019·山东青岛模拟)“爱国,是人世间最深层、最持久的情感,是一个人的立德之源、立功之本.”在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:
x | 2 | 3 | 4 | 6 | 8 | 10 | 13 | 21 | 22 | 23 | 24 | 25 |
y | 13 | 22 | 31 | 42 | 50 | 56 | 58 | 68.5 | 68 | 67.5 | 66 | 66 |
当0<x≤17时,建立了y与x的两个回归模型:
模型①:=4.1x+11.8;模型②:=21.3-14.4;
当x>17时,y与x满足的线性回归方程为
=-0.7x+a.
(1)根据下列表格中的数据,比较当0<x≤17时模型①、②的相关指数R2,并选择拟合精度更高、更可靠的模型预测对“东方红”款汽车发动机科技改造的投入为17亿元时的直接收益;
回归模型 | 模型① | 模型② |
回归方程 | =4.1x+11.8 | =21.3-14.4 |
(yi-i)2 | 182.4 | 79.2 |
(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小;
(3)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布N(0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予奖励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励5万元.求每台发动机获得奖励的数学期望.
附:刻画回归效果的相关指数R2=1-,≈4.1.
用最小二乘法求线性回归方程y=bx+a的系数公式==,=- .
随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=0.6826,P(μ-2σ<ξ<μ+2σ)=0.9544.
解 (1)由表格中的数据,有182.4>79.2,即>,
所以模型①的R2小于模型②,说明回归模型②刻画的拟合效果更好.所以当x=17亿元时,科技改造直接收益的预测值为=21.3×-14.4≈21.3×4.1-14.4=72.93(亿元).
(2)由已知,得-20==3,所以=23,-60==7.2,则=67.2.
所以a=+0.7=67.2+0.7×23=83.3,即当x>17亿元时,y与x满足的线性回归方程为=-0.7x+83.3.所以当x=20亿元时,科技改造直接收益的预测值=-0.7×20+83.3=69.3.
当x=20亿元时,实际收益的预测值为69.3+10=79.3亿元>72.93亿元,即科技改造投入20亿元时,公司的实际收益的更大.
(3)因为P(0.52-0.02<X<0.52+0.02)=0.9544,
所以P(X>0.50)==0.9772,
P(X≤0.50)==0.0228,
又P(0.52-0.01<X<0.52+0.01)=0.6826,
所以P(X>0.53)==0.1587,
则P(0.50<X≤0.53)=0.9772-0.1587=0.8185.
设每台发动机获得的奖励为Y(万元),则Y的分布列如下,
Y | 0 | 2 | 5 |
P | 0.0228 | 0.8185 | 0.1587 |
则每台发动机获得奖励的数学期望为E(Y)=0×0.0228+2×0.8185+5×0.1587=2.4305(万元).
=-1200金.