2019届二轮复习高考解答题突破(六) 概率与统计学案(全国通用)
展开
高考解答题突破(六) 概率与统计突破“两辨”——辨析、辨型[思维流程] [技法点拨]概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解.而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途.另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件、独立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件.考向一 离散型随机变量的均值与方差在解决离散型随机变量的均值与方差的问题时,要善于将复杂事件分解为较简单事件,对照相关概率类型,如互斥事件类型、相互独立事件类型、古典概型等,然后用相关公式求解. [解] (1)由频率分布直方图可知,日销售量不低于8吨的频率为2×(0.125+0.075)=0.4,记未来3天内,第i天日销售量不低于8吨为事件Ai(i=1,2,3),则P(Ai)=0.4, =0.4×0.4×(1-0.4)+(1-0.4)×0.4×0.4=0.192.(2)由(1)知,第i天日销售量不低于8吨的概率P(Ai)=0.4.依题意,X的可能取值为0,1,2,3, 解决离散型随机变量的均值与方差的关键(1)会判断,先判断事件的类型,再利用对立事件的概率公式、条件概率的公式等求解概率;(2)会计算,要求随机变量X的期望,需先求出X的所有可能取值,然后求出随机变量X取每个值时的概率,再利用随机变量的数学期望的定义进行计算. [对点训练]1.(2018·山东潍坊一模)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测.现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数μ=14,标准差σ=2,绘制如图所示的频率分布直方图.以频率值作为概率估计值.(1)从该生产线加工的产品中任意抽取一件,记其数据为X,依据以下不等式评判(P表示对应事件的概率):①P(μ-σ<X<μ+σ)≥0.6826;②P(μ-2σ<X<μ+2σ)≥0.9544;③P(μ-3σ<X<μ+3σ)≥0.9974,评判规则:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在(μ-2σ,μ+2σ)内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为Y,求Y的分布列与数学期望E(Y).[解] (1)由频率分布直方图可得:P(12<X<16)=(0.29+0.11)×2=0.8>0.6826P(10<X<18)=(0.04+0.29+0.11+0.03)×2=0.94<0.9544P(8<X<20)=(0.005+0.04+0.29+0.11+0.03+0.015)×2=0.98<0.9974∴符合①,不符合②③,故该生产线需要检修.(2)100件产品中,次品个数为100×(1-0.94)=6,正品个数为94,∴Y的所有可能取值为0,1,2,其中P(Y=0)==,P(Y=1)==,P(Y=2)==.∴Y的分布列为Y012P∴Y的数学期望为E(Y)=0×+1×+2×=.考向二 线性回归分析与独立性检验1.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.独立性检验的关键是根据2×2列联表准确计算出K2,再做判断. [解题指导] →→→[解] (1)记“至少有一个大于600”为事件A,则P(A)=1-=.==600.∴===0.3,=-=600-0.3×556=433.2,故特征量x为570时,特征量y的估计值为604.2.线性回归分析与独立性检验问题的关注点(1)由回归方程分析得出的数据只是预测值不是精确值,此类问题的易错点是方程中的计算,代入公式计算要细心.(2)独立性检验是指利用2×2列联表,通过计算随机变量K2来确定在多大程度上两个分类变量有关系的方法.[对点训练]2.(2018·山西太原模拟)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:分钟)进行调查,将收集的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图(如图),将日均课外体育锻炼时间不低于40分钟的学生评价为“课外体育达标”.(1)请根据直方图中的数据填写下面的2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关? 课外体育不达标课外体育达标合计男60 女110 合计 (2)现按照“课外体育达标”与“课外体育不达标”进行分层抽样,抽取8人,再从这8名学生中随机抽取3人参加体育知识问卷调查,记“课外体育不达标”的人数为ξ,求ξ的分布列和数学期望.附:K2=.P(K2≥k00.150.050.0250.0100.0050.001k02.0723.8415.0246.6357.87910.828[解] (1)由题意得“课外体育达标”人数为200×[(0.02+0.005)×10]=50,则“课外体育不达标”人数为150,∴列联表如下: 课外体育不达标课外体育达标合计男603090女9020110合计15050200∴K2==≈6.061<6.635.∴在犯错误的概率不超过0.01的前提下不能认为“课外体育达标”与性别有关.(2)由题意采用分层抽样在“课外体育达标”的学生中抽取2人,在“课外体育不达标”的学生中抽取6人,由题意知:ξ的所有可能取值为1,2,3,P(ξ=1)===;P(ξ=2)===;P(ξ=3)===.故ξ的分布列为ξ123P故ξ的数学期望为E(ξ)=1×+2×+3×=.专题跟踪训练(三十一)1.(2018·东北四校联考)一个袋中有大小、质地完全相同的4个红球和1个白球,共5个球,现从中每次随机取出2个球,若取出的有白球必须把白球放回去,红球不放回,然后取第二次,第三次,……,直到把红球取完只剩下1个白球为止.用ξ表示终止时取球的次数.(1)求ξ=2的概率;(2)求ξ的分布列及数学期望.[解] (1)∵随机变量ξ=2表示从袋中随机取球2次且每次取的都是红球,∴P(ξ=2)=×=,即ξ=2的概率为.(2)由题意知随机变量ξ的所有可能取值为2,3,4,由(1)知P(ξ=2)=.又P(ξ=4)=×××=,∴P(ξ=3)==,∴ξ的分布列为ξ234PE(ξ)=2×+3×+4×=.2.(2018·北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk=1”表示第k类电影得到人们喜欢,“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差D(ξ1),D(ξ2),D(ξ3),D(ξ4),D(ξ5),D(ξ6)的大小关系.[解] (1)由题意知,样本电影的总部数是140+50+300+200+800+510=2000,第四类电影中获得好评的电影部数是200×0.25=50.故所求概率是=0.025.(2)设事件A为“从第四类电影中随机选出的电影获得好评”,事件B为“从第五类电影中随机选出的电影获得好评”.故所求概率为P(A+B)=P(A)+P(B)=P(A)(1-P(B))+(1-P(A))P(B).由题意知:P(A)估计为0.25,P(B)估计为0.2.故所求概率估计为0.25×0.8+0.75×0.2=0.35.(3)D(ξ1)>D(ξ4)>D(ξ2)=D(ξ5)>D(ξ3)>D(ξ6).3.(2018·广州测试)某单位共10名员工,他们某年的收入如下表:(1)求该单位员工当年年薪的平均值和中位数;(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?附:线性回归方程=x+中系数计算公式=,=-,其中,表示样本均值.[解] (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2.P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,所以ξ的分布列为ξ012P数学期望为E(ξ)=0×+1×+2×=.(3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5 (xi-)2=2.25+0.25+0.25+2.25=5, (xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,===1.4.=-=5-1.4×2.5=1.5,因此线性回归方程为=1.4x+1.5,可预测该员工第5年的年薪收入约为8.5万元.4.已知鸡的产蛋量与鸡舍的温度有关.为了确定某一个时段鸡舍的控制温度,某企业需要了解鸡舍的时段控制温度x(单位:℃)对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响.为此,该企业选取了7个鸡舍的时段控制温度xi和产蛋量yi(i=1,2,…7,)的数据,对数据初步处理后得到了如图所示的散点图及一些统计量的值. 其中ki=lnyi,=ki.(1)根据散点图判断,y=bx+a与y=c1ec2x(e为自然对数的底数)哪一个适宜作为该种鸡的时段产蛋量y关于鸡舍的时段控制温度x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断及表中的数据,建立y关于x的回归方程;(3)已知时段投入成本z与x,y的关系为z=e-2.5y-0.1x+10,当鸡舍的时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值是多少?附:对于一组具有线性相关关系的数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为=,=-.参考数据:e-2.5e-0.75ee3e70.080.472.7220.091096.63[解] (1)由题中散点图可以判断,y=c1ec2x适宜作为该种鸡的时段产蛋量y关于鸡舍的时段控制温度x的回归方程类型.(2)令k=lny,建立k关于x的线性回归方程k=dx+c(d=c2,c=lnc1).由题意,得===0.25,=-=3.60-0.25×17.40=-0.75,所以k关于x的线性回归方程为=0.25x-0.75,c2=0.25,c1=e-0.75=0.47,故y关于x的回归方程为=0.47e0.25x.(3)由(2)知,当x=28时,鸡的时段产蛋量y的预报值=0.47e0.25×28=0.47e7=0.47×1096.63≈515.42(t),时段投入成本z的预报值=e-2.5×515.42-0.1×28+10=0.08×515.42-2.8+10≈48.43(万元).