第二篇专题四第2课时概率与统计案例的综合应用 2022版高考数学复习讲义
展开第2课时 概率与统计案例的综合应用概率与独立性检验的综合应用【典例1】(2020·全国Ⅲ卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 [0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 人次≤400人次>400空气质量好 空气质量不好 附:K2=,P(K2≥k)0.0500.0100.001k3.8416.63510.828【思维点拨】(1)用频率估计概率(2)利用频率分布表平均数的计算公式计算(3)求K2的观测值,利用独立性检验的方法判断【解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为=0.43,等级为2的概率为=0.27,等级为3的概率为=0.21,等级为4的概率为=0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为=350.(3)2×2列联表如下: 人次≤400人次>400空气质量好3337空气质量不好228K2的观测值k=≈5.820>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 本例(3)改为:若某天的空气质量等级为1,则称这天“空气质量好”;若某天的空气质量等级为2或3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 人次≤400人次>400空气质量好 空气质量不好 【解析】2×2列联表如下: 人次≤400人次>400空气质量好1825空气质量不好3720K2的观测值k=≈5.262>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.解决独立性检验问题的关键是过好三关 (1)假设关:假设两个分类变量无关;(2)公式关:把相关数据代入独立性检验公式求卡方;(3)对比关:将求出的卡方观测值与临界值比对,作出准确判断. (2021·张家口二模)某中学的学习兴趣小组随机调查了该校110名学生的到校形式,整理后得到如下的2×2列联表: 父母接送独自到校总计男204060女302050合计5060110(1)根据列联表的数据判断,能否在犯错误的概率不超过0.01的前提下认为到校形式与性别有关系?(2)若以上述样本的频率作为概率,在该校中随机抽取6人,用X表示6人中“独自到校”的人数,求X的数学期望和方差.附表:P(K2≥k)0.1000.050.0250.0100.001k2.7063.8415.0246.63510.828附:K2=.【解析】(1)K2的观测值k==≈7.822>6.635,所以能在犯错误的概率不超过0.01的前提下认为到校形式与性别有关系;(2)X可能取0,1,2,3,4,5,6,若以上述样本的频率作为概率,在该校中随机抽取1人为“独自到校”的概率为,在该校中随机抽取6人,可视为6次独立重复试验,所以X~B(6,),故E(X)=6×=,D(X)=6××(1-)=.概率与回归分析的综合应用【典例2】(2021·银川二模)某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量y(g)与尺寸x(mm)之间近似满足关系式y=c·xb(b,c为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间(,)内时为优等品.现随机抽取6件合格产品,测得数据如下:尺寸x(mm)384858687888质量y(g)16.818.820.722.42425.5质量与尺寸的比0.4420.3920.3570.3290.3080.290(1)现从抽取的6件合格产品中再任选2件,求恰有一件优等品的概率;(2)根据测得数据作出如下处理:令vi=ln xi,ui=ln yi,得相关统计量的值如表:iuiii75.324.618.3101.4(ⅰ)根据所给统计量,求y关于x的回归方程;(ⅱ)已知优等品的收益z(单位:千元)与x,y的关系为z=2y-0.32x,当优等品的质量与尺寸之比为时,求其收益的预报值.(精确到0.1)附:对于样本(vi,ui)(i=1,2,…,n),其回归直线u=b·v+a的斜率和截距的最小二乘估计公式分别为:=,=-,e≈2.718 2.【思维点拨】(1)根据优等品的条件确定抽取产品中优等品与非优等品的数量.(2)根据所给处理方法,把非线性回归问题转化为线性回归问题.【规范解答】(1)由已知,优等品的质量与尺寸的比在区间(,)内,即∈(0.302,0.388)则随机抽取的6件合格产品中,有3件为优等品A1,A2,A3,3件为非优等品B1,B2,B3现从中任选2件,共有(A1,A2)、(A1,A3)、(A1,B1)、(A1,B2)、(A1,B3)、(A2,A3)、(A2,B1)、(A2,B2)、(A2,B3)、(A3,B1)、(A3,B2)、(A3,B3)、(B1,B2)、(B1,B3)、(B2,B3)15种方法,2分设任选2件恰有一件优等品为事件C,则事件C包含(A1,B1)、(A1,B2)、(A1,B3)、(A2,B1)、(A2,B2)、(A2,B3)、(A3,B1)、(A3,B2)、(A3,B3)共9种方法,由古典概型得所求概率为P(C)==.4分易错点随机抽取的6件合格产品中优等品与非优等品的数量计算错误.障碍点优等品的条件及分层抽样的原则.学科素养数据分析、数学运算、数学建模评分细则求对样本中优等品与非优等品的数量得1分;写对事件C所包含的基本事件得1分.(2)对y=c·xb(b,c>0)两边取自然对数ln y=ln c+b ln x,由vi=ln xi,ui=ln yi,得u=b·v+a,且a=ln c.6分(ⅰ)根据所给统计量及最小二乘估计公式有===,=-=(18.3-×24.6)÷6=1,得=ln=1,故=e.8分所求y关于x的回归方程为y=e·x;9分(ⅱ)由(ⅰ)可知,=e·x,则=2e-0.32x.当===,即=8,x=64时,得收益的预报值=16e-0.32×64≈23.0(千元).12分易错点回归系数计算错误.障碍点借助题设信息实现非线性回归方程与线性回归方程的转换.学科素养数据分析、数学运算、数学建模评分细则求对得1分;写对z关于x的方程得1分. 进行回归分析的一般思路(1)定关系:依据样本数据散点图或相关系数r,确定两个变量是否具有较强的相关关系.(2)算各值:分别计算,,,iyi的值.(3)求系数:求出回归系数,.(4)写方程:=x+.(5)作预测:依据回归方程给出预测值.提醒:非线性回归分析可借助代数变换转化为线性回归分析. 某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x(℃)与该奶茶店的这种饮料销量y(杯),得到如下数据:日期1月11日1月12日1月13日1月14日1月15日平均气温x(℃)91012118销量y(杯)2325302621(1)若先从这五组数据中抽出2组,求抽出的2组数据恰好是相邻2天数据的概率;(2)请根据所给五组数据,求出y关于x的线性回归方程=x+;(3)根据(2)中所得的线性回归方程,若天气预报1月16日的白天平均气温为7(℃),请预测该奶茶店这种饮料的销量.附:线性回归方程=x+中,其中,为样本平均量.【解析】(1)设“抽出的2组数据恰好是相邻2天数据”为事件A,所有基本事件(m,n)(其中m,n为1月份的日期数)有:(11,12),(11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14),(13,15),(14,15),共有10种,事件A包括的基本事件有(11,12),(12,13),(13,14),(14,15)共4种.所以P(A)==.(2)由数据,求得==10,==25,由公式,求得=2.1,=-=4,所以y关于x的线性回归方程为=2.1x+4.(3)当x=7时,=2.1×7+4=18.7,所以该奶茶店这种饮料的销量大约为19杯.