广西专用高考数学一轮复习高考大题增分专项六高考中的概率统计与统计案例课件新人教A版理
展开从近五年的高考试题来看,在高考的解答题中,对概率、统计与统计案例的考查主要有三个方面:一是统计与统计案例,其中回归分析、独立性检验,用样本的数字特征估计总体的数字特征是考查重点,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查;二是统计与概率分布的综合,常与抽样方法、茎叶图、频率分布直方图、频率、概率以及概率分布列等知识交汇考查;三是均值与方差的综合应用,常用离散型随机变量、概率、相互独立事件、二项分布等知识交汇考查.
例1某地区2012年至2018年农村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2012年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.
对点训练1下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①: =-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②: =99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
(2)利用模型②得到的预测值更可靠.理由如下:a.从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线 =-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型 =99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
b.从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)
有关独立性检验的问题的解题步骤:(1)作出2×2列联表;(2)计算随机变量χ2的值;(3)查临界值,检验作答.
例2(2020全国Ⅲ,理18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
解:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
(3)根据所给数据,可得2×2列联表:
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
对点训练2某市气象部门对该市中心城区近四年春节期间(每年均统计春节假期的前7天)的空气污染指数进行了统计分析,且按是否燃放鞭炮分成两组,得到茎叶图如图所示,根据国家最新标准,空气污染指数不超过100的表示没有雾霾,超过100的表示有雾霾.(1)若从茎叶图有雾霾的14天中随机抽取2天,用随机变量ξ表示被抽中且未燃放鞭炮的天数,求ξ的分布列及均值;(2)通过茎叶图填写下面的2×2列联表,并判断在犯错误的概率不超过多少时可以认为燃放鞭炮与产生雾霾有关?
所以在犯错误的概率不超过0.025的前提下认为该城市燃放鞭炮与产生雾霾天气有关.
(1)直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的事件或独立重复试验问题,然后用相应概率公式求解.(2)间接法:当复杂事件正面情况比较多,反面情况较少时,可利用其对立事件进行求解,即“正难则反”.对于“至少”“至多”等问题往往用这种方法求解.
例3某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求事件C发生的概率.
解:(1)两地区用户满意度评分的茎叶图如图所示. 通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”;CA2表示事件:“A地区用户的满意度等级为非常满意”;CB1表示事件:“B地区用户的满意度等级为不满意”;CB2表示事件:“B地区用户的满意度等级为满意”,
则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1∪CB2CA2.P(C)=P(CB1CA1∪CB2CA2)=P(CB1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2).
对点训练3某市为准备参加省中学生运动会,对本市甲、乙两个田径队的所有跳高运动员进行了测试,将全体运动员的成绩绘制成频率分布直方图,同时用茎叶图表示甲、乙两队运动员本次测试的成绩(单位:cm,且均为整数).由于某些原因,茎叶图中乙队的部分数据丢失,但已知所有运动员中成绩在190 cm以上(包括190 cm)的只有两个人,且均在甲队.规定:跳高成绩在185 cm以上(包括185 cm)定义为“优秀”.(1)求甲、乙两队运动员的总人数a及乙队中成绩在区间[160,170) (单位:cm)内的运动员人数b;(2)从甲、乙两队所有成绩在180 cm以上的运动员中随机选取2人,已知至少有1人成绩为“优秀”,求两人成绩均为“优秀”的概率;
(3)从甲、乙两队中所有的成绩为“优秀”的运动员中随机选取2人参加省中学生运动会正式比赛,求所选取的运动员中来自甲队的人数X的分布列.
解:(1)由频率分布直方图可知,成绩在190 cm以上(包含190 cm)的运动员的频率为0.005×10=0.05,
∴成绩在区间[160,170)内的运动员的频率为0.03×10=0.3,人数为40×0.3=12.由茎叶图可知,甲队成绩在区间[160,170)内的运动员有3名,∴b=12-3=9(人).
(2)由频率分布直方图可得,成绩在180 cm以上的运动员总人数为(0.020+0.005)×10×40=10.由茎叶图可得,甲、乙两队成绩在180 cm以上的人数恰好为10,所以乙在这部分的数据不缺失,且优秀的总人数为6.设事件A为“至少有1人成绩优秀”,事件B为“两人成绩均为优秀”,
(3)X的可能取值为0,1,2,
突破策略一 用字母表示事件法处理独立事件、互斥事件的概率分布列、均值问题使用简洁、准确的数学语言描述解答过程是解答这类问题并得分的根本保证.引进字母表示事件可使得事件的描述简单而准确,使得问题描述有条理,不会有遗漏,也不会重复.
例4在某娱乐节目的一期比赛中,有6名歌手(1至6号)登台演出,由现场的百家大众媒体投票选出最受欢迎的歌手,各家媒体独立地在投票器上选出3名候选人,其中媒体甲是1号歌手的歌迷,他必选1号,另在2号至6号中随机选出2名;媒体乙不欣赏2号歌手,他必不选2号;媒体丙对6名歌手的演唱没有偏爱,因此在1至6号歌手中随机地选出3名.(1)求媒体甲选中3号且媒体乙未选中3号歌手的概率;(2)X表示3号歌手得到媒体甲、乙、丙的票数之和,求X的分布列及均值.
对点训练4某电视台推出一档游戏类综艺节目,选手面对1~5号五扇大门,依次按响门上的门铃,门铃会播放一段音乐,选手需正确回答这首歌的名字,回答正确,大门打开,并获得相应的家庭梦想基金,正确回答每一扇门后,选手可自由选择带着目前奖金离开,还是继续挑战后面的门以获得更多的梦想基金,但是一旦回答错误,游戏结束并将之前获得的所有梦想基金清零;在整个游戏过程中,选手有一次求助机会,选手可以询问亲友团成员以获得正确答案.
1~5号门对应的家庭梦想基金依次为3 000元、6 000元、8 000元、12 000元、24 000元(以上基金金额为打开大门后的累积金额).设某选手正确回答每扇门的歌曲名字的概率均为Pi,且 (1)求选手在第三扇门使用求助机会且最终获得12 000元家庭梦想基金的概率;(2)若选手在整个游戏过程中不使用求助机会,且获得的家庭梦想基金数额为X元,求X的分布列和均值.
解 (1)记“选手正确回答第i扇门歌曲名字”为事件Ai(i=1,2,…,5),“亲友团正确回答歌曲名字”为事件B,“回答正确后选择继续挑战”为事件C,则对应事件的概率分别为
突破策略二 用公式法求古典概型的概率及其分布列求有关古典概型的概率,首先根据古典概型的特点(有限性和等可能性)进行判断,然后利用排列组合的知识分别求基本事件数和所求事件包含的基本事件数,最后代入概率公式求解.
例5在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示.通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率.(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列与数学期望E(X).
解:(1)记接受甲种心理暗示的志愿者中包含A1但不包含B1的事件为M,
因此X的分布列为X的数学期望是
对点训练5某校校庆,某班共来了n名校友(n>8,n∈N),其中女校友6名,组委会对这n名校友登记制作了一份校友名单,现随机从中选出2名校友代表,若选出的2名校友是一男一女,则称为“最佳组合”.(1)若随机选出的2名校友代表为“最佳组合”的概率不小于 ,求n的最大值;(2)当n=12时,设选出的2名校友代表中女校友人数为X,求随机变量X的分布列和均值E(X).
突破策略三 在条件概率与其分布列的综合问题中要理清P(A|B)与P(AB)的区别与联系(1)发生时间不同:在P(A|B)中,事件A,B的发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.(2)样本空间不同:在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为总的样本空间,因而有P(A|B)≥P(AB).
例6某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:设该险种一续保人一年内出险次数与相应概率如下:(1)求一续保人本年度的保费高于基本保费的概率;(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;(3)求续保人本年度的平均保费与基本保费的比值.
解:(1)设A表示事件:“一续保人本年度的保费高于基本保费”,则事件A发生当且仅当一年内出险次数大于1,故P(A)=0.2+0.2+0.1+0.05=0.55.(2)设B表示事件:“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)=0.1+0.05=0.15.又P(AB)=P(B),
(3)记续保人本年度的保费为X,则X的分布列为E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.因此续保人本年度的平均保费与基本保费的比值为1.23.
对点训练6某市环保知识竞赛由甲、乙两支代表队进行总决赛,每队各有3名队员,首轮比赛每人一道必答题,答对则为本队得1分,答错或者不答都得0分,已知甲队3人答对的概率分别为 ,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分.(1)求随机变量ξ的分布列及其均值E(ξ);(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率.
例7某工厂的检验员为了检测生产线上生产零件的情况,从产品中随机抽取了80个进行测量,根据所测量的数据画出频率分布直方图如下:
注:尺寸数据在区间[63.0,64.5)内的零件为合格品,频率作为概率.
(1)从产品中随机抽取4件,合格品的个数为ξ,求ξ的分布列与期望;(2)从产品中随机抽取n件,全是合格品的概率不小于0.3,求n的最大值;(3)为了提高产品合格率,现提出A,B两种不同的改进方案进行试验.若按A方案进行试验后,随机抽取15件产品,不合格个数的期望是2;若按B方案试验后,抽取25件产品,不合格个数的期望是4,你会选择哪个改进方案?
解:(1)由频率分布直方图可知,抽出产品为合格品的频率为(0.75+0.65+0.2)×0.5=0.8,即抽出产品为合格品的概率为 .从产品中随机抽取4件,合格品的个数ξ的所有可能取值为0,1,2,3,4,
(3)按A方案随机抽取产品不合格的概率是a,随机抽取15件产品,不合格个数X~B(15,a);按B方案随机抽取产品不合格的概率是b,随机抽取25件产品,不合格个数Y~B(25,b);
对点训练7某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖,每次抽奖都是从装有除颜色外其他完全相同的4个红球、6个白球的甲箱和装有5个红球、5个白球的乙箱中,各随机摸出1个球,在摸出的2个球中,若都是红球,则获一等奖;若只有1个红球,则获二等奖;若没有红球,则不获奖.(1)求顾客抽奖1次能获奖的概率;(2)若某顾客有3次抽奖机会,记该顾客在3次抽奖中获一等奖的次数为X,求X的分布列、均值和方差.
解 (1)记事件A1为“从甲箱中摸出的1个球是红球”,A2为“从乙箱中摸出的1个球是红球”,B1为“顾客抽奖1次获一等奖”,B2为“顾客抽奖1次获二等奖”,C为“顾客抽奖1次能获奖”.
解决与正态分布有关的问题,在理解μ,σ2的意义情况下,记清正态分布的密度曲线是一条关于μ对称的钟形曲线,很多问题都是利用图象的对称性解决的.
例8从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(1)求这500件产品质量指标值的样本平均数 和样本方差s2(同一组中的数据用该组区间的中点值作代表).
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数 ,σ2近似为样本方差s2.①利用该正态分布,求P(187.8
(1)根据样本数据,可近似地认为学生的旅游费用支出Z服从正态分布N(51,152),若该所大学共有学生45 000人,试估计有多少名同学的旅游费用支出在8 100元以上;(2)已知样本数据中旅游费用支出在区间[80,100)内的9名学生中有5名男生、4名女生,现想选其中3名学生回访,记选出的女生人数为Y,求Y的分布列与数学期望.附:若X~N(μ,σ2),则P(μ-σ
该校旅游费用支出在8 100元以上的人数为45 000×0.022 8= 1 026(人).(2)由题意可得,Y的可能取值有0,1,2,3,共4种情况,
广西专用高考数学一轮复习高考大题增分专项四高考中的立体几何课件新人教A版文: 这是一份广西专用高考数学一轮复习高考大题增分专项四高考中的立体几何课件新人教A版文,共26页。PPT课件主要包含了-2-,-3-,题型一,题型二,题型三,-4-,-5-,-6-,-7-,-8-等内容,欢迎下载使用。
广西专用高考数学一轮复习高考大题增分专项四高考中的立体几何课件新人教A版理: 这是一份广西专用高考数学一轮复习高考大题增分专项四高考中的立体几何课件新人教A版理,共41页。PPT课件主要包含了-2-,-3-,题型一,题型二,题型三,题型四,-4-,-5-,-6-,-7-等内容,欢迎下载使用。
广西专用高考数学一轮复习高考大题增分专项五高考中的解析几何课件新人教A版文: 这是一份广西专用高考数学一轮复习高考大题增分专项五高考中的解析几何课件新人教A版文,共41页。PPT课件主要包含了-2-,-3-,题型一,题型二,题型三,题型四,题型五,题型六,-4-,-5-等内容,欢迎下载使用。