专题8概率(文)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案
展开
这是一份专题8概率(文)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共14页。
专题8概率(文)知识点与大题16道专练(中档题)(原卷版)知识点一:常见的概率类型与概率计算公式;类型一:古典概型;1、 古典概型的基本特点:(1) 基本事件数有限多个;(2) 每个基本事件之间互斥且等可能;2、 概率计算公式:A事件发生的概率;类型二:几何概型;1、 几何概型的基本特点:(1) 基本事件数有无限多个;(2) 每个基本事件之间互斥且等可能;2、 概率计算公式:A事件发生的概率;注意:(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的;例如:等腰中,角C=,则:(1) 若点M是线段AB上一点,求使得的概率;(2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求使得的概率;解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度之比,所求概率:;而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:; 知识点二:常见的概率计算性质;类型一:事件间的关系与运算;A+B(和事件):表示A、B两个事件至少有一个发生;(积事件):表示A、B两个事件同时发生;(对立事件):表示事件A的对立事件;类型二:复杂事件的概率计算公式;1、 和事件的概率:(1)特别的,若A与B为互斥事件,则:(2)对立事件的概率公式:知识点三:求解一般概率问题的步骤;第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等;第二步:确定事件的运算:和事件、积事件、条件概率等;第三步:运用相应公式,算出结果; 知识点三:常见的统计学数字特征量及其计算;特征量一:平均数(数学期望)计算公式一:;计算公式二:; 特征量二:中位数将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。 特征量三:众数将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。 特征量四:方差方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。计算公式一:;计算公式二:;计算公式三:;;知识点四:简单的统计学知识; 问题一:统计学中的简单的抽样方法;方法一:简单随机抽样;1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。2、 具体做法:①随机数字法 ; ② 抽签法;3、 优缺点分析:优点:基本原理比较简单;当总体容量不大时比较方便;抽样误差的计算较方便;缺点:对所有观察单位编号,当数量大时,有难度;方法二:系统抽样;1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本;2、 优缺点分析:优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小;缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;方法三:分层抽样;1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。2、 具体做法:第一步:计算每一层个体数与总体容量的比值;第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数;第三步:用简单随机抽样的方法产生样本;3、 优缺点分析:优点:在一定程度上控制了抽样误差,尤其是最优分配法;缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大;总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同; 知识点五:常用的几个统计学图表; 图表一:频率分布直方图与频率分布折线图;1、 说明几个基本概念:(1) 频数:符合某一条件的个体个数;(2) 频率:频率=;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)2、 认识频率分布直方图:(1) 横标是分组的情况;(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1;3、 画频率分布直方图:第一步:求极差;第二步:分组,确定组距;第三步:列频率分布表;第四步:作图;4、 画频率分布折线图:将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图;5、 利用频率分布直方图估计样本的统计学数字特征量:(1) 中位数:取图中方框面积和达到时的横坐标;(2) 众数:取最高的那个方框的中点横坐标;(3) 平均数:;其中表示第k组的中点横坐标,表示第k组的频率;(4) 方差:;图表二:茎叶图;定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;知识点六:变量间的相互关系与统计案例;1、相关关系的分类:从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。2、线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。3.最小二乘法求回归方程:(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+, 其中,b是回归方程的斜率,a是在y轴上的截距.4.样本相关系数:r= ,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.6.独立性检验:(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d (其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828注意:(1)越大相关性越强,反之越弱;(2)附表中P(K2≥k)是两个统计学变量无关的概率; 1.某校为了了解高三学生某次月考数学成绩的情况,抽取这次月考100名学生的数学成绩(分数都在内),按数学成绩分皮,,,,这5组,得到频率分布直方图如图所示.(1)估计这次月考该校高三学生数学成绩的中位数(结果保留一位小数);(2)若从数学成绩在内的学生中采用分层抽样的方法随机抽取5人,再从这5人中随机抽取2人,求至少有1人的数学成绩在内的概率.2.某地区脐橙近几年的产量统计如下表:年份20152016201720182019年份代码12345年产量(万吨)77.17.27.47.8(1)求年产量(万吨)关于年份代码的线性回归方程;(2)根据(1)中所求的回归方程预测该地区2021年脐橙的年产量.参考公式:,,,.3.某校对学生过红绿灯路口进行调查,在所有参与调查的人中,“跟从别人闯红灯”“从不闯红灯”“带头闯红灯”人数如表所示. 跟从别人闯红灯从不闯红灯带头闯红灯男生800450200女生100150300(1)在所有参与调查的人中,用分层抽样的方法取人,已知“跟从别人闯红灯”的人中抽取了45人,求的值;(2)在“带头闯红灯”的人中,将男生的200人编号为1,2,…,200;将女生的300人编号为201,202 ,…,500,用系统抽样的方法抽取4人参加“文明交通”宣传活动,若抽取的第一个人的编号为100,请指出抽取的另外三个号码;(3)在(2)的前提下,把抽取的4人看成一个总体,从这4人中任选2人,求这2人均是女生的概率.4.某牛蛙养殖户2013年至2019年牛蛙养殖纯收入(单位:万元)的数据如下表:年份2013201420152016201720182019年份代号(年)1234567牛蛙养殖纯收入(万元)2.93.33.64.44.85.25.9(1)求关于的线性回归方程;(2)记2020年的年份代号为,将代入(1)中的回归方程求得,请根据牛蛙养殖户2013年至2019年牛蛙养殖纯收入的数据表,估计2020年牛蛙养殖实际纯收入大于的概率.附:回归直线的斜率和截距的最小二乘法估计公式分别为:,5.为了了解某工厂生产的产品情况,从工厂一个月生产的产品中随机抽取了一个容量为200的样本,测最它们的尺寸(单位:mm),将数据分为,七组,其频率分布直方图如图所示.(1)求频率分布直方图中x的值;(2)记产品尺寸在内为A等品,每件可获利6元;产品尺寸在内为不合格品,每件亏损3元;其余的为合格品,每件可获利4元,若该工厂一个月共生产2000件产品,以样本的频率代替总体在各组的频率,求该工厂生产的产品一个月所获得的利润.6.某风景区对,两个旅游景点一周内的日游客数量(单位:千人)进行了一次调查,统计数据如下茎叶图所示.(1)以各组平均数为依据,试比较哪个景点更加吸引游客;(2)若,两个旅游景点的门票价格分别为20元/人和30元/人,以各景点平均日游客数量估计每日游客数量,预计该风景区在这两景点一个月(30天)的门票收入.7.某餐厅提供自助餐和点餐两种服务,其单人平均消费相近,为了进一步提高菜品及服务质量,餐厅从某日中午就餐的顾客中随机抽取了100人作为样本,得到以下数据表格.(单位:人次)满意度老年人中年人青年人自助餐点餐自助餐点餐自助餐点餐10分(满意)1212022015分(一般)22634120分(不满意)116232(1)由样本数据分析,三种年龄层次的人群中,哪一类更倾向于选择自助餐?(2)为了和顾客进行深人沟通交流,餐厅经理从点餐不满意的顾客中选取2人进行交流,求两人都是中年人的概率;(3)若你朋友选择到该餐厅就餐,根据表中的数据,你会建议你朋友选择哪种就餐方式?8.某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了名学生进行检测,实行百分制,现将所得的成绩按照,分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.分组频数频率 250.30100.10 合计1(1)求出表中及图中的值;(2)估计该校学生阅读素养的成绩中位数以及平均数. 9.现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如表:月收入(单位百元)频数510151055赞成人数4812632(1)由以上统计数据填下面列联表并问是否有99%的把握认为“月收入以5500为分界点”对“楼市限购令”的态度有差异; 月收入低于55百元的人数月收入不低于55百元的人数合计赞成 不赞成 合计 (2)若采用分层抽样在月收入在,的被调查人中共随机抽取6人进行追踪调查,并给予其中3人“红包”奖励,求收到“红包”奖励的3人中至少有1人收入在的概率.参考公式:,其中.参考数据:()0.0500.0100.0013.8416.63510.828 10.为了解国内不同年龄段的民众旅游消费基本情况,某旅游网站从其数据库中随机抽取了1000条客户信息进行分析,这些客户一年的旅游消费金额如下表:旅游消费(千元)合计年轻人(人)908070606040400中老年(人)559012513011090600把一年旅游消费金额满8千元的称为“高消费”,否则称为“低消费”.(1)从这些客户中随机选一人,求该客户是“高消费”的年轻人的概率;(2)完成列联表,并判断能否有99%的把握认为旅游消费高低与年龄有关. 低消费高消费合计年轻人(人) 中老年(人) 合计 附:列联表参考公式:,其中.临界值表:0.1000.0500.0250.0100.0012.7063.8415.0246.63510.828 11.某公司在市场调查中,发现某产品的单位定价(单位:万元/吨)对月销售量(单位:吨)有影响.对不同定价和月销售量数据作了初步处理,0.244390.164820683956表中.经过分析发现可以用来拟合与的关系.(1)求关于的回归方程;(2)若生产吨产品的成本为万元,那么预计价格定位多少时,该产品的月利润取最大值,求此时的月利润.附:对于一组数据,,…,,其回归直线线的的斜率和截距的最小二乘估计分别为:,.12.某学生对其亲属人的饮食习惯进行了一次调查,并用茎叶图表示人的饮食指数.(说明:图中饮食指数低于的人,饮食以蔬菜为主;饮食指数高于的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位学生说明其亲属人的饮食习惯;(2)根据以上数据完成下列列联表: 主食蔬菜主食肉类合计岁以下 岁以上 合计 (3)能否有的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.13.某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了份,暴雨前的投票也收集了份,所得统计结果如下表: 支持不支持总计北京暴雨后北京暴雨前总计已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为.(1)求列联表中的数据、、、的值;(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关?附: 14.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表: 超过不超过第一种生产方式 第二种生产方式 15.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示. (1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数;(3)求这次测试数学成绩的平均分.16.第七次全国人口普查登记于年月日开始,这是在我国人口发展进入关键期开展的一次重大国情国力调查,可以为编制“十四五”规划,为推动高质量发展,完善人口发展战略和政策体系、促进人口长期均衡发展提供重要信息支持,本次普查主要调查人口和住户的基本情况.某校高三一班共有学生名,按人口普查要求,所有住校生按照集体户进行申报,所有非住校生(走读生及半走读生)按原家庭申报,已知该班住校生与非住校生人数的比为,住校生中男生人,现从住校生中采用分层抽样的方法抽取名同学担任集体户户主进行人口普查登记.(1)应从住校的男生、女生中分别抽取多少人?(2)若从抽出的人中随机抽取人进行普查登记培训,求这人中既有男生又有女生的概率.
相关学案
这是一份专题20概率(理)知识点与大题16道专练(中档题)(解析版)-备战2022年高考数学大题分类提升专题学案,共22页。学案主要包含了椭圆,双曲线,抛物线,直线与圆锥曲线的位置关系,弦长问题等内容,欢迎下载使用。
这是一份专题11概率(理)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共17页。
这是一份专题7概率(文)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案,共26页。