所属成套资源:【高考二轮】2023年新高考数学二轮复习专题突破精练(新高考地区专用)
最新高考数学二轮复习(新高考)【专题突破精练】 第39讲 统计初步与独立性检验
展开
这是一份最新高考数学二轮复习(新高考)【专题突破精练】 第39讲 统计初步与独立性检验,文件包含第39讲统计初步与独立性检验原卷版docx、第39讲统计初步与独立性检验解析版docx等2份试卷配套教学资源,其中试卷共56页, 欢迎下载使用。
1、明确模拟练习的目的。不但检测知识的全面性、方法的熟练性和运算的准确性,更是训练书写规范,表述准确的过程。
2、查漏补缺,以“错”纠错。每过一段时间,就把“错题笔记”或标记错题的试卷有侧重的看一下。查漏补缺的过程也就是反思的过程,逐渐实现保强攻弱的目标。
3、严格有规律地进行限时训练。特别是强化对解答选择题、填空题的限时训练,将平时考试当作高考,严格按时完成,并在速度体验中提高正确率。
4、保证常规题型的坚持训练。做到百无一失,对学有余力的学生,可适当拓展高考中难点的训练。
5、注重题后反思总结。出现问题不可怕,可怕的是不知道问题的存在,在复习中出现的问题越多,说明你距离成功越近,及时处理问题,争取“问题不过夜”。
6、重视每次模拟考试的临考前状态的调整及考后心理的调整。以平和的心态面对高考。
第39讲 统计初步与独立性检验
【典型例题】
例1.某机构通过抽样调查,利用列联表和统计量研究患肺病是否与吸烟有关计算得,经查对临界值表知,,现给出四个结论,其中正确的是
A.因为,故有的把握认为“患肺病与吸烟有关”
B.因为,故有的把握认为“患肺病与吸烟有关”
C.因为,故有的把握认为“患肺病与吸烟无关”
D.因为,故有的把握认为“患肺病与吸烟无关”
【解析】解:,
有的把握认为“患肺病与吸烟有关”,没有的把握认为“患肺病与吸烟有关”.
故选:.
例2.某班对一模考试数学成绩进行分析,利用随机数表法抽取样本时,先将70个同学按00,01,02,,69进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的10个个体中第8个个体的编号是 (注:如下为随机数表的第8行和第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54.
A.07B.44C.38D.51
【解析】解:70个同学按00,01,02,,69进行编号,从随机数表第9行第9列的数开始向右读,
选出的10个个体数分别是29,舍去),64,56,07,舍去),52,42,舍去),44,38,15,51;
第8个样本的编号是38.
故选:.
例3.某社区通过公益讲座以普及社区居民的垃圾分类知识;为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷.这10位社区居民在讲座前和讲座后问卷答题的正确率如下:
则下列说法错误的是
A.讲座后问卷答题的正确率的中位数为
B.讲座后问卷答题的正确率的众数为
C.讲座后问卷答题的正确率的第75百分位数为
D.讲座前问卷答题的正确率的标准差小于讲座后问卷答题的正确率的标准差
【解析】解:讲座后问卷答题的正确率分别为,,,,,,,,,,
所以讲座后问卷答题的正确率的中位数为,正确;
讲座后问卷答题的正确率的众数为,正确;
因为,所以讲座后问卷答题的正确率的第75百分位数为第8个数,即,正确;
由图可知讲座前问卷答题的正确率数据波动要大于讲座后问卷答题的正确率,故标准差也应该大于讲座后的标准差,错误.
故选:.
例4.有一组样本数据,,,,由这组数据得到的另一组数据,,,,满足为非零常数),则下列结论一定成立的是
A.两组数据的样本平均数不同B.两组数据的中位数相同
C.两组数据的样本方差相同D.两组数据的样本标准差不同
【解析】解:对于,设,,,的平均数是,,,,的平均数是,由题意,如果,则,否则,故错误;
对于,如果,,,.的中位数是,则两者中位数相同,否则不相同,故错误;
对于,设,,,的方差是,,,,的差是,则,所以,故正确;
对于,因为,所以,所以标准差相同,故错误.
故选:.
例5.根据最小二乘法由一组样本点,(其中,2,,,求得的回归方程是,则下列说法正确的是
A.至少有一个样本点落在回归直线上
B.由最小二乘法求出的回归直线是没有误差的,所有样本点都在上
C.对所有的变量,2,,,的值一定与有误差
D.若回归直线的斜率,则变量有随变量变大而变大的趋势
【解析】解:回归方程必过样本中心,但是样本点可能全部不在回归直线上,故选项错误,错误;
若所有的样本点都在回归直线上,则对所有的变量,2,,,的值一定与没有误差,故选项错误;
相关系数与的符号相同,若回归直线的斜率,则,样本点分布从左到右应该是上升的,则变量有随变量变大而变大的趋势,故选项正确.
故选:.
例6.给定四组数据:甲:1,2,3,4,5;乙:1,3,5,7,9;丙:1,2,3;丁:1,3,5.其中方差最小的一组是
A.甲B.乙C.丙D.丁
【解析】解:根据题意,依次计算四组数据的方差:
对于甲:1,2,3,4,5;其平均数,则其方差;
对于乙:1,3,5,7,9;其平均数,则其方差;
对于丙:1,2,3;其平均数,则其方差,
对于丁:1,3,5.其平均数,则其方差,
比较可得:丙组方差最小;
故选:.
例7.在一组样本数据,,,,,,,,,,不全相等)的散点图中,若所有本点,,2,3,,都在直线上,则这组样本数据的样本相关系数为 .
【解析】解:直线的斜率,且若所有本点,,2,3,,都在直线,
说明这组数据的样本完全负相关,则相关系数达到最小值.
故答案为:
例8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的.若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生至少有 人.
【解析】解:设男生有人,则女生有人,可得列联表如下:
若有的把握认为是否喜欢抖音和性别有关,
则,可得,
由题意可得且是5的倍数,男生至少有45人,
故答案为:45.
例9.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨,一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照,,,,,,分成9组,制成了如图所示的频率分布直方图.
(Ⅰ)求直方图中的值;
(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(Ⅲ)若该市政府希望使的居民每月的用水量不超过标准(吨,估计的值,并说明理由.
【解析】解:(Ⅰ),
;
(Ⅱ)由图可得月均用水量不低于3吨的频率为:,
由得:全市居民中月均用水量不低于3吨的人数约为3.6万;
(Ⅲ)由图可得月均用水量低于2.5吨的频率为:;
月均用水量低于3吨的频率为:;
则吨
例10.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:和材积量(单位:,得到如下数据:
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到;
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数,.
【解析】解:(1)样本中10棵这种树木的根部横截面积的平均值,
样本中10棵这种树木的材积量的平均值,
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为;
(2),
,
所以,
所以样本相关系数;
(3)设该林区这种树木的总材积量的估计值为,
由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以,
所以,
即该林区这种树木的总材积量的估计值为.
例11.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
从该地的人群中任选一人,表示事件“选到的人卫生习惯不够良好”, 表示事件“选到的人患有该疾病”. 与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为.
(1)证明:;
(2)利用该调查数据,给出及的估计值.
【解析】解:(1)证明:,,
,,
,
,
;
(2),
,
,
,
,
.
例12.的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,经济收入在短期内逐月攀升,该创新公司在第1月份至6月份的经济收入(单位:百万元)关于月份的数据如表:
根据以上数据绘制散点图,如图.
(1)根据散点图判断,与,,,均为常数)哪个适宜作为经济收入关于月份的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中数据,求关于的回归方程,并预测该公司8月份的经济收入;
(3)从前6个月收入中抽取3个,记月收入超过16百万的个数为,求分布列和数学期望.
参考数据:
其中设,,2,3,4,5,参考公式和数据:对于一组具有线性相关关系的数据,,2,3,,,其回归直线的斜率和截距的最小二乘估计公式分别为:
,,,.
【解析】解:(1),散点图中点的分布不是一条直线,相邻两点在轴上差距是增大的趋势,
故用表示更合适.
(2)由得,设,所以,
因为,,,,
所以,,,所以,
即,则回归方程为,
预测该公司8月份的经济收入百万元.
(3)月收入超过16百万的个数为的可能取值为1,2,3,
则,,,
则的分布列为:
所以.
例13.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本(元与生产该产品的数量(千件)有关,经统计得到如下数据:
根据以上数据绘制了散点图观察散点图,两个变量间关系考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为,与的相关系数.
(1)用反比例函数模型求关于的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到,并用其估计产量为10千件时每件产品的非原料成本;
(3)根据企业长期研究表明,非原料成本服从正态分布,用样本平均数作为的估计值,用样本标准差作为的估计值,若非原料成本在之外,说明该成本异常,并称落在之外的成本为异样成本,此时需寻找出现异样成本的原因.利用估计值判断上述非原料成本数据是否需要寻找出现异样成本的原因?
参考数据(其中
参考公式:对于一组数据,,,,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,,相关系数.
【解析】解:(1)令,则可转化为,
因为,
所以,
所以,
所以,
所以关于的回归方程为;
(2)与的相关系数为,
因为,所以用反比例函数模型拟合效果更好,
把代入回归方程得(元,
所以产量为10千件时每件产品的非原料成本约为11元;
(3)因为,所以,
因为样本标准差为,
所以,所以非原料成本服从正态分布,,
所以,,,,
因为56.5在之外,所以需要此非原料成本数据寻找出现异样成本的原因.
【同步练习】
一.选择题
1.千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩销云,地上雨淋林”“日落云里走,雨在半夜后” 小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区的100天日落和夜晚天气,得到如下列联表:
并计算得到,下列小明对地区天气判断正确的是
A.夜晚下雨的概率约为
B.未出现“日落云里走”,但夜晚下雨的概率约为
C.出现“日落云里走”,有的把握认为夜晚会下雨
D.有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
【解析】解:由列联表可得,100天中有50天下雨,50天未下雨,
则下雨的概率约为,故错误,
未出现“日落云里走”,但夜晚下雨的概率约为,故错误,
列联表如下:
,
有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故错误,正确.
故选:.
2.随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,如图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是
下列说法错误的是
①1月至8月空气合格的天数超过20天的月份有5个
②第二季度与第一季度相比,空气达标天数的比重下降了
③8月是空气质量最好的一个月
④6月份的空气质量最差.
A.①②③B.①②④C.①③④D.②③④
【解析】解:对于①,1月至8月空气合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,①正确;
对于②,第一季度合格天数的比重为:,
第二季度合格天气的比重为:,
第二季度与第一季度相比,空气达标天数的比重下降了,②正确;
对于③,8月空气质量合格的天气达到30天,是空气质量最好的一个月,③正确;
对于④,5月空气质量合格天气只有13天,5月份的空气质量最差,④错误.
综上,正确的①②③.
故选:.
3.如图所示的四组数据,标准差最小的是
A.
B.
C.
D.
【解析】解:对于,平均数为,
故标准差为;
对于,平均数为,
故标准差为;
对于,平均数为,
故标准差为;
对于,平均数为,
故标准差为;
故标准差最小的是.
故选:.
4.若经研究得出某地10名新冠肺炎病患者的潜伏期(单位:天)分别为8,12,10,7,8,7,12,13,15,16,则这10个数据的第80百分位数是
A.12B.13C.14D.15
【解析】解:,
首先对数据进行排序7,7,8,8,10,12,12,13,15,16.
故第80百分位数是.
故选:.
5.有一组样本数据,,,,由这组数据得到新的样本数据,,,,其中,2,,,且,则下列说法中错误的是
A.新样本数据的平均数是原样本数据平均数的倍
B.新样本数据的上四分位数是原样本数据上四分位数的倍
C.新样本数据的方差是原样本数据方差的倍
D.新样本数据的极差是原样本数据极差的倍
【解析】解:对于,根据平均数的定义知,新样本数据的平均数是原样本数据平均数的倍,选项正确;
对于,根据百分位数的定义知,新样本数据的上四分位数是原样本数据上四分位数的倍,选项正确;
对于,根据方差的计算公式知,新样本数据的方差是原样本数据方差的倍,所以选项错误;
对于,根据极差的定义知,新样本数据的极差是原样本数据极差的倍,选项正确.
故选:.
二.多选题
6.要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,,850进行编号,如果从随机数表第2行第2列的数开始并向右读,下列选项中属于最先检验的4颗种子中一个的是________.(下面抽取了随机数表第1行至第3行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
A.774B.946C.428D.572
【解析】解:从随机数表第2行第2列的数7依次开始向右读,
第一个小于850的数字是774,符合题意,
第二个数字是946,774舍,
第三个数字是428,也符合题意,
第四个数字是114,也符合题意,
第五个数字是572,也符合题意,
故选:.
7.已知具有相关关系的两个变量,的一组观测数据,,,,,,,由此得到的线性回归方程为,则下列说法中正确的是
A.回归直线至少经过点,,,,,,中的一个点
B.若,,则回归直线一定经过点
C.若点,,,,,,都落在直线上,则变量,的样本相关系数
D.若,,则相应于样本点,的残差为
【解析】解:线性回归方程为不一定经过,,,,,,中的任何一个点,但一定会经过样本中心点即,故选项错误;选项正确;
选项,直线的斜率,且所有样本点都落在直线上,所以这组样本数据完全正相关,且相关系数达到最大值1,故选项正确;
选项,样本点,的残差为,故选项正确.
故选:.
8.已知与之间的四组数据如表:
上表数据中的平均值为2.5,若某同学对赋了两个值,分别为2,2.5,得到两条回归直线方程分别为,,对应的相关系数分别为,,则
A.变量与呈正相关
B.两条回归直线的交点为
C.
D.
【解析】解:由表可知,
而的平均值为2.5,
,即,
当时,;当时,,
随的增大呈增大的趋势,即选项正确;
由于样本的中心点都相同,均为,所以正确;
当时,,
,
,
,
,
,
.
当时,,同理可求得,,,,
,,即选项错误,选项正确.
故选:.
9.设一组样本的统计数据为:,,,,其中,,,,.已知该样本的统计数据的平均数为,方差为,设函数,.则下列说法正确的是
A.设,则,,,,的平均数为
B.设,则,,,的方差为
C.当时,函数有最小值
D.
【解析】解:对于,,,,的平均数,
,,,的平均数为:
,故正确;
对于,,,,的方差,
,,,的平均数为:
,
方差为:,故错误;
对于,,
,,
,
当时,函数有最小值,故正确;
对于,由上知,,,,
,故错误.
故选:.
三.填空题
10.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”的把握为 .
下面的临界值表供参考:
【解析】解:由题意,可得以下列联表:
则,
故认为“能否一次考试通过与是否集中培训有关”的把握为.
故答案为:.
11.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过 .
附:.
【解析】解:列联表如下:
,
认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.025,
故答案为:0.025.
四.解答题
12.在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间,的概率;
(3)已知该地区这种疾病的患者的患病率为,该地区年龄位于区间,的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,,求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001 .
【解析】解:(1)由频率分布直方图得该地区这种疾病患者的平均年龄为:
岁.
(2)该地区一位这种疾病患者的年龄位于区间,的频率为:
,
估计该地区一位这种疾病患者的年龄位于区间,的概率为0.89.
(3)设从该地区中任选一人,此人的年龄位于区间,为事件,此人患这种疾病为事件,
则.
13.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照,,,,,,分成9组,制成了如图所示的频率分布直方图.
(Ⅰ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(Ⅱ)若该市政府希望使的居民每月的用水量不超过标准(吨,估计的值,并说明理由.
利用分层抽样的方法在,,,三组中选取5位居民,再从这5位居民中任意取三人,求这三人恰有两人来自同一组的概率.
【解析】解:(Ⅰ)用水量在,的频率为:,
所以用水量不低于3吨的概率为0.12,
利用样本数据去估计总体,
则30万居民中用水量不低于3吨的人数约(万.
(Ⅱ)如图可得:
因为用水量在,内概率为:
,
令,
解得.
(Ⅲ)用水量在,内人数:人,
用水量在,内人数为:人,
用水量在,内人数:人,
(或直接说明它们三组的频率比依次为也可以)
由分层抽样方法从三组中选取5人,分别为,抽取2人,
记为,,,抽取2人,记为,,,抽取1人,记为,
若从5人中任意选取3人的取法列举如下:
,,,,,,,,,,,,,,,
,,,,,,,,,,,,,,,共有10个基本事件,
其中三人中恰有两人来自同一组的有6个基本事件,
这三人恰有两人来自同一组的概率.
14.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
(1)把表格中的数据补充完整;
(2)能否有的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
附:
【解析】解:(1)由题意所给数据得到如下的列联表:
(2),
有的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
15.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨,一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年1000位居民每人的月均用水量(单位:吨),将数据按照0,0.5,0.5,1,,4,4.5分成9组,制成了如图所示的频率分布直方图.
(1)有人不小心将频率分布直方图的一个数据弄模糊看不清,请根据你所学知识求出模糊的数据;
(2)若该市政府希望使的居民每月的用水量不超过标准(吨,估计的值(精确到,并说明理由;
(3)现从第7,8,9组被调查人中用分层抽样的方法抽取6人,然后再随机抽取2个人进行问卷调查,求恰好抽取到同一组的概率为多少?
【解析】解:(1)根据各组的累积频率为1,设模糊的数据为,
则有.
(2)由题意可以知道所求的为用水量的中位数,所以有:
,
解得,
所以可设置标准2.06吨,可使得的居民用水不超过标准,即所求的为用水量的中位数.
(3)根据分层抽样可以得到在7,8,9组抽样的人数为,
所以在7,8,9组分别抽取的人数为3,2,1,分别设为,,,,,,
所以所有的抽样可能为:
,,,,,,,,
,,,,,,共15种,
满足要求为,,,共4种,
所以抽取的两个人来自相同的组别的概率为.
16.在某地区进行流行病调查,随机调查了100名某种疾病患者的年龄,得到如图所示的样本数据频率分布直方图.
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值作代表);
(2)估计该地区一人患这种疾病年龄在区间,的概率;
【解析】解:(1)根据频率分布直方图,患者的平均年龄为:
.
(2)年龄在区间,的概率为:.
17.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,,2,,,其中和分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本,,2,,的相关系数(精确到;
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确地估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数,.
【解析】解:(1)由已知,,
个样区野生动物数量的平均数为,
该地区这种野生动物数量的估计值为;
(2),,,
;
(3)更合理的抽样方法是分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确地估计.
18.甲、乙两城之间的长途客车均由和两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:.
【解析】解:(1)公司一共调查了260辆车,其中有240辆准点,故公司准点的概率为;
公司一共调查了240辆车,其中有210辆准点,故公司准点的概率为;
(2)由题设数据可知,准点班次数共450辆,未准点班次数共50辆,公司共260辆,公司共240辆,
,
有的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
19.在我国抗疫期间,素有“南抖音,北快手”之说的小视频除了给人们带来生活中的快乐外,更在于传递了一种正能量,为抗疫起到了积极的作用,但一个优秀的作品除了需要有很好的素材外,更要有制作上的技术要求,某同学学习利用“快影”软件将已拍摄的素材进行制作,每次制作分三个环节来进行,其中每个环节制作合格的概率分别为.只有当每个环节制作都合格才认为一次成功制作,该小视频视为合格作品.
(Ⅰ)求该同学进行3次制作,恰有一次合格作品的概率;
(Ⅱ)若该同学制作4次,其中合格作品数为,求的分布列和数学期望.
【解析】解:由题意可知,制作一次视频成功的概率为.
制作一次视频成功的概率为,由题意可得,的所有可能取值为0,1,2,3,4,
,,1,2,3,4,
故的分布列为:
.
20.2020年2月以来,由于受新型冠状病毒肺炎疫情的影响,贵州省中小学陆续开展“停课不停学”的网络学习.为了解贵阳市高三学生返校前的网络学习情况,对甲、乙两所高中分别随机抽取了25名高三学生进行调查,根据学生的日均网络学习时长(单位:分别绘制了部分茎叶图(如图和乙校学生日均网络学习时长的部分频率分布直方图(如图,其中茎叶图缺少乙校茎“5.”和“6.”叶的数据.
注:茎叶图中的茎表示整数位数据,叶表示小数位数据,如乙校收集到的最小数据为3.1.
(1)补全图2的频率分布直方图,并估计乙校学生日均网络学习时长的平均数(同一组中的数据用该组区间的中点值作代表);
(2)求50名学生日均网络学习时长的中位数,并将日均网络学习时长超过和不超过的学生人数填入下面的列联表:
(3)根据(2)中的列联表,能否有以上的把握认为甲、乙两校高三学生的网络学习时长有差异?
附:,其中.
【解析】解:(1)补全图2的频率分布直方图如下图所示:
由此估计乙校学生日均网络学习时长的平均数为.
(2)由茎叶图知,,
(3)由(2)中的列联表可知:,
所以没有以上的把握认为甲、乙两所高中高三学生的网络学习时长有差异.
21.根据统计,某蔬菜基地西红柿亩产量的增加量(百千克)与某种液体肥料每亩使用量(千克)之间的对应数据的散点图,如图所示:
(1)依据数据的散点图可以看出,可用线性回归模型拟合与的关系,请计算相关系数并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);
(2)求关于的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?
附:相关系数,
回归直线的斜率和截距的最小二乘估计分别为:,.
【解析】解:(1),.
,
,
.
.
可用线性回归模型拟合与的关系;
(2),
.
.
当时,.
预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克.
22.第24届冬季奥运会将于2022年2月4日在北京开幕,本次冬季奥运会共设7个大项,15个分项,109个小项.为调查学生对冬季奥运会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为,统计得到以下列联表,经过计算可得.
(1)求的值,并判断有多大的把握认为该校学生对冬季奥运会项目的了解情况与性别有关;
(2)①为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不理解冬季奥运会项目的学生中随机抽取9人,再从这9人中抽取3人进行面对面交流,“至少抽到一名女生”的概率;
②将频率视为概率,用样本估计总体,从该校全体学生中随机抽取10人,记其中对冬季奥运会项目了解的人数为,求的数学期望.
附表:
附:.
【解析】解:(1)的列联表如下:
,
因为,
所以,
,
因此,有的把握认为该校学生对冬季奥运会项目的了解情况与性别有关;
(2)①采用分层抽样的方法从抽取的不理解冬季奥运会项目的学生中随机抽取9人,这9人中男生的人数为4,女生的人数为5,
再从这9人中抽取3人进行面对面交流,“至少抽到一名女生”的概率为;
②由题意可知,
故.
23.在我国抗疫期间,素有“南抖音,北快手”之说的小视频除了给人们带来生活中的快乐外,更在于传递了一种正能量,为抗疫起到了积极的作用,但一个优秀的作品除了需要有很好的素材外,更要有制作上的技术要求,某同学学习利用“快影”软件将已拍摄的素材进行制作,每次制作分三个环节来进行,其中每个环节制作合格的概率分别为.只有当每个环节制作都合格才认为一次成功制作,该小视频视为合格作品.
(1)求该同学进行3次制作,恰有一次合格作品的概率;
(2)若该同学制作10次,其中合格作品数为,求的数学期望.
【解析】解:(1)由题意知:制作一次视频成功的概率为,
所以该同学进行3次制作,恰有一次合格作品的概率;
(2)该同学制作10次,其中合格作品数为,根据题意,
故.
24.在我国抗疫期间,素有“南抖音,北快手”之说的小视频,除了给人们带来生活中的快乐外,更在于传递了一种正能量,为抗疫起到了积极的作用,但一个优秀的作品除了需要有很好的素材外,更要有制作上的技术要求.某同学学习利用“快影”软件将已拍摄的素材进行制作,每次制作分三个环节来进行,每个环节制作合格的概率分别为,且每个环节是否合格相互之间没有影响,只有当每个环节制作都合格才认为是一次成功制作,该小视频视为合格作品.
(Ⅰ)求该同学进行一次制作,小视频为合格作品的概率;
(Ⅱ)求该同学进行两次制作,恰有一个合格作品的概率;
(Ⅲ)若该同学制作3次,其中合格作品数为,求的分布列和数学期望.
【解析】解:(Ⅰ)由题意可知,该同学进行一次制作,小视频为合格作品的概率为;
(Ⅱ)该同学进行两次制作,恰有一个合格作品的概率为;
(Ⅲ)由题意可知,,
则,
,
,
,
所以的分布列为:
故.
25.为落实十三五规划节能减排的国家政策,某职能部门对市场上两种设备的使用寿命进行调查统计,随机抽取型和型设备各100台,得到如图频率分布直方图:
(1)估算型设备的使用寿命的第80百分位数;
(2)将使用寿命超过2500小时和不超过2500小时的台数填入下面的列联表:
根据上面的列联表,能否有的把握认为使用寿命是否超过2500小时与型号有关?
(3)已知用频率估计概率,现有一项工作需要10台同型号设备同时工作2500小时才能完成,工作期间设备损坏立即更换同型号设备(更换设备时间忽略不计),型和型设备每台的价格分别为1万元和0.6万元,型和型设备每台每小时耗电分别为2度和6度,电价为0.75元度.只考虑设备的成本和电费,你认为应选择哪种型号的设备,请说明理由.
参考公式:,.
参考数据:
【解析】解:(1)前3组的频率之和为,
前四组频率之和为:,
所以第80百分位数一定位于,,
故第80百分位数为:(小时).
(2)由频率分布直方图可知,
型超过2500小时的有台,
则型不超过2500小时的有台,
型超过2500小时的有台,
则型不超过2500小时的有台,
故列联表如下:
,
有的把握认为使用寿命是否超过2500小时与型号有关.
(3)型设备每台变换的频率为,所以10台型设备估计要更换3台,
设备每台变换的频率为,所以10台型设备估计要更换5台,
选择型设备的总费用(万元),
选择型设备的总费用(万元),
故选择型设备.
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
样本号
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
不够良好
良好
病例组
40
60
对照组
10
90
时间(月份)
1
2
3
4
5
6
收入(百万元)
6.6
8.6
16.1
21.6
33.0
41.0
3.50
21.15
2.85
17.50
125.35
6.73
1
2
3
1
2
3
4
5
6
7
8
56.5
31
22.75
17.8
15.95
14.5
13
12.5
0.34
0.115
1.53
184
5777.555
93.06
30.705
13.9
夜晚天气
日落云里走
下雨
不下雨
出现
25
5
不出现
25
45
临界值表
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
夜晚天气
日落云里走
下雨
未下雨
合计
出现
25
5
30
未出现
25
45
70
合计
50
50
100
2
3
4
5
1.5
3.5
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
集中培训
分散培训
合计
一次考试通过
45
30
75
一次考试未通过
10
20
30
合计
55
50
105
0.05
0.025
0.010
0.001
3.841
5.024
6.635
10.828
通过
未通过
总计
集中培训
45
10
55
分散培训
30
20
50
总计
75
30
105
不够良好
良好
合计
病例组
60
对照组
100
合计
50
0.050
0.010
0.001
3.841
6.635
10.828
不够良好
良好
合计
病例组
40
60
100
对照组
10
90
100
合计
50
150
200
准点班次数
未准点班次数
240
20
210
30
0.100
0.050
0.010
2.706
3.841
6.635
0
1
2
3
4
超过
不超过
总计
甲
乙
总计
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
列联表如下:
超过
不超过
总计
甲
15
10
25
乙
10
15
25
总计
25
25
50
男生
女生
合计
了解
不了解
合计
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
男生
女生
合计
了解
不了解
合计
0
1
2
3
超过2500小时
不超过2500小时
总计
型
型
总计
0.050
0.010
0.001
3.841
6.635
10.828
超过2500小时
不超过2500小时
总计
型
70
30
100
型
50
50
100
总计
120
80
200
相关试卷
这是一份最新高考数学二轮复习(新高考)【专题突破精练】 第29讲 离心率问题速解,文件包含第29讲离心率问题速解原卷版docx、第29讲离心率问题速解解析版docx等2份试卷配套教学资源,其中试卷共59页, 欢迎下载使用。
这是一份最新高考数学二轮复习(新高考)【专题突破精练】 第27讲 隐圆问题,文件包含第27讲隐圆问题原卷版docx、第27讲隐圆问题解析版docx等2份试卷配套教学资源,其中试卷共30页, 欢迎下载使用。
这是一份最新高考数学二轮复习(新高考)【专题突破精练】 第24讲 数列性质常见考题,文件包含第24讲数列性质常见考题原卷版docx、第24讲数列性质常见考题解析版docx等2份试卷配套教学资源,其中试卷共38页, 欢迎下载使用。