所属成套资源:新高考数学三轮冲刺易错题讲练 (2份,原卷版+解析版)
新高考数学三轮冲刺易错题讲练专题14 统计(2份,原卷版+解析版)
展开
这是一份新高考数学三轮冲刺易错题讲练专题14 统计(2份,原卷版+解析版),文件包含新高考数学三轮冲刺易错题讲练专题14统计原卷版doc、新高考数学三轮冲刺易错题讲练专题14统计解析版doc等2份试卷配套教学资源,其中试卷共38页, 欢迎下载使用。
易错点一 利用随机数表确定样本忘记去掉重复数字
注意:在使用随机数法时,要注意起始位置,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,注意把超过总体号码或出现重复号码的数字舍去
例1.(2022秋·高一课时练习)FRM(Financial Risk Manager)——金融风险管理师,是全球金融风险管理领域的一种资格认证.某研究机构用随机数法抽取了某市2019年参加FRM考试的名考生的成绩进行分析,先将名考生按,,,,进行编号,然后从随机数表第行第列的数开始向右读,则选出的第个编号是(注:下面为随机数表的第行和第行) ( )
第行:7 8 1 6 6 5 7 2 0 8 0 2 6 3 1 4 0 7 0 2 4 3 6 9 9 7 2 8 0 1 9 8
第行:3 2 0 4 9 2 4 3 4 9 3 5 8 2 0 0 3 6 2 3 4 8 6 9 6 9 3 8 7 4 8 1
A.B.C.D.
例2.(2023春·全国·高二专题练习)某学校为调查学生参加课外体育锻炼的时间,将该校某班的40名学生进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行调查,选取方法是从下面的随机数表的第1行第11列开始向右读取数据,直到取足样本,则抽取样本的第6个号码为( )
A.07B.40C.35D.23
易错点二 使用直方图解题时错把纵坐标当成频率
例3.(2023·上海闵行·统考二模)在某区高三年级举行的一次质量检测中,某学科共有3000人参加考试.为了解本次考试学生的成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照,,,,的分组作出频率分布直方图(如图所示).已知成绩落在内的人数为16,则下列结论正确的是( )
A.样本容量
B.图中
C.估计全体学生该学科成绩的平均分为70.6分
D.若将该学科成绩由高到低排序,前15%的学生该学科成绩为A等,则成绩为78分的学生该学科成绩肯定不是A等
例4.(2023·全国·模拟预测)(多选)研究发现,每天只要跑步1分钟,就能够提升骨骼的健康.某中学从全校学生中随机抽取部分学生进行了一分钟跑步测试,对步数进行了统计,并进行适当分组(每组的取值区间均为左闭右开),画出频率分布直方图如图所示,则下列说法正确的是( ).
A.图中m的值为0.025
B.样本数据的平均数约为374.5
C.样本数据的第80百分位数为384
D.估计一分钟跑步步数在的学生不超过60%
易错点三 对百分位数理解不到位
注意:计算步骤:计算一组个数据的第百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
例5.(2023春·四川南充·高三阆中中学校考阶段练习)某校随机抽取了名学生测量体重,经统计,这些学生的体重数据(单位:)全部介于至之间,将数据整理得到如图所示的频率分布直方图,则下列结论错误的是( )
A.频率分布直方图中的值为
B.这名学生中体重低于的人数为
C.据此可以估计该校学生体重的第百分位数约为
D.据此可以估计该校学生体重的平均数约为
例6.(2023·河北邯郸·统考一模)身体质量指数,也就是BMI指数,简称体质指数,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.某校为了解该校学生的身体健康情况,从某班随机抽取20名学生进行调查,得到这20名学生的BMI指数分别是15,15.3,15.6,15.9,16.2,16.6,17.5,17.8,18.2,18.7,19.3,19.5,20.3,21.1,21.5,22.7,22.9,23.1,23.4,23.5,则这组数据的第65百分位数是_______________.
例7.(2023秋·浙江杭州·高三浙江省杭州第二中学校考期末)为做好“新冠肺炎”疫情防控工作,我校坚持每日测温报告,以下是某班8名同学的体温记录:36.1,36.3,36.3,36.4,36.4,36.5,36.6,36.7(单位:),则该组数据的第60百分位数为( )
A.36.3B.36.4C.36.45D.36.5
易错点四 混淆相关系数和决定系数
注意:相关系数:|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量的线性相关性越弱;
决定系数:越接近于1,表示回归的效果越好
例8.(2022春·河南三门峡·高三统考期末)下列命题:
①线性回归直线必过样本数据的中心点;
②如果两个变量的相关性越强,则相关性系数r就越接近于1;
③当相关性系数时,两个变量正相关;
④残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
⑤甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好.
其中正确的命题有______.(填序号)
例9.(2023·吉林通化·梅河口市第五中学校考模拟预测)(多选)下列关于成对数据的统计说法正确的有( )
A.若当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关
B.样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度
C.通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据
D.决定系数越大,模型的拟合效果越差
易错点五 求回归直线方程计算错误
注意:要明白,而且要懂得先约分,再计算
例10.(2023春·吉林长春·高三长春十一高校考阶段练习)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了名网红直播的观看人次和农产品销售量的数据,得到如图所示的散点图.
(1)利用散点图判断,和哪一个更适合作为观看人次和销售量的回归方程类型;(只要给出判断即可,不必说明理由)
(2)对数据作出如下处理:得到相关统计量的值如表:
其中令,.
根据(1)的判断结果及表中数据,求(单位:千件)关于(单位:十万次)的回归方程,并预测当观看人次为万人时的销售量;
参考数据和公式:,
附:对于一组数据、、、,其回归线的斜率和截距的最小二乘估计分别为:,.
例11.(2023·重庆·统考二模)用模型拟合一组数据组,其中;设,得变换后的线性回归方程为,则( )
A.B.70C.D.35
易错点六 求解独立性检验问题对的值理解不准确
注意:在利用2×2列联表计算的值之前,先假设两个分类变量是无关的,最后再利用的值的大小对二者关系进行含概率的判断
例12.(2023春·陕西西安·高三校考阶段练习)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵不严重的A城市和交通拥堵严重的城市分别随机调查了20名市民,得到如下列联表:
附:.
根据表中的数据,下列说法中正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.025的前提下认为“是否认可与城市的拥堵情况有关”
例13.(2023春·河南南阳·高二校联考期中)在易怒与患心脏病这两个变量的计算中,有以下结论:①当由独立性检验可知有90%的把握认为易怒与患心脏病有关时,那么在100个易怒的人中有90人患心脏病;②由的观测值得到有90%的把握认为易怒与患心脏病有关系,是指有10%的可能性使得推断出现错误;③由独立性检验可知有90%的把握认为易怒与患心脏病有关,是指在犯错误的概率不超过10%的前提下,可以认为某人是否患心脏病与是否易怒有关,其中正确结论的个数是( )
A.3B.2C.1D.0
一、单选题
1.(2021秋·高三单元测试)福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球号码为( )
第1行:2 9 7 6 3 4 1 3 2 8 4 1 4 2 4 1
第2行:8 3 0 3 9 8 2 2 5 8 8 8 2 4 1 0
第3行:5 5 5 6 8 5 2 6 6 1 6 6 8 2 3 1
A.10B.22C.24D.26
2.(2021秋·高三课时练习)某商场对某一商品搞活动,已知该商品每个的进价为3元,售价为8元,每天销售的第20个及之后的商品按半价出售,该商场统计了近10天这种商品的销售量,如图所示.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为( )
A.B.
C.D.
3.(2023·浙江杭州·统考二模)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是( )
A.相关系数r变小B.决定系数变小
C.残差平方和变大D.解释变量x与预报变量y的相关性变强
4.(2023春·北京·高三北京市第一六一中学校考阶段练习)下列说法中错误的是( )
A.残差的平方和可用来判断模型拟合的效果
B.设有一个回归方程,自变量增加个单位时,因变量平均增加个单位
C.线性回归直线必过点
D.在一个列联表中,由计算得(其中),则有的把握确认这两个变量间有关系
5.(2023·全国·高三专题练习)下列命题中正确的为( )
A.相关系数r越大,两个变量的线性相关性越强B.相关系数r越小,两个变量的线性相关性越弱
C.残差平方和越小的模型,拟合的效果越好D.用相关指数来刻画回归效果,越小,说明模型的拟合效果越好
6.(2023春·陕西宝鸡·高三校联考阶段练习)通过随机调查名性别不同的社区居民是否喜欢看电视剧,得到如下的列联表:
由公式算得:,附:,
其中参照附表,得到的正确结论是( )
A.有的把握认为“居民是否喜欢看电视剧”与性别有关
B.有的把握认为“居民是否喜欢看电视剧”与性别有关
C.有的把握认为“居民是否喜欢看电视剧”与性别有关
D.有的把握认为“居民是否喜欢看电视剧”与性别有关
二、多选题
7.(2023·安徽·校联考二模)大年除夕吃年夜饭是中国古老的民俗传统,唐朝诗人孟浩然曾写下“续明催画烛,守岁接长筵”这样的诗句.为了解某地区居民的年夜饭消费金额,研究人员随机调查了该地区100个家庭,所得金额统计如图所示,则下列说法正确的是( )
A.可以估计,该地区年夜饭消费金额在家庭数量超过总数的三分之一
B.若该地区有2000个家庭,可以估计年夜饭消费金额超过2400元的有940个
C.可以估计,该地区家庭年夜饭消费金额的平均数不足2100元
D.可以估计,该地区家庭年夜饭消费金额的中位数超过2200元
8.(2023·湖南岳阳·统考二模)2022年6月,某学校为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”下水试航,增强学生的国防意识,组织了一次“逐梦深蓝,山河荣耀”国防知识竞赛,对100名学生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为,为进一步了解学生的答题情况,通过分层抽样,从成绩在区间内的学生中抽取6人,再从这6人中先后抽取2人的成绩作分析,下列结论正确的是( )
A.频率分布直方图中的
B.估计100名学生成绩的中位数是85
C.估计100名学生成绩的80%分位数是95
D.从6人中先后抽取2人作分析时,若先抽取的学生成绩位于,则后抽取的学生成绩在的概率是
9.(2023秋·辽宁·高二大连二十四中校联考期末)某公司为了解用户对其产品的满意度,随机调查了10个用户的满意度评分,评分用区间内的一个数来表示,该数越接近10表示满意度越高.用户对产品的满意度评分如下:7,8,9,7,5,4,10,9,4,7.则下列说法正确的是( )
A.这组数据的众数为7B.这组数据的第30百分位数为6
C.这组数据的极差为6D.这组数据的方差为40
10.(2023·浙江·模拟预测)用分层随机抽样法从某校高三年级学生的数学竞赛成绩(满分150分)中抽取一个容量为120的样本,其中男生成绩的数据有80个,女生成绩的数据有40个,将这80个男生的成绩分为6组,绘制得到如图所示的频率分布直方图,下列说法正确的是( )
A.男生成绩的样本数据在内的频率为0.015
B.男生成绩的样本数据的平均数为97
C.男生成绩的样本数据的第75百分位数为118
D.女生成绩的样本数据的平均数为91,则总样本的平均数为95
11.(2023·吉林白山·统考三模)某校抽取了某班20名学生的化学成绩,并将他们的成绩制成如下所示的表格.
下列结论正确的是( )
A.这20人成绩的众数为75
B.这20人成绩的极差为30
C.这20人成绩的分位数为65
D.这20人成绩的平均数为75
三、填空题
12.(2022春·陕西西安·高一统考期末)总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从如下随机数表的第1行的第7列和第8列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.
第1行:78 16 62 32 08 02 62 42 01 52 53 69 97 28 01 98
第2行:32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
13.(2023·全国·高三专题练习)下列命题中错误的是__.
①将一组数据中的每个数都加上或减去同一个常数后,均值与方差都不变;
②在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
③在吸烟与患肺病这两个分类变量的计算中,若由独立性检验知,在犯错误率不超过0.01的前提下,认为吸烟与患肺病有关系.若某人吸烟,则他有的可能性患肺病.
四、解答题
14.(2023·西藏拉萨·统考一模)某地足球协会为了调查球迷对第二十二届世界杯的了解情况,组织了一次相关知识测试活动,并从中抽取了50位球迷的测试成绩(取正整数,满分100分)进行统计,按照,,,,进行分组并作出频率分布直方图,如图所示.
(1)求a的值,并估计参与本次活动的球迷测试成绩的中位数;
(2)规定测试成绩不低于80分的为“真球迷”,测试成绩不低于90分的为“狂热球迷”,现从该样本中的“真球迷”中随机抽取2人,求抽取的2人中恰有1人为“狂热球迷”的概率.
15.(2023春·内蒙古赤峰·高三赤峰二中校考阶段练习)某新能源汽车公司从2018年到2022年汽车年销售量y(单位:万辆)的散点图如下:
记年份代码为
(1)根据散点图判断,模型①与模型②,哪一个更适宜作为年销售量y关于年份代码x的回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y关于x的回归方程.
参考数据:
,
易错点一
利用随机数表确定样本忘记去掉重复数字
易错点二
使用直方图解题时错把纵坐标当成频率
易错点三
对百分位数理解不到位
易错点四
混淆相关系数和决定系数
易错点五
求回归直线方程计算错误
易错点六
求解独立性检验问题对的值理解不准确
A
总计
认可
13
5
18
不认可
7
15
22
总计
20
20
40
P(K2≥k)
0.25
0.15
0.10
0.05
0.025
0.010
0.001
k
1.323
2.072
2.706
3.841
5.024
6.635
10.828
男
女
总计
喜欢
不喜欢
总计
成绩
60
65
70
75
80
85
90
人数
2
3
3
5
4
2
1
34
55
979
657
2805
相关试卷 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利