所属成套资源:新高考数学二轮复习易错题专练 (含解析)
新高考数学二轮复习易错题专练易错点14 统计与统计案例(含解析)
展开
这是一份新高考数学二轮复习易错题专练易错点14 统计与统计案例(含解析),共23页。
易错点14 统计与统计案例
易错题【01】利用随机数表确定样本忘记去掉重复数字
抽签法和随机数表法都是简单随机抽样的方法,但是抽签法适合在总体和样本都较少,容易搅拌均匀时使用,而随机数表法除了适合总体和样本都较少的情况外,还适用于总体较多但是需要的样本较少的情况,这时利用随机数表法能够快速地完成抽样.在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
易错题【02】对频率分步直方图理解不准确致误
1.解决频率分布直方图问题时要抓住3个要点
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总体数.
2. 用频率分布直方图估计众数、中位数、平均数的方法
(1)众数为频率分布直方图中最高矩形底边中点横坐标;
(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和。
易错题【03】求回归直线方程计算错误
1.回归直线方程
(1)通过求的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.该式取最小值时的,的值即分别为,.
(2)两个具有线性相关关系的变量的一组数据:,,…,,其回归方程为,则
2.求回归直线方程运算量一般比较大,求解时运算要格外细心,防止运算失分,此外还要注意题中有无参考数据,防止重复运算。
易错题【04】求解独立性检验问题对的值理解不准确
(1)像下表所示列出两个分类变量的频数表,称为列联表.假设有两个分类变量和,它们的可能取值分别为和,其样本频数列联表(称为列联表)为
y1
y2
总计
x1
a
b
x2
c
d
总计
(2)对2×2列联表的说明
在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
(3)构造一个随机变量 ,其中为样本容量.如果的观测值,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过.上面这种利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.
01
某工厂为了对40个零件进行抽样调查,将其编号为00,01,…38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,选出来的第5个零件编号是( )
0647 4373 8636 9647 3661 4698 6371 6233 2616 8045 6011 1410
9577 7424 6762 4281 1457 2042 5332 3732 2707 3607 5124 5179
A.36 B.16 C.11 D.14
【警示 】前面有2个36,忽略去掉重复数字,误选B
【答案】C
【问诊】从第一行第3列开始,由左至由一次读取,即47开始读取,在编号范围内的提取出来,可得,则选出来的第5个零件编号是.故选C.
【叮嘱】在使用随机数法时,要注意把超过总体号码或出现重复号码的数字舍去.
1.天气预报说,在今后的三天中,每三天下雨的情况不完全相同,每一天下雨的概率均为.现采用随机模拟试验的方法估计这三天中恰有两天下雨的概率:用1,2,3,4表示下雨,从下列随机数表的第1行第2列开始读取直到末尾从而获得个数据.据此估计,这三天中恰有两天下雨的概率近似为( )
19 07 96 61 91 92 52 71 93 28 12 45 85 69 19 16
83 43 12 57 39 30 27 55 64 88 73 01 13 53 79 89
A. B. C. D.不确定
【答案】B
【解析】每3个数为一组读取,则有:907,966,191,925,271,932,812,458,569,191,683,431,257,393,027,556,488,730,113,537,989共21组数据,其中满足条件的有191,271,932,812,191,393共有6组,∴这三天中恰有两天下雨的概率近似为.故选B
2. (2021届江西省赣州市高三二模)某口罩生产工厂为了了解口罩的质量,现利用随机数表对生产的50只口罩进行抽样检测,先将50个零件进行编号为01,02,03,…,50,从中抽取10个样本,下图提供随机数表的第2行到第4行,若从表中第3行第4列开始向右读取数据,则得到的第5个样本编号是__________.
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 15 53 31 34 57 86 01 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
【答案】.
【解析】从表中第3行第4列开始向右读取数据,依次为:所以得到的第5个样本编号是
02
(2017年高考数学课标Ⅱ卷理科)(12分)淡水养殖场进行某水产品的新、旧网箱养殖方法的
产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg)某频率直
方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)
【警示】本题出错主要原因是把高看作频率,导致 运算错误
【问诊】(Ⅰ)旧养殖法的箱产量低于50kg的频率为0.012×5+0.014×5+0.024×5+0.034×5+0.040×5=0.62,由于两种养殖方法的箱产量相互独立,
于是P(A)=0.62×0.66=0.4092
(Ⅱ)旧养殖法的箱产量低于50kg的有100×0.62=62箱,不低于50kg的有38箱,新养殖法的箱产量不低于50kg的有100×0.66=66箱,低于50kg的有34箱,得到2×2列联表如下:
箱产量0.50,不低于55kg的频率为0.046×5+0.010×5+0.008×5=0.32400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3841
6.635
10.828
【解析】(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次
人次
空气质量不好
空气质量好
,
因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
2.(2022届广西玉林市、贵港市高三12月模拟)2021年8月份,义务教育阶段“双减”政策出台,某小学在课后延时服务开设音乐、科技、体育等特色课程,为进一步了解学生选课的情况,随机选取了200人进行调查问卷,整理数据后获得如下统计表:
喜欢体育
不喜欢体育
已选体育课(组)
75
25
未选体育课(组)
45
55
(1)若从样本内喜欢体育的120人中用分层抽样方法随机抽取16人,问应在组、组各抽取多少人?
(2)能否有99.5%的把握认为选报体育延时课与喜欢体育有关?
附:
0.010
0.005
0.001
6.635
7.879
10.828
.
【解析】(1)依题意,分层抽样的抽样比为,则有,,
所以在组中抽取10人,在组中抽取6人.
(2)依题意,列联表为:
喜欢体育
不喜欢体育
合计
已选体育课(组)
75
25
100
未选体育课(组)
45
55
100
合计
120
80
200
于是得的观测值:,
所以有99.5%的把握认为选报体育延时课与喜欢体育有关.
错
1.(2022届云南省师范大学附属中学高三高考适应性月考)某公司利用随机数表对生产的900支乙肝疫苗进行抽样测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第5个数的编号是( )
1676622766 5650267107 3290797853 1355385859 8897541410
1256859926 9696682731 0503729315 5712101421 8826498176
5559563564 3854824622 3162430990 0618443253 2383013030
A.827 B.310 C.503 D.729
【答案】C
【解析】从表中第4行第4列开始向右读取分别为
685,992(舍),696,966(舍),827,310,503,第5个数为503,
故选C.
2.(2022届天津市第一零二中学高三上学期期中)某高校调查了400名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为,,,,.根据直方图这400名学生中每周的自习时间不足22.5小时的人数是( )
A.90 B.130 C.250 D.60
【答案】A
【解析】求出每周的自习时间不足22.5小时所占的频率,人数 ,故选A.
3.某校为了解学生体能素质,随机抽取了名学生,进行体能测试.并将这名学生成绩整理得如下频率分布直方图.根据此频率分布直方图.下列结论中不正确的是( )
A.这名学生中成绩在内的人数占比为
B.这名学生中成绩在内的人数有人
C.这名学生成绩的中位数为
D.这名学生的平均成绩(同一组中的数据用该组区间的中点值做代表)
【答案】C
【解析】根据此频率分布直方图,成绩在内的频率为,所以A正确;这名学生中成绩在内的人数为所以B正确;根据此频率分布直方图,,,可得这名学生成绩的中位数,所以C错误﹔根据频率分布直方图的平均数的计算公式,可得:所以D正确.
故选C.
4.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
计算得,.
参照下表,
0.050
0.010
0.001
3.841
6.635
10.828
下列结论正确的是( )
A.在犯错误的概率不超过的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过的前提下,认为“生育意愿与城市级别无关”
C.有以上的把握认为“生育意愿与城市级别有关”
D.有以上的把握认为“生育意愿与城市级别无关”
【答案】C
【解析】因为,所以有以上的把握认为“生育意愿与城市级别有关”,故选项A、B、D不正确,故选C.
5.某医疗机构通过抽样调查(样本容量,利用列联表和统计量研究患肺病是否与吸烟有关.计算得,经查对临界值表知,现给出四个结论,其中正确的是( )
A.在100个吸烟的人中约有95个人患肺病
B.若某人吸烟,那么他有95%的可能性患肺病
C.有95%的把握认为“患肺病与吸烟有关”
D.只有5%的把握认为“患肺病与吸烟有关”
【答案】C
【解析】计算得,经查对临界值表知,
有的把握说患肺病与吸烟有关,故选C.
6.(2022届广东省江门市高三上学期10月月考)在样本频率分布直方图中,共有5个小矩形,已知落在最中间这组的频数是20,且最中间位置的小矩形的面积是其余小矩形面积之和的则这个样本容量是___________
【答案】100
【解析】设最中间位置的小矩形的面积为S,则,得,即最中间这组的频率为,∵频数是20,∴样本容量是.
7.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新型冠状病毒灭活疫苗已获国家药监局批准附条件上市.在新型冠状病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新型冠状病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):
被新型冠状病毒感染
未被新型冠状病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
计算可知,在犯错误的概率最多不超过______的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新型冠状病毒感染的效果”.
参考公式:,.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.481
5.024
6.635
7.879
10.828
【答案】0.05%
【解析】完善2×2列联表如下:
被新型冠状病毒感染
未被新型冠状病毒感染
合计
注射疫苗
10
40
50
未注射疫苗
20
30
50
合计
30
70
100
因为,所以在犯错误的概率最多不超过0.05的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新型冠状病毒感染的效果”.
8.为保障食品安全,某地食品监管部门对辖区内甲、乙两家食品企业进行检查,分别从这两家企业生产的某种同类产品中随机抽取了100件作为样本,并以样本的一项关键质量指标值为检测依据.已知该质量指标值对应的产品等级如下:
质量指标值
,
,
,
,
,
,
等级
次品
二等品
一等品
二等品
三等品
次品
根据质量指标值的分组,统计得到了甲企业的样本频率分布直方图和乙企业的样本频数分布表(如下面表,其中.
质量指标值
频数
,
2
,
18
,
48
,
14
,
16
,
2
合计
100
(1)现从甲企业生产的产品中任取一件,试估计该件产品为次品的概率;
(2)为守法经营、提高利润,乙企业将所有次品销毁,并将一、二、三等品的售价分别定为120元、90元、60元.一名顾客随机购买了乙企业销售的2件该食品,记其支付费用为元,用频率估计概率,求的分布列和数学期望;
(3)根据图表数据,请自定标准,对甲、乙两企业食品质量的优劣情况进行比较.
【解析】(1)由,
解得,
所以甲企业的样本中次品的频率为,
即从甲企业生产的产品中任取一件,该件产品为次品的概率是0.14;
(2)由图表知,乙企业在100件样本中合格品有96件,则一等品的概率为,
二等品的概率为,三等品的概率为,
由题意知,随机变量的可能取值为:120,150,180,210,240;
且,,,
,,
随机变量的分布列为:
120
150
180
210
240
所以的数学期望为;
(3)答案不唯一,参考如下:
①以产品的合格率(非次品的占有率)为标准,对甲、乙两家企业的食品质量进行比较,
由图表可知,甲企业产品的合格率约为0.86,乙企业产品的合格率约为0.96,即乙企业产品的合格率高于甲企业产品的合格率,
所以认为乙企业的食品生产质量更高.
②以产品次品率为标准,对甲、乙两家企业的食品质量进行比较也可得出结论.
③以产品中一等品的概率为标准,对甲、乙两家企业的食品质量进行比较,根据图表可知,甲企业产品中一等品的概率约为0.4,
乙企业产品中一等品的概率约为0.48,即一企业产品中一等品的概率高于甲企业产品中一等品的概率,
所以乙企业的食品生产质量更高.
④根据第(2)问的定价,计算购买一件产品费用的数学期望,从而比较甲、乙两个企业产品的优劣.
9.(2022届陕西省西安市高三上学期模拟)某高校数学系为了控制大一学生上课使用手机,针对上课使用手机情况,进行量化比,若发现上课使用手机则扣除其对应的积分,根据调查发现每次被扣分数与本系一大学生每周上课使用手机人数的关系如下表所示:
每次被扣分数x(单位:分)
0
2
5
8
10
每周上课使用手机人数y(单位:次)
50
25
20
15
10
(1)试根据以上数据,建立y关于x的回归直线方程(结果保留一位小数);
参考公式:线性回归方程中,.
(2)根据上述回归直线方程分析:每次扣分为多少时(精确到整数分)该系大一新生被扣分的总数最大;
(3)若学校规定,大一新生每学期(按20周上课计算)因为上课使用手机被扣分总数不超过1000分,则该系大一被定为控制手机合格,那么,每周上课使用手机至少扣多少分时(扣分不低于5分,精确到整数),数学系才能被定为控制手机合格?(参考数据:)
【解析】(1)由表中数据可得,,
,
,
所以,
所以,
所以y关于x的线性回归方程为.
(2)设大一每周扣分总数为,
则由题意
因为函数对称轴方程为,
由题意, 时,有最大值,
即每次扣分为6时,该系大一新生被扣分的总数最大;
(3)设每周上课使用手机扣x分,
则数学系大一学生每学期扣分为,
令,
即,
解得或,
由题意,可知每周至少扣分11分时,数学系才能被定为控制手机合格.
10.(2022届重庆市巴蜀中学高三上学期月考)某药厂主要从事治疗某种呼吸道慢性疾病的药物的研发和生产.在研发过程中,为了考察药物对治疗慢性呼吸道疾病的效果,对200个志愿者进行了药物试验,根据统计结果,得到如下列联表.
药物
慢性疾病
合计
未患病
患病
未服用
服用
合计
(1)完成该列联表并判断是否有的把握认为药物对治疗慢性呼吸道疾病有效?并说明理由;
(2)该药厂研制了一种新药,宣称对治疗疾病的有效率为,随机选择了个病人,经过该药治疗后,治愈的人数不超过人,你是否怀疑该药厂的宣传?并说明理由.
附:,.
【解析】(1)列联表如下:
药物
慢性疾病
合计
未患病
患病
未服用
服用
合计
,
所有没有的把握认为药物对治疗慢性呼吸道疾病有效.
(2)因为治愈人数不超过人为一个随机事件,在某一次试验中可能发生.
所以,可以不怀疑.
相关试卷
这是一份新高考数学二轮复习易错题专练易错点12 圆锥曲线(含解析),共20页。
这是一份新高考数学二轮复习易错题专练易错点11 直线与圆(含解析),共12页。
这是一份新高考数学二轮复习易错题专练易错点10 立体几何(含解析),共27页。