2023年高考数学考前20天终极冲刺之统计
展开
这是一份2023年高考数学考前20天终极冲刺之统计,共46页。
2023年高考数学考前20天终极冲刺之统计
一.选择题(共8小题)
1.(2023•柳州三模)某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人,进行独立性检验,经计算得,临界值如右表,则下列说法中正确的是( )
α
0.15
0.10
0.05
0.025
0.010
χα
2.072
2.076
3.841
5.024
6.635
A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”
B.有99%的把握认为“学生对2022年冬奥会的关注与性别有关”
C.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”
D.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别无关”
2.(2023•广东一模)如图所示是中国2012﹣2021年汽车进、出口量统计图,则下列结论错误的是( )
A.2012﹣2021年中国汽车进口量和出口量都是有增有减的
B.从2018年开始,中国汽车的出口量大于进口量
C.2012﹣2021年中国汽车出口量的第60百分位数是106万辆
D.2012﹣2021年中国汽车进口量的方差大于出口量的方差
3.(2023•陕西模拟)下列说法中正确的是( )
A.回归直线方程为y=1.23x+0.08,则样本点的中心可以为(4,5)
B.采用系统抽样,从800名学生中抽取一个容量为40的样本,则分组的组距为40
C.“a>b”是“a2>b2”成立的充分不必要条件
D.命题p:∀x∈R,2x>0,则¬p:∃x0∈R,
4.(2023春•沙坡头区校级月考)某校课外学习小组研究某作物种子的发芽率y和温度x(单位:℃)的关系,由实验数据得到如图所示的散点图.由此散点图判断,最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2 (b>0)
C.y=a+bex D.y=a+blnx
5.(2023春•商丘月考)甲、乙两班各有10名同学参加智力测试,他们的分数用茎叶图表示如下,则下列判断错误的是( )
A.甲班的分数在100以上的人数比乙班的少
B.甲班的极差比乙班的小
C.甲班与乙班的中位数相等
D.甲班的平均数与乙班的相等
6.(2022秋•聊城期末)某校举办了迎新年知识竞赛,将100人的成绩整理后画出的频率分布直方图如图,则根据频率分布直方图,下列结论不正确的是( )
A.中位数70 B.众数75 C.平均数68.5 D.平均数70
7.(2023•天津一模)某校1000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为150
8.(2023•甘肃模拟)“稻草很轻,但是他迎着风仍然坚韧,这就是生命的力量,意志的力量”“当你为未来付出踏踏实实努力的时候,那些你觉得看不到的人和遇不到的风景都终将在你生命里出现”…当读到这些话时,你会切身体会到读书破万卷给予我们的力量.为了解某普通高中学生的阅读时间,从该校随机抽取了800名学生进行调查,得到了这800名学生一周的平均阅读时间(单位:小时),并将样本数据分成九组,绘制成如图所示的频率分布直方图,则从这800名学生中随机抽取一人,周平均阅读时间在(10,12]内的频率为( )
A.0.20 B.0.10 C.0.15 D.0.30
二.多选题(共4小题)
(多选)9.(2023•岳阳模拟)2022年6月,某学校为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”下水试航,增强学生的国防意识,组织了一次“逐梦深蓝,山河荣耀”国防知识竞赛,对100名学生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[50,60),[60,70),[70,80),[80,90),[90,100],为进一步了解学生的答题情况,通过分层抽样,从成绩在区间[70,90)内的学生中抽取6人,再从这6人中先后抽取2人的成绩作分析,下列结论正确的是( )
A.频率分布直方图中的x=0.030
B.估计100名学生成绩的中位数是85
C.估计100名学生成绩的80%分位数是95
D.从6人中先后抽取2人作分析时,若先抽取的学生成绩位于[70,80),则后抽取的学生成绩在[80,90)的概率是
(多选)10.(2023•常德模拟)以下说法正确的是( )
A.89,90,91,92,93,94,95,96,97的第75百分位数为95
B.具有相关关系的两个变量x,y的一组观测数据(x1,y1),(x2,y2),…,(xn,yn),由此得到的线性回归方程为,回归直线至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.相关系数r的绝对值越接近于1,两个随机变量的线性相关性越强
D.已知随机事件A,B满足P(A)>0,P(B)>0,且P(B|A)=P(B),则事件A与B不互斥
(多选)11.(2022秋•辽阳期末)已知关于变量x,y的4组数据如表所示:
x
6
8
10
12
y
a
10
6
4
根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则( )
A.a=12 B.变量x,y正相关
C. D.
(多选)12.(2023春•卧龙区校级月考)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:
广告费用x/万元
2
3
4
5
6
销售额y/万元
19
25
34
38
44
根据上表可得线性回归方程为y=6.3x+,下列说法不正确的是( )
A.回归直线y=6.3x+必经过样本点(2,19),(6,44)
B.点(,)未必在回归直线y=6.3x+上
C.方程中6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元
D.据此模型预测广告费用为7万元时销售额为50.9万元
三.填空题(共5小题)
13.(2022秋•资阳期末)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,蟋蟀鸣叫的频率x(单位:次数/分钟)与气温y(单位:°C)有较强的线性相关关系.某同学在当地通过观测,得到如下数据,并利用最小二乘法建立了y关于x的线性回归方程.当蟋蟀每分钟鸣叫52次时,该地当时的气温预报值为 .
x(次数/分数)
24
36
40
60
y(℃)
26
28.6
30
35.4
14.(2023•新乡二模)某中学有高中生2500人,初中生3750人.用分层抽样的方法从该校学生中抽取5人,组成校篮球运动小组,则从高中生中抽取 人,若从这5人中任意选取2人为组长,则初中生和高中生各有1人为组长的概率为 .
15.(2023春•天心区校级月考)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有 人.(请将所有可能的结果都填在横线上)
附表:,其中n=a+b+c+d.
α
0.050
0.010
xα
3.841
6.635
16.(2023春•天心区校级月考)有如下四个命题:
①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.
②相关系数r=﹣0.83,表明两个变量的相关性较弱.
③若由一个2×2列联表中的数据计算得χ2的观测值约为4.103,则认为两个变量有关,此推断犯错误的概率不超过0.05.(参考第16题附表)
④用最小二乘法求出一组数据(xi,yi)(i=1,2,⋯,n)的回归直线方程后要进行残差分析,相应数据(xi,yi)(i=1,2,⋯,n)的残差是指.
以上命题错误的序号是 .
17.(2023•船山区校级模拟)据成都市气象局统计,2022年3月成都市连续5天的日平均气温如表所示.由表中数据可得,这5天的日平均气温y(℃)关于日期x的线性回归方程为.据此预测3月15日成都市的平均气温为 ℃.
日期x
8
9
10
11
12
平均气温y(℃)
20.5
21.5
21.5
22
22.5
四.解答题(共5小题)
18.(2023•自贡模拟)某商店销售某种产品,为了解客户对该产品的评价,现随机调查了200名客户,其评价结果为“一般”或“良好”,并得到如下列联表:
一般
良好
合计
男
20
100
120
女
30
50
80
合计
50
150
200
(1)通过计算判断,有没有99%的把握认为客户对该产品的评价结果与性别有关系?
(2)利用样本数据,在评价结果为“良好”的客户中,按照性别用分层抽样的方法抽取了6名客户.若从这6名客户中随机选择2名进行访谈,求所抽取的2名客户中至少有1名女性的概率.
附表及公式:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
其中,n=a+b+c+d.
19.(2023春•湖北月考)某国在实弹演习中分析现有导弹技术发展方案的差异,有以下两种方案:
方案1:发展一弹多头主动制导技术,即一枚一弹多头导弹的弹体含有3个弹头,每个弹头独立命中的概率均为0.415,一枚弹体至少有一个弹头命中即认为该枚导弹命中,演习中发射该导弹10枚;
方案2:发展一弹一头导弹的机动性和隐蔽性,即一枚一弹一头导弹的弹体只含一个弹头,演习中发射该导弹30枚,其中22枚命中.
(1)求一枚一弹多头导弹命中的概率(精确到0.001),并据此计算本次实战演习中一弹多头导弹的命中枚数(取0.5853≈0.200,0.4153≈0.0711,结果四舍五入取整数);
(2)结合(1)的数据,根据小概率值α=0.050的独立性检验,判断本次实战演习中两种方案的导弹命中率是否存在明显差异.
附:,其中n=a+b+c+d.
P(K2≥k)
0.100
0.050
0.025
0.010
0.001
k
2.706
3.841
5.024
6.635
10.828
20.(2023•岳阳模拟)住房和城乡建设部等六部门发布通知提出,到2025年,农村生活垃圾无害化处理水平明显提升.我国生活垃圾主要有填埋、焚烧与堆肥三种处理方式,随着我国垃圾处理结构的不断优化调整,焚烧处理逐渐成为市场主流.根据国家统计局公布的数据,对2013—2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
生活垃圾焚烧无害化处理厂的个数y
166
188
220
249
286
331
389
463
(1)由表中数据可知,可用线性回归模型拟合y与x之间的关系,请用相关系数加以说明;(精确到0.01)
(2)求出y关于x的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用所求的线性回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,,5732=328329,,.
21.(2023•广西模拟)2016~2020年广西城乡居民人均可支配收入的柱形图如图所示.
(1)不考虑价格因素,求广西2020年农村居民人均可支配收入的年增长率(结果精确到0.1%).
(2)现欲了解广西各年城镇居民人均可支配收入y(单位:元)与农村居民人均可支配收入x(单位:元)是否存在较好的线性关系.设广西2016年城镇居民人均可支配收入为y1元,农村居民人均可支配收入为x1元,2017年对应的数据分别为y2,x2,2018年对应的数据分别为y3,x3,2019年对应的数据分别为y4,x4,2020年对应的数据分别为y5,x5.根据图中的五组数据,得到y关于x的线性回归方程为.试问y关于x的线性相关系数r是否大于0.95,并判断y与x之间是否存在较好的线性关系.
参考数据:,,.
附:样本的相关系数,
线性回归方程中的系数,.
22.(2022秋•营口期末)某市销售商为了解A、B两款手机的款式与购买者性别之间的是否有关系,对一些购买者做了问卷调查,得到2×2列联表如下表所示:
购买A款
购买B款
总计
女
25
______
______
男
______
40
______
总计
______
______
100
已知所调查的100人中,A款手机的购买者比B款手机的购买者少20人.
(1)将上面的2×2列联表补充完整;
(2)是否有99%的把握认为购买手机款式与性别之间有关,请说明理由;
(3)用样本估计总体,从所有购买两款手机的人中,选出4人作为幸运顾客,求4人中购买A款手机的人数不超过1人的概率.
附:
P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
参考公式:,n=a+b+c+d.
2023年高考数学考前20天终极冲刺之统计
参考答案与试题解析
一.选择题(共8小题)
1.(2023•柳州三模)某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人,进行独立性检验,经计算得,临界值如右表,则下列说法中正确的是( )
α
0.15
0.10
0.05
0.025
0.010
χα
2.072
2.076
3.841
5.024
6.635
A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”
B.有99%的把握认为“学生对2022年冬奥会的关注与性别有关”
C.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”
D.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别无关”
【考点】独立性检验.菁优网版权所有
【专题】对应思想;数学模型法;概率与统计;数据分析.
【分析】根据题意,对照临界值即可得出结论.
【解答】解:根据题意知,>5.024,
所以在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”.
故选:C.
【点评】本题考查了独立性检验的应用问题,是基础题.
2.(2023•广东一模)如图所示是中国2012﹣2021年汽车进、出口量统计图,则下列结论错误的是( )
A.2012﹣2021年中国汽车进口量和出口量都是有增有减的
B.从2018年开始,中国汽车的出口量大于进口量
C.2012﹣2021年中国汽车出口量的第60百分位数是106万辆
D.2012﹣2021年中国汽车进口量的方差大于出口量的方差
【考点】极差、方差与标准差;频率分布直方图.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】根据条形图,结合百分位数、方差的性质逐一判断即可.
【解答】解:由条形图可知2012﹣2021年中国汽车进口量和出口量都是有增有减的,所以选项A正确;
由条形图可知从2018年开始,中国汽车的出口量大于进口量,所以选项B正确;
2012﹣2021年中国汽车出口量由小到大排列为:72.3,73,89.7,92,99,104,108,115,121.5,212,因此第60百分位数是,所以选项C正确;
由条形图可知2012﹣2021年中国汽车进口量的波动小于出口量的波动,因此2012﹣2021年中国汽车进口量的方差小于出口量的方差,所以选项D不正确,
故选:D.
【点评】本题主要考查了统计图的应用,考查了百分位数的计算,属于基础题.
3.(2023•陕西模拟)下列说法中正确的是( )
A.回归直线方程为y=1.23x+0.08,则样本点的中心可以为(4,5)
B.采用系统抽样,从800名学生中抽取一个容量为40的样本,则分组的组距为40
C.“a>b”是“a2>b2”成立的充分不必要条件
D.命题p:∀x∈R,2x>0,则¬p:∃x0∈R,
【考点】线性回归方程;命题的真假判断与应用.菁优网版权所有
【专题】对应思想;综合法;概率与统计;简易逻辑;数学运算.
【分析】利用样本中心点过回归直线方程判断A,根据系统抽样的抽样方法判断B,取特殊值结合充分性和必要性的定义判断C,根据全称命题的否定判断D.
【解答】解:因为(4,5)在回归直线方程为y=1.23x+0.08上,
所以样本点的中心可以为(4,5),A正确;
采用系统抽样,从800名学生中抽取一个容量为40的样本,则分组的组距为,B错误;
当a=1,b=﹣2时,a>b不能推出a2>b2,C错误;
命题p:∀x∈R,2x>0,则¬p:∃x0∈R,,D错误.
故选:A.
【点评】本题主要考查了线性回归方程的性质,考查了系统抽样的定义,以及命题的否定,属于基础题.
4.(2023春•沙坡头区校级月考)某校课外学习小组研究某作物种子的发芽率y和温度x(单位:℃)的关系,由实验数据得到如图所示的散点图.由此散点图判断,最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2 (b>0)
C.y=a+bex D.y=a+blnx
【考点】线性回归方程;散点图.菁优网版权所有
【专题】综合题;函数思想;数学模型法;概率与统计;数据分析.
【分析】根据散点的分布和选项函数模型的特征可得出合适的回归方程类型.
【解答】解:由散点图可见,数据分布成递增趋势,但是呈现上凸效果,即增加缓慢.
A中,y=a+bx是直线型,均匀增长,不符合要求;
B中,y=a+bx2(b>0)是二次函数型,图象呈现下凸,增长也较快,不符合要求;
C中,y=a+be是指数型,爆炸式增长,增长快,不符合要求;
D中,y=a+blnx是对数型,增长缓慢,符合要求.
故对数型最适宜该回归模型.
故选:D.
【点评】本题考查了利用散点图选择回归模型的问题,属于基础题.
5.(2023春•商丘月考)甲、乙两班各有10名同学参加智力测试,他们的分数用茎叶图表示如下,则下列判断错误的是( )
A.甲班的分数在100以上的人数比乙班的少
B.甲班的极差比乙班的小
C.甲班与乙班的中位数相等
D.甲班的平均数与乙班的相等
【考点】茎叶图;众数、中位数、平均数.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】根据统计中的极差、中位数、平均数的定义,即可解出.
【解答】解:由图表看出甲班100分以上的有2人,乙班100分以上的有3人故选项A正确;
甲班的极差104﹣82=22,乙班的极差106﹣81=25,故选项B正确;
甲班的中位数为:=95.5,乙班的中位数为:=93.5,故选项C错误;
甲班的平均数为:=93,乙班的平均数为:=93,故选项D正确.
故选:C.
【点评】本题考查了统计与概率的基本概念,学生的数学运算能力,属于基础题.
6.(2022秋•聊城期末)某校举办了迎新年知识竞赛,将100人的成绩整理后画出的频率分布直方图如图,则根据频率分布直方图,下列结论不正确的是( )
A.中位数70 B.众数75 C.平均数68.5 D.平均数70
【考点】频率分布直方图.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】根据题意,由频率分布直方图分别计算,即可得到结果.
【解答】解:[40,50)的频率为,
因为最高小矩形的中点横坐标为75,显然众数是75,故B正确;
[40,50)的频率是0.1,[50,60)的频率是0.15,[60,70)的频率是0.25,其频率和为0.5,所以中位数为70,故A正确;
平均数=45×0.1+55×0.15+65×0.25+75×0.35+85×0.1+95×0.05=68.5,所以C正确.
故选:D.
【点评】本题主要考查了频率分布直方图的应用,考查了平均数、众数和中位数的估计,属于基础题.
7.(2023•天津一模)某校1000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为150
【考点】频率分布直方图.菁优网版权所有
【专题】数形结合;数形结合法;概率与统计;数学运算.
【分析】根据所有矩形的面积和为1,求出a,由此利用频率分布直方图能求出结果.
【解答】解:由频率分布直方图,得:
10(2a+3a+7a+6a+2a)=1,解得a=0.005,故A错误;
前三个矩形的面积和为10(2a+3a+7a)=0.6,
∴这20名学生数学考试成绩的第60百分数为80,故B错误;
这20名学生数学考试成绩的众数为75,故C错误;
总体中成绩落在[60,70)内的学生人数为3a×10×1000=150,故D正确.
故选:D.
【点评】本题考查频率分布直方图的性质等基础知识,考查运算求解能力,是基础题.
8.(2023•甘肃模拟)“稻草很轻,但是他迎着风仍然坚韧,这就是生命的力量,意志的力量”“当你为未来付出踏踏实实努力的时候,那些你觉得看不到的人和遇不到的风景都终将在你生命里出现”…当读到这些话时,你会切身体会到读书破万卷给予我们的力量.为了解某普通高中学生的阅读时间,从该校随机抽取了800名学生进行调查,得到了这800名学生一周的平均阅读时间(单位:小时),并将样本数据分成九组,绘制成如图所示的频率分布直方图,则从这800名学生中随机抽取一人,周平均阅读时间在(10,12]内的频率为( )
A.0.20 B.0.10 C.0.15 D.0.30
【考点】频率分布直方图.菁优网版权所有
【专题】计算题;转化思想;综合法;概率与统计;数学运算.
【分析】直接利用频率分布直方图的性质求解即可.
【解答】解:由题意可得(0.002+0.003+0.005+0.005+0.15+a+0.005+0.004+0.001)×2=1,
解得a=0.1,
∴周平均阅读时间在(10,12]内的频率为2a=0.20.
故选:A.
【点评】本题考查频率分布直方图的性质等基础知识,考查运算求解能力,是基础题.
二.多选题(共4小题)
(多选)9.(2023•岳阳模拟)2022年6月,某学校为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”下水试航,增强学生的国防意识,组织了一次“逐梦深蓝,山河荣耀”国防知识竞赛,对100名学生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[50,60),[60,70),[70,80),[80,90),[90,100],为进一步了解学生的答题情况,通过分层抽样,从成绩在区间[70,90)内的学生中抽取6人,再从这6人中先后抽取2人的成绩作分析,下列结论正确的是( )
A.频率分布直方图中的x=0.030
B.估计100名学生成绩的中位数是85
C.估计100名学生成绩的80%分位数是95
D.从6人中先后抽取2人作分析时,若先抽取的学生成绩位于[70,80),则后抽取的学生成绩在[80,90)的概率是
【考点】频率分布直方图.菁优网版权所有
【专题】计算题;对应思想;综合法;概率与统计;数学运算.
【分析】根据频率之和为1可判断A,根据中位数为面积在0.5的位置可判断B,根据百位数的计算可判断C,根据条件概率的计算公式可判断D.
【解答】对于A:根据学生的成绩都在5(0分)到100分之间的频率和为1,
可得10×(0.005+0.01+0.015+x+0.040)=1,解得x=0.030,故A正确;
对于B:全校学生成绩的中位数为(0.005+0.010+0.015)×10=0.3<0.5,(0.005+0.010+0.015+x)×10=0.6>0.5,
故中位数位于[80,90]之间,故中位数为,故B错误,
对于C:全校学生成绩的样本数据的80%分位数约为分,故C正确.
对于D:在被抽取的学生中,成绩在区间[70,80)和[80,90)的学生人数之比为,
故[70,80)抽取了2人,[80,90)中抽取了4人,
先抽取的学生成绩位于[70,80),则第二次抽取时,是在5个人中抽取,
而此时学生成绩在[80,90)的个数有4个,故概率为,故D错误.
故选:AC.
【点评】本题主要考查频率分布直方图,考查运算求解能力,属于中档题.
(多选)10.(2023•常德模拟)以下说法正确的是( )
A.89,90,91,92,93,94,95,96,97的第75百分位数为95
B.具有相关关系的两个变量x,y的一组观测数据(x1,y1),(x2,y2),…,(xn,yn),由此得到的线性回归方程为,回归直线至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.相关系数r的绝对值越接近于1,两个随机变量的线性相关性越强
D.已知随机事件A,B满足P(A)>0,P(B)>0,且P(B|A)=P(B),则事件A与B不互斥
【考点】线性回归方程;命题的真假判断与应用;条件概率与独立事件;相关系数.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】对于A选项:结合百分位数的定义即可求解;对于B选项:结合经验回归方程的性质即可求解;对于C选项:根据相关系数的性质即可判断;对于D选项:根据互斥事件的定义和事件的相互独立性即可求解.
【解答】解:对于A选项:从小到大排列共有9个数据,则i=9×75%=6.75不是整数,则第75百分位数为从小到大排列的第7个数据,即第75百分位数为95,所以A选项正确;
对于B选项:线性回归方程不一定经过点(x1,y1),(x2,y2),⋯⋯,(xn,yn)中的任何一个点,但一定经过样本的中心点即,所以B选项错误;
对于C选项:若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的绝对值越接近于1,所以C选项正确;
对于D选项:因为P(B|A)=P(B),则P(AB)=P(B|A)P(A)=P(B)P(A),
则事件A与B相互独立,所以事件A与B不互斥,所以D选项正确;
故选:ACD.
【点评】本题主要考查了线性回归方程的定义,考查了百分位数的估计,以及线性相关系数r的性质,属于中档题.
(多选)11.(2022秋•辽阳期末)已知关于变量x,y的4组数据如表所示:
x
6
8
10
12
y
a
10
6
4
根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则( )
A.a=12 B.变量x,y正相关
C. D.
【考点】线性回归方程.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】根据回归直线必过点解得a=12,所以选项A正确;由回归方程和表格可知选项B错误;利用相关系数求出,所以选项C正确,选项D错误.
【解答】解:回归直线必过点,,,解得a=12,所以选项A正确;
由回归方程和表格可知,变量x,y负相关,所以选项B错误;
,所以选项C正确,选项D错误.
故选:AC.
【点评】本题考查线性回归方程的运用,解题的关键是利用线性回归方程恒过样本中心点,这是线性回归方程中最常考的知识点,属于基础题.
(多选)12.(2023春•卧龙区校级月考)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:
广告费用x/万元
2
3
4
5
6
销售额y/万元
19
25
34
38
44
根据上表可得线性回归方程为y=6.3x+,下列说法不正确的是( )
A.回归直线y=6.3x+必经过样本点(2,19),(6,44)
B.点(,)未必在回归直线y=6.3x+上
C.方程中6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元
D.据此模型预测广告费用为7万元时销售额为50.9万元
【考点】线性回归方程.菁优网版权所有
【专题】计算题;方程思想;综合法;概率与统计;数学运算.
【分析】根据回归方程的含义与性质判断ABC,根据最小二乘法求出回归方程可判断D.
【解答】解:回归直线,不一定经过任何一个样本点,故A错;
由最小二乘法可知,这组数据的样本中心点一定在回归直线上,故B错;
回归系数6.3的含义是广告费用每增加1万元,预测销售额增加6.3万元,故C错;
,
所以样本中心为(4,32),
将(4,32)代入可得,则回归方程为,
x=7时,,故D正确.
故选:ABC.
【点评】本题主要考查回归方程的含义与性质,考查根据最小二乘法求出回归方程以及利用回归方程估计总体,属于基础题.
三.填空题(共5小题)
13.(2022秋•资阳期末)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,蟋蟀鸣叫的频率x(单位:次数/分钟)与气温y(单位:°C)有较强的线性相关关系.某同学在当地通过观测,得到如下数据,并利用最小二乘法建立了y关于x的线性回归方程.当蟋蟀每分钟鸣叫52次时,该地当时的气温预报值为 33 .
x(次数/分数)
24
36
40
60
y(℃)
26
28.6
30
35.4
【考点】线性回归方程.菁优网版权所有
【专题】转化思想;转化法;概率与统计;数学运算.
【分析】由回归直线必过样本中心求参后,代入x的值可得结果.
【解答】解:∵,,
又∵必过样本中心,
∴,解得,
∴,
∴当x=52时,.
故答案为:33.
【点评】本题主要考查线性回归方程的应用,属于基础题.
14.(2023•新乡二模)某中学有高中生2500人,初中生3750人.用分层抽样的方法从该校学生中抽取5人,组成校篮球运动小组,则从高中生中抽取 2 人,若从这5人中任意选取2人为组长,则初中生和高中生各有1人为组长的概率为 .
【考点】分层抽样方法.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】根据分层抽样法可得第一空答案;用列举法可得第二空答案.
【解答】解:应从高中生中抽取人,记为A,B,则应从初中生中抽取3人,记为a,b,c.
从这5人中任意选取2人为组长,总事件包括AB,Aa,Ab,Ac,Ba,Bb,Bc,ab,ac,bc,共10种情况,
其中初中生和高中生各有1人为组长的事件包括Aa,Ab,Ac,Ba,Bb,Bc,共6种情况,故所求的概率.
故答案为:2;.
【点评】本题主要考查了分层抽样的定义,考查了古典概型的概率公式,属于基础题.
15.(2023春•天心区校级月考)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有 45,50,55,60,65 人.(请将所有可能的结果都填在横线上)
附表:,其中n=a+b+c+d.
α
0.050
0.010
xα
3.841
6.635
【考点】独立性检验.菁优网版权所有
【专题】计算题;方程思想;转化思想;综合法;点列、递归数列与数学归纳法;概率与统计;逻辑推理;数学运算.
【分析】根据题意,设男生有x人,结合题意建立2×2列联表,用x表示χ2的值,可得关于x的不等式,又由x为5的整数倍,分析可得x的值,即可得答案.
【解答】解:根据题意,设男生有x人,
由于男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的,
可得2×2列联表如下:
喜欢
不喜欢
合计
男生
x
女生
x
合计
2x
若认为喜欢网络游戏和性别有关,且该推断犯错误的概率超过0.01但不超过0.05,
则3.841<χ2<6.635.
∵,
∴,解得40.3<x<69.7,
又x为5的整数倍,则x可能的值为45,50,55,60,65,
故被调查的学生中男生可能人数为45,50,55,60,65;
故答案为:45,50,55,60,65.
【点评】本题考查独立性检验的应用,注意建立2×2列联表,属于基础题.
16.(2023春•天心区校级月考)有如下四个命题:
①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.
②相关系数r=﹣0.83,表明两个变量的相关性较弱.
③若由一个2×2列联表中的数据计算得χ2的观测值约为4.103,则认为两个变量有关,此推断犯错误的概率不超过0.05.(参考第16题附表)
④用最小二乘法求出一组数据(xi,yi)(i=1,2,⋯,n)的回归直线方程后要进行残差分析,相应数据(xi,yi)(i=1,2,⋯,n)的残差是指.
以上命题错误的序号是 ② .
【考点】线性回归方程;独立性检验;命题的真假判断与应用.菁优网版权所有
【专题】对应思想;分析法;概率与统计;数学运算.
【分析】求出两组数据的中位数判断①;
利用相关系数的意义判断②;
利用χ2的观测值与要求的临界值判断③;
利用残差的意义判断④作答.
【解答】解:对于①,甲组数据的中位数为45,乙组数据的中位数为,①正确;
对于②,相关系数|r|≥0.75时,两个变量有很强的相关性,②错误;
对于③,χ2的观测值约为4.103>3.841=x0.05,认为两个变量有关,此推断犯错误的概率不超过0.05,③正确;
对于④,残差分析中,相应数据(xi,yi)(i=1,2,...n)的残差,④正确,
所以命题错误的序号是②.
故答案为:②.
【点评】本题主要考查独立性检验,属于中档题.
17.(2023•船山区校级模拟)据成都市气象局统计,2022年3月成都市连续5天的日平均气温如表所示.由表中数据可得,这5天的日平均气温y(℃)关于日期x的线性回归方程为.据此预测3月15日成都市的平均气温为 23.85 ℃.
日期x
8
9
10
11
12
平均气温y(℃)
20.5
21.5
21.5
22
22.5
【考点】线性回归方程.菁优网版权所有
【专题】转化思想;转化法;概率与统计;数学运算.
【分析】先根据提供的数据求出平均数,代入方程可得回归方程,代入15可得答案.
【解答】解:由题意可得,,
则,得,
故预测3月15日成都市的平均气温为0.45×15+17.1=23.85(°C).
故答案为:23.85.
【点评】本题主要考查线性回归方程的应用,属于中档题.
四.解答题(共5小题)
18.(2023•自贡模拟)某商店销售某种产品,为了解客户对该产品的评价,现随机调查了200名客户,其评价结果为“一般”或“良好”,并得到如下列联表:
一般
良好
合计
男
20
100
120
女
30
50
80
合计
50
150
200
(1)通过计算判断,有没有99%的把握认为客户对该产品的评价结果与性别有关系?
(2)利用样本数据,在评价结果为“良好”的客户中,按照性别用分层抽样的方法抽取了6名客户.若从这6名客户中随机选择2名进行访谈,求所抽取的2名客户中至少有1名女性的概率.
附表及公式:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
其中,n=a+b+c+d.
【考点】独立性检验.菁优网版权所有
【专题】转化思想;转化法;概率与统计;数学运算.
【分析】(1)根据表中数据计算出K2的值,对比附表数据6.635,然后作出判断;
(2)先根据分层抽样计算出男、女客户并对男女生进行标记,列出“从6名学生中随机抽取2名”的所有基本事件,分析满足“抽取的两名学生中至少有1名女性”的基本事件,根据基本事件数之比求解出对应概率.
【解答】解:(1),
有99%的把握认为客户对该产品的评价结果与性别有关系.
(2)因为“效果较好”的男客户和女客户的人数之比为100:50,即为2:1,
所以抽取的6名客户中,男生有名,记为B1,B2,B3,B4,
女生有名,记为A1,A2,
从这6人中选取2人的所有基本事件有:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共15个.
其中恰好一个男生的基本事件有:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),共9个.
所以,抽取的2名学生中恰好有1名女性的概率为.
【点评】本题主要考查独立性检验公式,属于基础题.
19.(2023春•湖北月考)某国在实弹演习中分析现有导弹技术发展方案的差异,有以下两种方案:
方案1:发展一弹多头主动制导技术,即一枚一弹多头导弹的弹体含有3个弹头,每个弹头独立命中的概率均为0.415,一枚弹体至少有一个弹头命中即认为该枚导弹命中,演习中发射该导弹10枚;
方案2:发展一弹一头导弹的机动性和隐蔽性,即一枚一弹一头导弹的弹体只含一个弹头,演习中发射该导弹30枚,其中22枚命中.
(1)求一枚一弹多头导弹命中的概率(精确到0.001),并据此计算本次实战演习中一弹多头导弹的命中枚数(取0.5853≈0.200,0.4153≈0.0711,结果四舍五入取整数);
(2)结合(1)的数据,根据小概率值α=0.050的独立性检验,判断本次实战演习中两种方案的导弹命中率是否存在明显差异.
附:,其中n=a+b+c+d.
P(K2≥k)
0.100
0.050
0.025
0.010
0.001
k
2.706
3.841
5.024
6.635
10.828
【考点】独立性检验.菁优网版权所有
【专题】应用题;对应思想;数学模型法;概率与统计;数据分析.
【分析】(1)用对立事件求出一弹多头导弹命中的概率值,再计算本次实战演习中一弹多头导弹的命中枚数;
(2)由题意填写2×2列联表,计算K2,对照附表得出结论.
【解答】解:(1)由题意知,一枚一弹多头导弹命中的概率为P=1﹣(1﹣0.415)3=1﹣0.5853≈1﹣0.200=0.800,
据此计算本次实战演习中一弹多头导弹的命中枚数为10×0.800=8(枚);
(2)由题意,填写2×2列联表如下:
中
不中
合计
一弹多头
8
2
10
一弹一头
22
8
30
合计
30
10
40
计算K2==≈0.1778<3.841,
所以根据小概率值α=0.050的独立性检验,判断本次实战演习中两种方案的导弹命中率不存在明显差异.
【点评】本题考查了相互独立事件的概率计算问题,也考查了独立性检验的应用问题,是中档题.
20.(2023•岳阳模拟)住房和城乡建设部等六部门发布通知提出,到2025年,农村生活垃圾无害化处理水平明显提升.我国生活垃圾主要有填埋、焚烧与堆肥三种处理方式,随着我国垃圾处理结构的不断优化调整,焚烧处理逐渐成为市场主流.根据国家统计局公布的数据,对2013—2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
生活垃圾焚烧无害化处理厂的个数y
166
188
220
249
286
331
389
463
(1)由表中数据可知,可用线性回归模型拟合y与x之间的关系,请用相关系数加以说明;(精确到0.01)
(2)求出y关于x的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用所求的线性回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,,5732=328329,,.
【考点】线性回归方程.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】(1)由题意计算出,,结合已知代入相关系数r公式计算可得答案;
(2)计算出,代入可得y关于x的线性回归方程,2022年对应的年份代码x=10,代入所求线性回归方程可得答案;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能用所求线性回归方程预测,理由说出一点即可.
【解答】解:(1)由题意,,,
所以相关系数===,
因为y与x的相关系数r≈0.98,接近于1,
所以y与x的线性相关程度相当高,可用线性回归模型拟合y与x之间的关系;
(2)根据参考数据可得,=,
所以,
所以y关于x的线性回归方程为,
因为2022年对应的年份代码x=10,
所以当x=10时,,
即预测2022年全国生活垃圾焚烧无害化处理厂的个数为513;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能用所求线性回归方程预测,
理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
【点评】本题主要考查了相关系数的求解和性质,考查了利用最小二乘法求线性回归方程,属于中档题.
21.(2023•广西模拟)2016~2020年广西城乡居民人均可支配收入的柱形图如图所示.
(1)不考虑价格因素,求广西2020年农村居民人均可支配收入的年增长率(结果精确到0.1%).
(2)现欲了解广西各年城镇居民人均可支配收入y(单位:元)与农村居民人均可支配收入x(单位:元)是否存在较好的线性关系.设广西2016年城镇居民人均可支配收入为y1元,农村居民人均可支配收入为x1元,2017年对应的数据分别为y2,x2,2018年对应的数据分别为y3,x3,2019年对应的数据分别为y4,x4,2020年对应的数据分别为y5,x5.根据图中的五组数据,得到y关于x的线性回归方程为.试问y关于x的线性相关系数r是否大于0.95,并判断y与x之间是否存在较好的线性关系.
参考数据:,,.
附:样本的相关系数,
线性回归方程中的系数,.
【考点】线性回归方程.菁优网版权所有
【专题】转化思想;转化法;概率与统计;数学运算.
【分析】(1)根据表中数据计算人均可支配收入的年增长率即可;
(2)求出,再由已知求出,根据相关系数公式求出r.
【解答】解:(1)因为广西2020年农村居民人均可支配收入为14815元,广西2019年农村居民人均可支配收入为13676元,
所以广西2020年农村居民人均可支配收入的年增长率为;
(2),
y关于x的线性回归方程为,
所以,
所以,,
所以,
所以r>0.95,
故y与x之间存在较好的线性关系.
【点评】本题主要考查线性回归方程的应用,考查转化能力,属于中档题.
22.(2022秋•营口期末)某市销售商为了解A、B两款手机的款式与购买者性别之间的是否有关系,对一些购买者做了问卷调查,得到2×2列联表如下表所示:
购买A款
购买B款
总计
女
25
______
______
男
______
40
______
总计
______
______
100
已知所调查的100人中,A款手机的购买者比B款手机的购买者少20人.
(1)将上面的2×2列联表补充完整;
(2)是否有99%的把握认为购买手机款式与性别之间有关,请说明理由;
(3)用样本估计总体,从所有购买两款手机的人中,选出4人作为幸运顾客,求4人中购买A款手机的人数不超过1人的概率.
附:
P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
参考公式:,n=a+b+c+d.
【考点】独立性检验;古典概型及其概率计算公式.菁优网版权所有
【专题】整体思想;综合法;概率与统计;数学运算.
【分析】(1)由题目条件可将列联表补充完整;
(2)利用公式算得χ2,后比较其与6.635大小可得结果;
(3)由题目条件可得每次选出购买A款手机的人的概率均为,设X为4人中选出购买A款手机的人数,则,得P(X≤1)=P(X=0)+P(X=1).
【解答】解:(1)由题可得列联表如下:
购买A款
购买B款
总计
女
25
20
45
男
15
40
55
总计
40
60
100
(2)由题有:,
因为8.249>6.635,所以有99%的把握认为购买手机款式与性别之间有关;
(3)从所有购买两款手机的人中,选出4人可以看成做了4次独立重复试验,每次选出购买A款手机的人的概率均为,
设X为4人中选出购买A款手机的人数,,
所以,,
所以,
即不超过1人的概率.
【点评】本题主要考查了独立性检验的的应用,考查了二项分布的概率公式,属于中档题.
考点卡片
1.命题的真假判断与应用
【知识点的认识】
判断含有“或”、“且”、“非”的复合命题的真假,首先要明确p、q及非p的真假,然后由真值表判断复合命题的真假.
注意:“非p”的正确写法,本题不应将“非p”写成“方程x2﹣2x+1=0的两根都不是实根”,因为“都是”的反面是“不都是”,而不是“都不是”,要认真区分.
【解题方法点拨】
1.判断复合命题的真假,常分三步:先确定复合命题的构成形式,再指出其中简单命题的真假,最后由真值表得出复合命题的真假.
2.判断一个“若p则q”形式的复合命题的真假,不能用真值表时,可用下列方法:若“pq”,则“若p则q”为真;而要确定“若p则q”为假,只需举出一个反例说明即可.
3.判断逆命题、否命题、逆否命题的真假,有时可利用原命题与逆否命题同真同假,逆命题与否命题同真同假这一关系进行转化判断.
【命题方向】该部分内容是《课程标准》新增加的内容,几乎年年都考,涉及知识点多而且全,多以小题形式出现.
2.古典概型及其概率计算公式
【考点归纳】
1.定义:如果一个试验具有下列特征:
(1)有限性:每次试验可能出现的结果(即基本事件)只有有限个;
(2)等可能性:每次试验中,各基本事件的发生都是等可能的.
则称这种随机试验的概率模型为古典概型.
*古典概型由于满足基本事件的有限性和基本事件发生的等可能性这两个重要特征,所以求事件的概率就可以不通过大量的重复试验,而只要通过对一次试验中可能出现的结果进行分析和计算即可.
2.古典概率的计算公式
如果一次试验中可能出现的结果有n个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是;
如果某个事件A包含的结果有m个,那么事件A的概率为P(A)==.
【解题技巧】
1.注意要点:解决古典概型的问题的关键是:分清基本事件个数n与事件A中所包含的基本事件数.
因此要注意清楚以下三个方面:
(1)本试验是否具有等可能性;
(2)本试验的基本事件有多少个;
(3)事件A是什么.
2.解题实现步骤:
(1)仔细阅读题目,弄清题目的背景材料,加深理解题意;
(2)判断本试验的结果是否为等可能事件,设出所求事件A;
(3)分别求出基本事件的个数n与所求事件A中所包含的基本事件个数m;
(4)利用公式P(A)=求出事件A的概率.
3.解题方法技巧:
(1)利用对立事件、加法公式求古典概型的概率
(2)利用分析法求解古典概型.
3.条件概率与独立事件
【知识点的知识】
1、条件概率的定义:对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率叫做条件概率,用符号P(B|A)来表示.
(2)条件概率公式:称为事件A与B的交(或积).
(3)条件概率的求法:
①利用条件概率公式,分别求出P(A)和P(AB),得P(B|A)=,其中P(A)>0;
②借助古典概型概率公式,先求出事件A包含的基本事件数n(A),再在事件A发生的条件下求出事件B包含的基本事件数,即n(A∩B),得P(B|A)=
【解题方法点拨】
典例1:利用计算机产生1到6之间取整数值的随机数a和b,在a+b为偶数的条件下,|a﹣b|>2发生的概率是 .
解:由题意得,利用计算机产生1到6之间取整数值的随机数a和b,基本事件的总个数是6×6=36,即(a,b)的情况有36种,
事件“a+b为偶数”包含基本事件:
(1,1),(1,3),(1,5),(2,2),(2,4),(2,6),
(3,1),(3,3),(3,5),(4,2),(4,4),(4,6)
(5,1),(5,3),(5,5),(6,2),(6,4),(6,6)共18个,
“在a+b为偶数的条件下,|a﹣b|>2”包含基本事件:
(1,5),(2,6),(5,1),(6,2)共4个,
故在a+b为偶数的条件下,|a﹣b|>2发生的概率是P==
故答案为:
典例2:甲乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错不答都得0分,已知甲队3人每人答对的概率分别为,,,乙队每人答对的概率都是.设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分.
(Ⅰ)求随机变量ξ的分布列及其数学期望E(ξ);
(Ⅱ)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率.
分析:(Ⅰ)由题设知ξ的可能取值为0,1,2,3,分别求出P(ξ=0),P(ξ=1),P(ξ=2),P(ξ=3),由此能求出随机变量ξ的分布列和数学期望E(ξ).
(Ⅱ)设“甲队和乙队得分之和为4”为事件A,“甲队比乙队得分高”为事件B,分别求出P(A),P(AB),再由P(B/A)=,能求出结果.
解答:(Ⅰ)由题设知ξ的可能取值为0,1,2,3,
P(ξ=0)=(1﹣)(1﹣)(1﹣)=,
P(ξ=1)=(1﹣)(1﹣)+(1﹣)××(1﹣)+(1﹣)(1﹣)×=,
P(ξ=2)=++=,
P(ξ=3)==,
∴随机变量ξ的分布列为:
ξ
0
1
2
3
P
数学期望E(ξ)=0×+1×+2×+3×=.
(Ⅱ)设“甲队和乙队得分之和为4”为事件A,“甲队比乙队得分高”为事件B,
则P(A)=++=,
P(AB)==,
P(B|A)===.
【解题方法点拨】
1、P(B|A)的性质:
(1)非负性:对任意的A∈Ω,0≤P(B|A)≤1;
(2)规范性:P(Ω|B)=1;P(∅|B)=0;
(3)可列可加性:如果是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A).
2、概率P(B|A)和P(AB)的区别与联系:(1)联系:事件A和B都发生了;
(2)区别:
a、P(B|A)中,事件A和B发生有时间差异,A先B后;在P(AB)中,事件A、B同时发生.
b、样本空间不同,在P(B|A)中,样本空间为A,事件P(AB)中,样本空间仍为Ω.
4.分层抽样方法
【知识点的认识】
1.定义:当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比例进行抽样,这种抽样叫做分层抽样,其中所分的各部分叫“层”.
2.三种抽样方法比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率是相同的
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体均匀分成几个部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
【解题方法点拨】
分层抽样方法操作步骤:
(1)分层:将总体按某种特征分成若干部分;
(2)确定比例:计算各层的个体数与总体的个体数的比;
(3)确定各层应抽取的样本容量;
(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.
【命题方向】
(1)区分分层抽样方法
例:某交高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )
A.简单随机抽样法 B.抽签法 C.随机数表法 D.分层抽样法
分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样
解答:总体由男生和女生组成,比例为500:400=5:4,所抽取的比例也是5:4.
故选D
点评:本小题主要考查抽样方法,属基本题.
(2)求抽取样本数
例1:某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是( )
A.8,8 B.10,6 C.9,7 D.12,4
分析:先计算每个个体被抽到的概率,再用每层的个体数乘以每个个体被抽到的概率,即得到该层应抽取的个体数.
解答:每个个体被抽到的概率等于=,54×=9,42×=7.
故从一班抽出9人,从二班抽出7人,
故选C.
点评:本题考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数.
例2:某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )
A.35 B.25 C.15 D.7
分析:先计算青年职工所占的比例,再根据青年职工抽取的人数计算样本容量即可.
解答:青年职工、中年职工、老年职工三层之比为7:5:3,
所以样本容量为=15.
故选C.
点评:本题考查分层抽样的定义和方法,求出每个个体被抽到的概率,用个体的总数乘以每个个体被抽到的概率,就得到样本容量n的值.
5.频率分布直方图
【知识点的认识】
1.频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.
2.频率分布直方图的特征
①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1.
②从频率分布直方图可以清楚地看出数据分布的总体趋势.
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.
3.频率分布直方图求数据
①众数:频率分布直方图中最高矩形的底边中点的横坐标.
②平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和.
③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.
【解题方法点拨】
绘制频率分布直方图的步骤:
6.茎叶图
【知识点的认识】
1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.
例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,37,39,44,49,50
得分表示成茎叶图如下:
2.茎叶图的优缺点:
优点:
(1)所有信息都可以从茎叶图上得到
(2)茎叶图便于记录和表示
缺点:
分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.
【解题方法点拨】
茎叶图的制作步骤:
(1)将每个数据分为“茎”(高位)和“叶”(低位)两部分
(2)将最小的茎和最大的茎之间的数按小大次序排成一列
(3)将各个数据的叶按大小次序写在茎右(左)侧
第1步中,
①如果是两位数字,则茎为十位上的数字,叶为个位上的数字,如89,茎:8,叶:9.
②如果是三位数字,则茎为百位上的数字,叶为十位和个位上的数字,如123,茎:1,叶:23.
对于重复出现的数据要重复记录,不能遗漏,同一数据出现几次,就要在图中体现几次.
7.散点图
【知识点的知识】
1.散点图的概念:
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
2.曲线拟合的概念:
从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.
3.正相关和负相关:
(1)正相关:对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到右上角的区域内.
(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散布在从左上角到右下角的区域.
3、注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关系.
4、散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形.特点是能直观表现出影响因素和预测对象之间的总体关系趋势.优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系.散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度.
8.众数、中位数、平均数
【知识点的认识】
1.众数、中位数、平均数
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
(3)平均数:一组数据的算术平均数,即.
2.众数、中位数、平均数的优缺点
【解题方法点拨】
众数、中位数、平均数的选取:
(1)平均数能较好地反映一组数据的总体情况;
(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);
(3)众数能反映一组数据的集中情况(即多数水平).
根据频率分布直方图估算众数、中位数、平均数:
(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.
(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.
(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和.
9.极差、方差与标准差
【概念】
用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.一组数据中各数据与平均数差的平方和的平均数叫做方差.方差的算术平方根就为标准差.方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
【例题解析】
例:求数据98,100,101,102,99的极差,方差,标准差.
解:极差是:102﹣98=4;
平均数=(98+100+101+102+99)=100,
则方差是:S2=[(98﹣100)2+(100﹣100)2+(101﹣100)2+(102﹣100)2+(99﹣100)2]=2;
标准差S=.
可以看出这类题考查的基本上是对概念的理解,根据概念去解题就可以了.
【考点分析】
这个考点很重要,也很容易,所以大家都应该好好的看看概念,理解方差的含义和怎么求就可以了.
10.相关系数
【知识点的知识】
1、概念:
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r表示,计算公式为
其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.
3、残差:
相关指数R2用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:=x+);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形如:=x+时,我们称之为非线性回归方程.
11.线性回归方程
【概念】
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.
【实例解析】
例:对于线性回归方程,则=
解:,因为回归直线必过样本中心(),
所以.
故答案为:58.5.
方法就是根据线性回归直线必过样本中心(),求出,代入即可求.这里面可以看出线性规划这类题解题方法比较套路化,需要熟记公式.
【考点点评】
这类题记住公式就可以了,也是高考中一个比较重要的点.
12.独立性检验
【知识点的知识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
相关试卷
这是一份2023年高考数学考前20天终极冲刺之数列,共30页。
这是一份高考数学三轮冲刺考前20天终极冲刺攻略: 统计 含答案解析,共12页。试卷主要包含了的数据,绘制了下面的折线图等内容,欢迎下载使用。
这是一份2023年高考数学考前20天终极冲刺之统计,共46页。