- 专题11 圆锥曲线(亮点讲) 教案 29 次下载
- 专题11 圆锥曲线(亮点练) 教案 20 次下载
- 专题12 统计与统计案例(亮点讲) 教案 20 次下载
- 专题13 计数原理与概率(亮点讲) 教案 22 次下载
- 专题13 计数原理与概率(亮点练) 教案 14 次下载
专题12 统计与统计案例(亮点练)
展开专题12 统计与统计案例
1. 《九章算术·衰分》中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱. 欲以钱数多少衰出之,问各几何?”翻译为:“今有甲持钱560,乙持钱350,丙持钱180,甲、乙、丙三个人一起出关,关税共计100钱,要按个人带钱多少的比率交税,问三人各应付多少税?”则下列说法中错误的是( )
A.乙付的税钱应占总税钱的 B.乙、丙两人付的税钱不超过甲
C.丙应出的税钱约为32 D.甲、乙、丙三人出税钱的比例为56∶35∶18
【答案】C
【解析】
【分析】
根据三人持钱的数量得到每人应付税钱的比例和数量,依次判断各个选项,得到结果.
【详解】
乙付的税钱应占总税钱的,可知正确;
乙、丙两人付的税钱占总税钱的,不超过甲,可知正确;
丙应出的税钱为,可知错误;
甲、乙、丙三人出税钱的比例为,可知正确.
本题正确选项:
【点睛】本题考查统计中的分层抽样的实际应用,属于基础题.
2. 已知甲、乙两组数据(已按从小到大的顺序排列):
甲组:27、28、39、40、、50;乙组:24、、34、43、48、52.若这两组数据的百分位数、百分位数分别相等,则等于( )
A. B. C. D.
【答案】A
【分析】根据百分位数的定义,求出,故选取第2个数据为百分位数,同理选取第5个数据作为百分位数,求出,,进而求出结果.
【解析】因为,大于的比邻整数为2,所以百分位数为,,大于的比邻整数为5,所以百分位数为,所以.
故选:A
3. 某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图(如图①)、90后从事互联网行业岗位分布条形图(如图②),则下列结论中不一定正确的是
注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.
A.互联网行业从业人员中90后占一半以上
B.互联网行业中从事技术岗位的人数超过总人数的20%
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业中从事技术岗位的人数90后比80后多
【答案】D
【解析】
【分析】根据饼图中的数据结合岗位分布图中的数据,对选项进行一一分析,即可得答案;
【详解】对A,可知90后占了56%,故A正确;
对B,技术所占比例为39.65%,故B正确;
对C,可知90后明显比80前多,故C正确;
对D,因为技术所占比例,90后和80后不清楚,所以不一定多,故D错误.
故选:D.
【点睛】本题考查统计图的信息提取,考查数据处理能力,属于基础题.
4. 某学校对100间学生公寓的卫生情况进行综合评比,依考核分数分为四个等级,其中分数在为等级;分数在为等级;分数在为等级;分数在为等级.考核评估后,得其频率分布折线图如图所示,估计这100间学生公寓评估得分的平均数是( )
A.80.25 B.80.45 C.80.5 D.80.65
【答案】C
【解析】根据折线图,得到每组的频率,利用每组的中点值计算出平均数.
【详解】由折线图可知,
等级分数在频率为
等级分数在 频率为
等级分数在 频率为
等级分数在 频率为
平均数为.
故选C项.
【点睛】本题可考查通过折线图计算数据的平均数,属于简单题
5. 已知与及与的对应数据如下表,且关于的线性回归方程为,则关于的线性回归方程为( )
10
20
30
40
50
20
30
40
50
70
x
1
2
3
4
5
y
2
3
4
5
7
A. B.
C. D.
【答案】D
【解析】
【分析】由已知可得,,根据表格数据求出,,由公式求出,,进而可得关于的线性回归方程.
【详解】由题表知,,,
因为关于的线性回归方程为,所以,
可得,
所以,
则,
所以关于的线性回归方程为,故选项D正确;
故选:D.
6. 已知变量,之间的线性回归方程为,且变量,之间的一组相关数据如表所示,则下列结论错误的是( )
6
8
10
12
6
3
2
A.变量,之间具有负相关关系 B.
C.可以预测,当时, D.由表格数据知,该回归直线必过点
【答案】B
【解析】
【分析】由于线性回归直线过样本中心点,从而可出的值,利用回归方程判断ACD
【详解】对于A,由回归方程为,可知变量,之间具有负相关关系,所以A正确;
对于B,∵,∴.
∴,解得,所以B错误;
对于C,当时,,所以C正确;
对于D,当时,,所以回归直线过点(9,4),所以D正确.故选:B.
7. 在某次独立性检验中,得到如下列联表:
A
总计
B
200
800
1000
180
a
总计
380
最后发现,没有90%的把握认为A与B有关,则a的值可能是( )
A.300 B.400
C.500 D.600
【答案】D
【解析】
【分析】
根据选项a的值,逐一代入求出观测值,利用独立性检验的基本思想即可求解.
【详解】
当时,,
所以有90%的把握认为A与B有关;
当时,,
所以有90%的把握认为A与B有关;
当时,,
所以有90%的把握认为A与B有关;
当时,,
所以没有90%的把握认为A与B有关.
故选:D.
8. 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;
该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于.
9. 甲,乙两人在5天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则下列结论正确的是( )
A.在这5天中,甲,乙两人加工零件数的极差相同
B.在这5天中,甲,乙两人加工零件数的中位数相同
C.在这5天中,甲日均加工零件数大于乙日均加工零件数
D.在这5天中,甲加工零件数的方差小于乙加工零件数的方差
【答案】C
【分析】由茎叶图的数据,分别计算甲、乙加工零角个数的极差,中位数,平均数,方差,进而得解.
【详解】甲在5天中每天加工零件的个数为:18,19,23,27,28;乙在5天中每天加工零件的个数为:17,19,21,23,25
对于A,甲加工零件数的极差为,乙加工零件数的极差为,故A错误;
对于B,甲加工零件数的中位数为,乙加工零件数的中位数为,故B错误;
对于C,甲加工零件数的平均数为,乙加工零件数的中位数为,故C正确;
对于D,甲加工零件数的方差为,乙加工零件数的方差为,故D错误;
故选:C
10. 为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40名学生进行调查,按照性别和体育锻炼情况整理出如下的列联表:
性别
锻炼情况
合计
不经常
经常
女生/人
14
7
21
男生/人
8
11
19
合计/人
22
18
40
注:独立性检验中,.
常用的小概率值和相应的临界值如下表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
根据这些数据,给出下列四个结论:
①依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响;
②依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响;
③根据小概率值的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05;
④根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响.
其中,正确结论的序号是( )A.①③ B.①④ C.②③ D.②④
【答案】B
【分析】分别求出男生和女生经常锻炼的频率即可依据频率稳定于概率的原理判断,求出卡方值,和3.841比较即可根据小概率值的独立性检验判断.
【详解】由表可知,女生有21人,其中经常锻炼的有7人,频率为,
男生有19人,其中经常锻炼的有11人,频率为,
因为,依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响,故①正确,②错误;
,所以根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响,故④正确,③错误.
故选:B.
11.某电池厂有A,B两条生产线制造同一型号可充电电池.现采用样本量比例分配的分层随机抽样,从某天两条生产线上的成品中随机抽取样本,并测量产品可充电次数的均值及方差,结果如下:
项目
抽取成品数
样本均值
样本方差
A生产线产品
8
210
4
B生产线产品
12
200
4
则20个产品组成的总样本的方差为_____.
【答案】
【分析】利用均值公式计算出总样本的均值,再利用方差的公式:,求出,进一步求出总样本的方差即可.
【详解】依题意得,,,
解得:,,
又,
20个产品组成的总样本的方差为28.
故答案为:.
12.某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级排名的散点图(如下图所示).
关于该班级学生这三个学科本次考试的情况,给出下列四个结论:
①三科中,数学年级排名的平均数及方差均最小;
②语文、数学、英语年级排名均在150名以外的学生为1人;
③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;
④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为.
其中所有正确结论的序号是__________.
【答案】①②④
【分析】依据平均数和方差的定义判断①;求得语文、数学、英语年级排名均在150名以外的学生人数判断②;求得语文第一名、数学第一名、英语第一名的同学判断③;求得从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率判断④.
【详解】①:三科中,数学对应的点比英语对应的点到横轴的距离近且较为密集,
数学对应的点到横轴的距离比语文对应的点到纵轴距离近且较为密集,
所以数学年级排名的平均数及方差均最小.判断正确;
②:语文、数学、英语年级排名均在150名以外的学生为1人.判断正确;
③:本次考试该班语文第一名、数学第一名、英语第一名为同一名同学.判断错误;
④:由图表可知语文排名大于200的有3位同学,
语文排名大于200且英语和数学排名均在150以内的同学仅有1位同学.
故从该班学生中随机抽取1人,若其语文排名大于200,
则其英语和数学排名均在150以内的概率为.判断正确.
故答案为①②④
13.汉字是世界上最古老的文字之一,字形结构体现着人类追求均衡对称、和谐稳定的天性.如图所示,三个汉字可以看成轴对称图形.
小敏和小慧利用“土”“口”“木”三个汉字设计了一个游戏,规则如下:将这三个汉字分别写在背面都相同的三张卡片上,背面朝上,洗匀后抽出一张,放回洗匀后再抽出一张,若两次抽出的汉字能构成上下结构的汉字(如“土”“土”构成“圭”),则小敏获胜,否则小慧获胜.
(1)写出该试验的样本空间Ω;
(2)设小敏获胜为事件A,试用样本点表示A.
【答案】(1)Ω={(土,土),(土,口),(土,木),(口,土),(口,口),(口,木),(木,土),(木,口),(木,木)};(2)A={(土,土),(口,口),(木,口),(口,木)}.
【解析】
【分析】
(1)根据三个汉字两两组合,即可得到该实验的样本空间;
(2)由(1)得到的样本空间中,求得能构成上下结构的样本点,即可得解.
【详解】
(1)每次游戏时,所有可能出现的结果如下表所示:
第二张卡片
第一张卡片
土
口
木
土
(土,土)
(土,口)
(土,木)
口
(口,土)
(口,口)
(口,木)
木
(木,土)
(木,口)
(木,木)
∴Ω={(土,土),(土,口),(土,木),(口,土),(口,口),(口,木),(木,土),(木,口),(木,木)}.
(2)能组成上下结构的汉字的样本点为(土,土),(口,口),(木,口),(口,木).
∴A={(土,土),(口,口),(木,口),(口,木)}.
14.凤梨穗龙眼原产厦门,是厦门市的名果,栽培历史已有多年.龙眼干的级别按直径的大小分为四个等级,其中直径在区间为特级品,在的为一级品,在的为二级品,在的为三级品,某商家为了解某农场一批龙眼干的质量情况,随机抽取了个龙眼干作为样本(直径分布在区间),统计得到这些龙眼干的直径的频数分布表如下:
频数
1
29
7
用分层抽样的方法从样本的一级品和特级品中抽取个,其中一级品有个.
(1)求、的值,并估计这些龙眼干中特级品的比例;
(2)已知样本中的个龙眼干约克,该农场有千克龙眼干待出售,商家提出两种收购方案:
方案A:以元/千克收购;
方案B:以级别分装收购,每袋个,特级品元/袋、一级品元/袋、二级品元/袋、三级品元/袋.用样本的频率分布估计总体分布,哪个方案农场的收益更高?并说明理由.
【答案】(1),,这些龙眼干中特级品的比例为(2)见解析
【解析】
(1)根据样本容量以及分层抽样的性质,列出方程组求解得出、的值,再估计这些龙眼干中特级品的比例;
(2)农场选择方案获得的收入为元,设农场选择方案获得的收入为元,依题意先计算500千克龙眼干共可以分成多少袋,再利用样本估计总体,分别明确特级品,一级品,二级品,三级品各多少袋,再计算得出,即可得出结论.
【详解】
(1),解得
所抽取的100个龙果干中特级品的频率为
这些龙眼干中特级品的比例为
(2)农场选择方案获得的收入为元
设农场选择方案获得的收入为元,则依题意得500千克龙眼干共可以1000袋
用样本的频率分布估计总体分布,则特级品有袋,一级品有袋,二级品有袋,三级品有袋
元
,农场应选择方案
【点睛】
本题主要考查了利用样本估计总体,还考查了数据处理能力,属于中档题.
15.2020年新型冠状病毒肺炎疫情期间,某医院随着医疗工作的有序开展,从2020年3月1日算第一天起,该医院每日治愈的新型冠状病毒肺炎人数(人)的近5天的具体数据如下表:
第天
1
2
3
4
5
治愈的新型冠状病毒肺炎人数(人)
2
4
8
18
若在一定时间内,该医院每日治愈的新型冠状病毒肺炎病人数与天数具有相关关系,已知线性回归方程恒过定点,且,.
(1)求的值和线性回归方程;
(2)预测该医院3月11日能否可以实现“单日治愈人数突破40人”的目标?
参考公式:,,,为样本平均值.
【答案】(1),;(2)能实现.
【解析】
(1)线性回归方程恒过定点,知故可求;根据参数公式求回归方程;
(2)取代入回归方程计算结果再与40比较即可有结论.
【详解】
解:(1)由题意,,,
∴,解得,
∵,,
所以,,
,
所以线性回归方程为.
(2)在中,3月11日即,
取..
∵,
∴该医院3月11日能实现“单日治愈人数突破40人”的目标.
【点晴】
关键点点晴:定点为回归方程中心点,即,,是求的关键.
一. 单选题:
1. 某中学举行电脑知识竞赛,现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成如图所示的频率分布直方图,则参赛选手成绩的众数和中位数可能是( )
A.65,65 B.75,65
C.65,50 D.70,50
【答案】A
【解析】
【分析】根据最高矩形底边的中点的横坐标可估计众数,根据把矩形面积平分点的横坐标可估计中位数.
【详解】因为最高矩形底边的中点的横坐标是65,所以众数可能是65.
因为第一个矩形的面积与后三个矩形面积之和相等,所以中位数落在[60,70)内,把第2个矩形的面积平分,所以也可能是65.故选:A.
2. 四名同学各掷骰子五次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是( ).
A.平均数为3,中位数为2 B.中位数为3,众数为2
C.平均数为2,方差为2.4 D.中位数为3,方差为2.8
【答案】C
【解析】
【分析】根据题意举出反例,即可得出正确选项.
【详解】对于A,当投掷骰子出现结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点数6,故A错误;
对于B,当投掷骰子出现结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点数6,故B错误;
对于C,若平均数为2,且出现6点,则方差S2>(6﹣2)2=3.2>2.4,
∴平均数为2,方差为2.4时,一定没有出现点数6,故C正确;
对于D,当投掷骰子出现结果为1,2,3,3,6时,满足中位数为3,
平均数为:=(1+2+3+3+6)=3
方差为S2=[(1﹣3)2+(2﹣3)2+(3﹣3)2+(3﹣3)2+(6﹣3)2]=2.8,可以出现点数6,故D错误.
故选:C.
3. 下列命题中正确的是( )
A.数据1,2,3,3,4,5的众数大于中位数
B.对一组数据,如果将它们变为,其中,则平均数和标准差均发生改变
C.有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30
D.一般可用相关指数来比较两个模型的拟合效果,越大,模型拟合效果越好
【答案】D
【分析】根据中位数和众数的定义判断A;根据平均数和标准差的性质可判断B;根据分层抽样的性质判断C;根据相关指数的定义和性质判断D.
【详解】对于A,数据1,2,3,3,4,5的众数是3,中位数是,众数等于中位数,故A错误;
对于B,数据,如果将它们变为,其中,则平均数增加C,标准差不变,故B错误;
对于C,有甲、乙、丙三种个体按的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为,故C错误;
对于D,由相关指数的性质可得可以通过比较相关指数的大小比较两个模型的拟合效果,且越大,模型拟合效果越好,故D正确.
故选:D.
4. 某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )
A.31.6岁 B.32.6岁 C.33.6岁 D.36.6岁
【答案】C
【解析】
【分析】先根据频率分布直方图中频率之和为计算出数据位于的频率,再利用频率分布直方图中求中位数的原则求出中位数.
【详解】在频率分布直方图中,所有矩形面积之和为,
所以,数据位于的频率为,
前两个矩形的面积之和为,
前三个矩形的面积之和为,
所以,中位数位于区间,设中位数为,
则有,解得(岁),故选C.
【点睛】本题考查频率分布直方图的性质和频率分布直方图中中位数的计算,计算时要充分利用频率分布直方图中中位数的计算原理来计算,考查计算能力,属于中等题.
5. 已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间具有线性相关关系,利用下表中的五组数据求得回归直线方程为根据该回归方程,预测当时,,则( )
A. B. C. D.
【答案】C
【解析】
【分析】计算求得样本中心点后,代入回归直线,与已知条件一起构造方程组求得.
【详解】由表格数据可得:,,
则,解得:.故选:C.
6. 有两个分类变量X,Y,其列联表如下所示,
a
其中a,均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为( )A.8 B.9 C.8或9 D.6或8
【答案】C
【解析】
【分析】先利用列联表计算,再利用临界值表得到关于的不等式,逐个验证进行求解.
【详解】因为且,,所以或7或8或9,
根据公式,得:
,即,
当时,;
当时,;
当时,;
当时,;
即当或9时满足题意.故选:C.
7. 为研究变量x,y的相关关系,收集得到下面五个样本点:
x
5
6.5
7
8
8.5
y
9
8
6
4
3
若由最小二乘法求得y关于x的回归直线方程为,则据此计算残差为0的样本点是( )A. B. C. D.
【答案】C
【分析】先求出回归方程的样本中心点,从而可求得,再根据残差的定义可判断.
【详解】解:由题意可知,,,
所以回归方程的样本中心点为,
因此有,
所以,
在收集的5个样本点中,一点在上,故计算残差为0的样本点是.
故选:C.
8. 为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40名学生进行调查,按照性别和体育锻炼情况整理出如下的列联表:
性别
锻炼情况
合计
不经常
经常
女生/人
14
7
21
男生/人
8
11
19
合计/人
22
18
40
注:独立性检验中,.
常用的小概率值和相应的临界值如下表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
根据这些数据,给出下列四个结论:
①依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响;
②依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响;
③根据小概率值的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05;
④根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响.
其中,正确结论的序号是( )A.①③ B.①④ C.②③ D.②④
【答案】B
【分析】分别求出男生和女生经常锻炼的频率即可依据频率稳定于概率的原理判断,求出卡方值,和3.841比较即可根据小概率值的独立性检验判断.
【详解】由表可知,女生有21人,其中经常锻炼的有7人,频率为,
男生有19人,其中经常锻炼的有11人,频率为,
因为,依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响,故①正确,②错误;
,所以根据小概率值的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响,故④正确,③错误.
故选:B.
二、多选题:
1. 某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为的名学生进行了调查.调查中使用了两个问题,问题:您的编号是否为奇数?问题:您是否吸烟?被调查者随机从设计好的随机装置(内有除颜色外完全相同的白球个,红球个)中摸出一个小球:若摸出白球则回答问题,若摸出红球则回答问题,共有人回答“是”,则下述正确的是( )
A.估计被调查者中约有人吸烟 B.估计约有人对问题的回答为“是”
C.估计该地区约有的中学生吸烟 D.估计该地区约有的中学生吸烟
【答案】BC
【解析】
【分析】
根据题意知被调查者回答第一个问题的概率为,其编号是奇数的概率也是,计算可得随机抽出的名学生中回答第一个问题且为“是”的学生数, 由此求出回答第二个问题且为是的人数,由此估计此地区中学生吸烟人数的百分比,进而估计出被调查者中吸烟的人数,判断选项可得结论.
【详解】
随机抽出的名学生中,回答第一个问题的概率是, 其编号是奇数的概率也是,
所以回答问题且回答是的人数为;
所以回答第二个问题,且为是的人数;
由此估计此地区中学生吸烟人数的百分比为;
估计被调查者中约有人吸烟;
故表述正确的是BC.
故选:BC.
【点睛】
本题考查了简单随机抽样方法的应用问题,是中档题.
2. 某市12月17日至21日期间空气质量呈现重度及以上污染水平,经市政府批准,该市启动了空气重污染红色预警,期间实行机动车“单双号”限行等措施.某报社会调查中心联合问卷网,对2400人进行问卷调查,并根据调查结果得到如下饼图则下列结论正确的是( )
A.“不支持”部分所占的比例大约是整体的;
B.“一般”部分所占的人数估计是800人;
C.饼图中如果圆的半径为2,则“非常支持”部分扇形的面积是;
D.“支持”部分所占的人数估计是1100人
【答案】ACD
【解析】
根据支持是,约占总体的一半,所以圆的面积是,依次进行判断即可。
【详解】
A选项:“不支持”部分所占,所以比例大约是整体的,正确。
B选项:“一般”部分所占比例为,所以占的人数估计是人,不正确;
C选项:“非常支持”部分占比例,所以面积是,正确;
D选项:“支持”部分所占比例,共有,正确.
故选:ACD
【点睛】注意各部分所占比重.
3. 某班有50名学生,其中男生30名,随机询问了该班5名男生和5名女生在某次数学测验中的成绩.5名男生的成绩分别为86,94,88,92,90,5名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )
A.这种抽样方法是简单随机抽样
B.这5名男生成绩的中位数小于这5名女生成绩的中位数
C.这5名男生成绩的方差大于这5名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
【答案】ABC
【解析】
【分析】
根据简单随机抽样的概念即可判断A选项;结合已知条件和中位数的概念即可判断B选项;结合已知条件分别求出样本中男女生的平均数,然后求方差比较即可;样本的数字特征只能估计总体,并不一定是总体的真实情况,从而判断选项D是否正确.
【详解】
根据抽样方法,可知这种抽样方法是简单随机抽样,故A正确;
易知这5名男生成绩的中位数是90,这5名女生成绩的中位数是93,故B正确;
5名男生成绩的平均数为,方差为,
5名女生成绩的平均数为,方差为,故C正确;
由于该班男生成绩的平均数与该班女生成绩的平均数不一定是样本的平均数,故D错误.
故选:ABC.
4. 如图所示的曲线图是2020年1月25日至2020年2月12日陕西省及西安市新冠肺炎累计确诊病例的曲线图,则下列判断正确的是( )
A.1月31日陕西省新冠肺炎累计确诊病例中西安市占比超过了
B.1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势
C.2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了97例
D.2月8日到2月10日西安市新冠肺炎累计确诊病例的增长率大于2月6日到2月8日的增长率
【答案】ABC
【解析】
【分析】
根据曲线图可得ABC正确,2月8日到2月10日西安新冠肺炎累计确诊病例增加了,2月6日到2月8日西安新冠肺炎累计确诊病例增加了,D说法不正确.
【详解】
1月31日陕西省新冠肺炎累计确诊病例共有87例,其中西安32例,所以西安所占比例为,故A正确;
由曲线图可知,1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故B正确;
2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了例,故C正确;
2月8日到2月10日西安新冠肺炎累计确诊病例增加了,2月6日到2月8日西安新冠肺炎累计确诊病例增加了,显然,故D错误.
故选:ABC.
5. 如图所示的两个扇形统计图分别统计了某地2010年和2020年小学生参加课外兴趣班的情况,已知2020年当地小学生参加课外兴趣班的总人数是2010年当地小学生参加课外兴趣班的总人数的4倍,则下列说法正确的是( )
A.2020年参加音乐兴趣班的小学生人数是2010年参加音乐兴趣班的小学生人数的4倍
B.这10年间,参加编程兴趣班的小学生人数变化最大
C.2020年参加美术兴趣班的小学生人数少于2010年参加美术兴趣班的小学生人数
D.相对于2010年,2020年参加不同课外兴趣班的小学生人数更平均
【答案】ABD
【解析】
【分析】
设2010年参加课外兴趣班的小学生总人数为,则2020年参加课外兴趣班的小学生总人数是,根据扇形统计图中的比例计算,并逐项检验,即可得到结果.
【详解】
设2010年参加课外兴趣班的小学生总人数为,则2020年参加课外兴趣班的小学生总人数是;
由统计图可知,2010年参加音乐兴趣班的小学生人数是,
2020年参加音乐兴趣班的小学生人数是,故A正确.
这10年间参加编程兴趣班的小学生人数变化量为,
这10年间参加语言表演的小学生人数变化量为,
这10年间参加音乐的小学生人数变化量为,
这10年间参加美术的小学生人数变化量为,
所以这10年间参加编程兴趣班的小学生人数变化量最大,故B正确.
2020年参加美术兴趣班的小学生人数为,2010年参加美术兴趣班的小学生人数为,,故C不正确,
根据扇形统计图中的比例分布,可知D正确.
故选:ABD
6. 已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点(1.2,2.2)和(4.8,误差较大,去除后重新求得的回归直线的斜率为1.2,则( )
A.变量与具有正相关关系
B.去除后的估计值增加速度变快
C.去除后方程为
D.去除后相应于样本点的残差平方为
【答案】ACD
【解析】
【分析】根据题意可得原始数据中,,由两个数据点(1.2,2.2)和(4.8,7.8)的平均数为3和5,因此可得到,仍然成立,代入直线方程求得,接着依次判断选项即可.
【详解】由样本数据点集合,
回归直线方程为,且,得到,
去除掉两个数据点(1.2,2.2)和(4.8,7.8),
因为,所以去除掉两个数据点后,,仍然成立,
因为直线方程,将,代入求得;
故A选项正确;因为,所以B选项错误;由上知C选项正确;
去除后,当,相应于样本点的残差平方为,故D选项正确;
故选:ACD.
【点睛】一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
7. 对甲、乙两个班级共105名学生的数学考试成绩按照优秀和不优秀统计人数后,得到下表:
成绩情况
班级
优秀
不优秀
总计
甲班
10
乙班
30
总计
已知在这105名学生中随机抽取1人,成绩优秀的概率为,则( )
A.列联表中的值为20,的值为45 B.列联表中的值为15,的值为50
C.有95%的把握认为成绩是否优秀与班级有关系 D.没有95%的把握认为成绩是否优秀与班级有关系
【答案】AC
【分析】成绩优秀的学生人数和不优秀的学生人数可计算,,再代入卡方公式计算,即可得到答案;
【解析】由题意,知成绩优秀的学生人数是,成绩不优秀的学生人数是,所以,,选项A正确,B错误.
因为,所以有95%的把握认为成绩是否优秀与班级有关系,选项C正确,D错误.
故选:AC
8. 2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:
根据图中(35岁以上含35岁)的信息,下列结论中一定正确的是( )
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁以上
C.样本中35岁以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的人对地铁1号线的开通关注度更高
【答案】ABD
【解析】
根据等高条形图数据分析即可依次判断.
【详解】
设等高条形图对应2×2列联表如下:
35岁以上
35岁以下
总计
男性
a
c
a+c
女性
b
d
b+d
总计
a+b
c+d
a+b+c+d
根据第1个等高条形图可知,35岁以上男性比35岁以上女性多,即a>b;35岁以下男性比35岁以下女性多,即c>d.
根据第2个等高条形图可知,男性中35岁以上的比35岁以下的多,即a>c;女性中35岁以下的比35岁以下的多,即b>d.
对于A,男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,所以A正确;
对于B,35岁以上女性人数为b,35岁以下女性人数为d,因为b>d,所以B正确;
对于C,35岁以下男性人数为c,35岁以上女性人数为b,无法从图中直接判断b与c的大小关系,所以C不一定正确;
对于D,35岁以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,所以a+b>c+d,所以D正确.
故选:ABD.
9. 下列说法正确的的有( )
A.已知一组数据的方差为10, 则的方差也为10
B.对具有线性相关关系的变量,其线性回归方程为,若样本点的中心为,则实数的值是
C.已知随机变量服从正态分布,若,则
D.已知随机变量服从二项分布,若,则
【答案】AC
【分析】根据方差的定义可判断A;根据样本点在回归直线上求得的值可判断B;根据可得,由对称性求出对称轴可得的值可判断C;根据二项分布方差的公式以及方差的性质可判断D,进而可得正确选项.
【详解】对于A:设的平均数为,方差为,
则,,
所以的平均数为,
所以方差为
,故选项A正确;
对于B:因为线性回归直线过样本点中心,所以,
可得,故选项B错误;
对于C:因为随机变量服从正态分布,
所以对称轴为,又,
而,所以,
则,故选项C正确;
对于D:因为服从二项分布,所以,所以
,则,故选项D错误.
故选:AC.
10. 在研究某种产品的零售价(单位:元)与销售量(单位:万件)之间的关系时,根据所得数据得到如下所示的对应表:
12
14
16
18
20
17
16
14
13
11
利用最小二乘法计算数据,得到的回归直线方程为,则下列说法中正确的是( )
A.与的样本相关系数
B.回归直线必过点
C.
D.若该产品的零售价定为22元,可预测销售量是万件
【答案】BCD
【分析】对于A,根据相关系数的公式的特点即可求解;
对于B,C,根据已知条件,求出变量与的均值,再利用线性回归直线方程过样本中心,
即可得出回归方程,进而可以求解;
对于D,将代入该线性回归方程中即可求解.
【详解】由表中数据可知
,
,
对于A,根据相关性系数的公式为,
故相关系数的正负取决分子
故A不正确;
对于B,C,由变量与的均值,得样本点的中心为,
所以样本点的中心必过线性回归方程,故B正确;
将代入中,得,解得,
所以,故C正确;
因为,所以回归直线方程为,
当时,,
所以该产品的零售价定为22元,可预测销售量是万件,故D正确.
故选:BCD.
三、填空题:
1. 某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:
高一年级
高二年级
高三年级
泥塑
a
b
c
剪纸
x
y
z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.
【答案】6
【解析】
【分析】
先按分层抽样求出高二年级人数,再按样本占总体的比例得解.
【详解】
因为“泥塑”社团的人数占总人数的,故“剪纸”社团的人数占总人数的,所以“剪纸”社团的人数为.因为“剪纸”社团中高二年级人数比例为,所以“剪纸”社团中高二年级人数为.由题意知,抽样比为,所以从高二年级“剪纸”社团中抽取的人数为.
故答案为:6
2. 某市举行“中学生诗词大赛”,某校有1000名学生参加了比赛,从中抽取100名学生,统计他们的成绩(单位:分),并进行适当的分组(每组为左闭右开的区间),得到的频率分布直方图如图所示,则估计该校学生成绩的80%分位数为______.
【答案】122.
【解析】
通过计算成绩在130分以下的学生和成绩在110分以下的学生所占比例,确定80%分位数所在位置,利用比例求解即可.
【详解】根据频率分布直方图可知,成绩在130分以下的学生所占比例为,
成绩在110分以下的学生所占比例为,
因此80%分位数一定位于内,
由,故可估计该校学生成绩的80%分位数为122.
故答案为:122
【点睛】本题主要考查频率分布直方图的应用和分位数的计算,考查学生分析数据的能力,属于中档题.
3. 某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y(万元)的::数据如下:
x
1
2
3
4
5
y
10.9
10.2
9.0
7.8
7.1
根据上表可得y关于x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为______.(参考数据:,)
【答案】5,6,7
【解析】
【分析】根据题意求出,利用最小二乘法求出,进而求出即可得出线性回归方程,根据题意列出不等式,解之即可.
【详解】由题意可得,,,
,,
设线性回归方程为,则,,
故线性回归方程为.根据题意,,解得,又,
所以m的所有可能取值为5,6,7.故答案为:5,6,7
4. 某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,40岁以上调查了50人,不高于40岁调查了50人,所得数据制成如下列联表:
不喜欢西班牙队
喜欢西班牙队
总计
40岁以上
50
不高于40岁
15
35
50
总计
100
已知工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.
参考公式与临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.702
2.706
3.841
5.024
6.635
7.879
10.828
【答案】
【解析】
【分析】由题意可知,可得a、b、p、q的值,由公式可得的观测值,可得结论.
【详解】设“从所有人中任意抽取一个取到喜欢西班牙队的人”为事件,
由已知得,
所以,,,,
,
故有超过的把握认为年龄与西班牙队的被喜欢程度有关.
故答案为:.
【点睛】本题考查独立性检验,考查学生的数据分析能力与计算能力.
5. 下列说法中错误的有______个.
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②在一个列联表中,由计算得,则其两个变量之间有关系的可能性是99.9%;
③设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;
④线性回归方程必过.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】2
【分析】根据统计的知识依次判断即可.
【详解】对①,方差反应一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故①正确;
对②,在一个列联表中,由计算得,因为,所以两个变量之间有关系的可能性小于99.9%,故②错误;
对③,一个回归方程,变量x增加一个单位时,y平均减少5个单位,故③错误;
对④,线性回归方程必过样本中心点,故④正确.
所以错误的有2个.
故答案为:2.
四、解答题:
1. 某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占37.5%,老年人占20%.登山组的职工占参加活动总人数的三分之一,且该组中,青年人占50%,中年人占30%,老年人占20%.为了解各组不同年龄层次的职工对本次活动的整体满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
【答案】(1)31∶33∶16;
(2)青年人52人,中年人55人,老年人27人.
【分析】
(1)先求出登山组中,青年人,中年人,老年人占总人数的比例,从而求出游泳组中,青年人,中年人,老年人占总人数的比例,进而求出游泳组中,青年人、中年人、老年人分别所占的比例;(2)结合第一问,求出游泳组中,青年人、中年人、老年人分别应抽取的人数为52,55,27.
【解析】
(1)登山组人数占参加活动总人数的,则游泳组人数占参加活动总人数的,
登山组中,青年人,中年人,老年人占总人数的比例分别为:,,,所以游泳组中,青年人,中年人,老年人占总人数的比例分别为:,,,所以游泳组中,青年人、中年人、老年人分别所占的比例为
(2)由(1)知:游泳组中,青年人、中年人、老年人分别所占的比例为31∶33∶16,游泳组人数占参加活动总人数的,故游泳组中,青年人、中年人、老年人分别应抽取的人数为,,,所以游泳组中,青年人、中年人、老年人分别应抽取的人数为52,55,27.
2. 从全校参加期末考试的试卷中抽取一个样本,考查成绩(均为整数)的分布,将样本分成5组,绘成频率直方图(如图所示),从左到右各小组的小矩形的高之比为2∶3∶6∶4∶1,最左边的一组频数为6.
(1)求样本容量;
(2)求105.5~120.5这一组的频数及频率;
(3)如果成绩大于120分为优秀,估计这次考试成绩的优秀率.
【答案】(1)48;(2)18;;(3)31.25%.
【解析】
【分析】(1)首先计算最左边一组的频率,再根据公式即样本容量;(2)根据频率比例,计算105.5~120.5这一组的频率,再根据样本容量计算频数;(3)首先根据比值,计算成绩大于120分的频率,转化为优秀率.
【详解】在频率直方图中频数之比等于频率之比,且样本的所有频率之和等于1.
(1)小矩形的高之比为频率之比,
∴从左到右各小组的频率之比为2∶3∶6∶4∶1.
∴最左边的一组所占的频率为.
∴样本容量=.
(2)105.5~120.5这一组的频率为,
∴频数为.
(3)成绩大于120分的频率为,
∴考试成绩的优秀率约为.
3. 某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第年与年销量(单位:万件)之间的关系如表:
1
2
3
4
12
28
42
56
在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.
附注:参考数据:,,.
参考公式:相关系数
【答案】作图见解析;与的相关系数近似为0.9997,可以推断该公司的年销量与第年呈正线性相关,且线性相关程度很强.
【解析】
【分析】
由已知数据作出散点图,由图像可以看出推断与线性相关,再由公式计算可得结论.
【详解】
解:作出散点图如图:
由散点图可知,各点大致分布在一条直线附近,由此推断与线性相关.
由题中所给表格及参考数据得:
,,,,,
,
,
.
∵与的相关系数近似为0.9997,可以推断该公司的年销量与第年呈正线性相关,且线性相关程度很强.
4. 在一次抽样调查中测得个样本点,得到下表及散点图.
(1)根据散点图判断与哪一个适宜作为关于的回归方程;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果试建立与的回归方程;(计算结果保留整数)
(3)在(2)的条件下,设且,试求的最小值.
参考公式:回归方程中,,.
【答案】(1);(2);(3).
【解析】
(1)根据散点图的分布情况可得出结论;
(2)作变换,将数据代入最小二乘法公式,可求得和的值,进而可得出与的回归方程;
(3)求得,利用函数的单调性可求得的最小值.
【详解】
(1)由题中散点图可以判断,适宜作为关于的回归方程;
(2)令,则,原数据变为
由表可知与近似具有线性相关关系,计算得,
,
,
所以,,则.
所以关于的回归方程是.
(3)由(2)得,,
任取、,且,即,
可得,
因为,则,,所以,,
所以,函数在区间上单调递增,则.
【点睛】关键点点睛:对于非线性回归方程的求解,一般要结合题意作变换,转化为线性回归方程来求解,同时也要注意相应数据的变化.
5. 某学生对其30位亲属的饮食习惯进行了一次调查,并用如图所示的茎叶图表示他们的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).
(1)根据茎叶图,帮助这位同学说明这30位亲属的饮食习惯.
(2)根据以上数据完成如下列联表
主食为蔬菜
主食为肉类
总计
50岁以下
50岁及以上
总计
(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关?
附表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中)
【答案】(1)答案见解析;(2)列联表答案见解析;(3)有99%的把握认为其亲属的饮食习惯与年龄有关.
【分析】(1)由茎叶图,说明30位亲属中50岁及以上、50岁以下的饮食分布情况即可;
(2)根据茎叶图填写列联表即可;
(3)由题意,求随机变量的观测值,并与参考值作比较,即可判断.
【详解】(1)由茎叶图,知:30位亲属中50岁及以上的人饮食以蔬菜为主,50岁以下的人饮食以肉类为主
(2)列联表如下所示:
主食为蔬菜
主食为肉类
总计
50岁以下
4
8
12
50岁及以上
16
2
18
总计
20
10
30
(3)由题意,知随机变量的观测值,
∴有99%的把握认为其亲属的饮食习惯与年龄有关.
6.一家人才测评机构对“创客园区”的20家小微企业的经理人进行自信心测试,获得的测试分数如下:
78 63 72 89 91 56 68 76 85 60
71 84 61 89 79 93 86 78 92 80
(1)以上述数据组成总体,求总体平均数与总体标准差.
(2)设计恰当的随机抽样方法,从总体中抽取一个容量为10的样本,求样本均值与标准差.
(3)利用上面的随机抽样方法,再抽取容量为10的样本,计算样本均值和标准差.将求得的结果与(2)中的结果进行比较,它们一样吗?
(4)利用(2)中的随机抽样方法,分别从总体中抽取一个容量为8,12,16,18的样本,求样本均值与标准差.分析样本容量与样本均值、样本标准差对总体的估计效果之间有什么关系.
【答案】(1)总体平均数,总体标准差;(2)见解析;(3)见解析;(4)见解析
【分析】
(1)利用平均数公式和标准差公式求解即可,
(2)利用抓阄法进行抽样,抽出10个样本,然后利用平均数公式和标准差公式求解,
(3)抽出10个样本,利用平均数公式和标准差公式求解,
(4)利用平均数公式和标准差公式求解
【解析】
(1)总体平均数为,
总体方差为,
所以样本标准差为
(2)利用抓阄法进行抽样,若抽出的10个样本分别为78,89,68,60,84,89,86,78 ,92,80,则
样本平均数为,
样本方差为,
所以样本标准差为,
(3)若抽出的10个样本分别为78,84,72, 89,91,56,86,76,85,60,则
样本平均数为,
样本方差为 ,
所以样本标准差为,与(2)中的结果不一样,
(4)若样本容量为8的样本是:72,89,68,61,93,71,80,92,则
平均数为,
方差为,
所以样本标准差为,
若样本容量为12的样本是:78,72,89,56,76,60,84,79,93,86,78,92,
则平均数为,
样本方差为,
所以样本标准差为
若样本容量为16的样本是:63,72,89,56,68,76,85,71,84,61,89,79,93,86,78,92,则
平均数为,
方差为,
所以样本标准差为,
若样本容量为18的样本是:78,63,72,89,91,56,68,76,85,60,71,84,61,89,79,93,86,92,则平均数为
样本方差为,
所以标准差为,
随着样本容量的增加,分别用样本平均数和样本标准差估计总体平均数和样本标准差的效果会越来越好,但是由样本的随机性,也有极个别的例外情况
1. 【2022年全国甲卷理科02】某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【答案】B
【解析】
讲座前中位数为70%+75%2>70%,所以A错;
讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;
讲座后问卷答题的正确率的极差为100%-80%=20%,
讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.
故选:B.
2. 【2022年全国甲卷理科02】某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【答案】B
【解析】
讲座前中位数为70%+75%2>70%,所以A错;
讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;
讲座后问卷答题的正确率的极差为100%-80%=20%,
讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.
故选:B.
3. 【2020年全国1卷理科05】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,⋯,20)得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+blnx
【答案】D
【解析】
由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率y和温度x的回归方程类型的是y=a+blnx.
故选:D.
4. 【2020年全国3卷理科03】在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且i=14pi=1,则下面四种情形中,对应样本的标准差最大的一组是( )
A.p1=p4=0.1,p2=p3=0.4 B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3 D.p1=p4=0.3,p2=p3=0.2
【答案】B
【解析】对于A选项,该组数据的平均数为xA=1+4×0.1+2+3×0.4=2.5,
方差为sA2=1-2.52×0.1+2-2.52×0.4+3-2.52×0.4+4-2.52×0.1=0.65;
对于B选项,该组数据的平均数为xB=1+4×0.4+2+3×0.1=2.5,
方差为sB2=1-2.52×0.4+2-2.52×0.1+3-2.52×0.1+4-2.52×0.4=1.85;
对于C选项,该组数据的平均数为xC=1+4×0.2+2+3×0.3=2.5,
方差为sC2=1-2.52×0.2+2-2.52×0.3+3-2.52×0.3+4-2.52×0.2=1.05;
对于D选项,该组数据的平均数为xD=1+4×0.3+2+3×0.2=2.5,
方差为sD2=1-2.52×0.3+2-2.52×0.2+3-2.52×0.2+4-2.52×0.3=1.45.
因此,B选项这一组的标准差最大.
故选:B.
5.(多选题)【2021年新高考1卷9】有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,⋅⋅⋅,n),c为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样数据的样本极差相同
【答案】CD
A:E(y)=E(x+c)=E(x)+c且c≠0,故平均数不相同,错误;
B:若第一组中位数为xi,则第二组的中位数为yi=xi+c,显然不相同,错误;
C:D(y)=D(x)+D(c)=D(x),故方差相同,正确;
D:由极差的定义知:若第一组的极差为xmax-xmin,则第二组的极差为ymax-ymin=(xmax+c)-(xmin+c)=xmax-xmin,故极差相同,正确;
故选:CD
6.(多选题)【2021年新高考2卷9】下列统计量中,能度量样本x1,x2,⋯,xn的离散程度的是( )
A.样本x1,x2,⋯,xn的标准差 B.样本x1,x2,⋯,xn的中位数
C.样本x1,x2,⋯,xn的极差 D.样本x1,x2,⋯,xn的平均数
【答案】AC
由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
7. 【2022年全国乙卷理科19】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得i=110xi2=0.038,i=110yi2=1.6158,i=110xiyi=0.2474.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2,1.896≈1.377.
【答案】(1)0.06m2;0.39m3
(2)0.97
(3)1209m3
【解析】
(1)样本中10棵这种树木的根部横截面积的平均值x=0.610=0.06
样本中10棵这种树木的材积量的平均值y=3.910=0.39
据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,
平均一棵的材积量为0.39m3
(2)r=i=110(xi-x)(yi-y)i=110(xi-x)2i=110(yi-y)2=i=110xiyi-10xyi=110xi2-10x2i=110yi2-10y2
=0.2474-10×0.06×0.39(0.038-10×0.062)(1.6158-10×0.392)=0.01340.0001896≈0.01340.01377≈0.97
则r≈0.97
(3)设该林区这种树木的总材积量的估计值为Ym3,
又已知树木的材积量与其根部横截面积近似成正比,可得0.060.39=186Y,解之得Y=1209m3.
则该林区这种树木的总材积量估计为1209m3
8. 【2022年新高考1卷20】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.P(B|A)P(B|A)与P(B|A)P(B|A)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:R=P(A|B)P(A|B)⋅P(A|B)P(A|B);
(ⅱ)利用该调查数据,给出P(A|B),P(A|B)的估计值,并利用(ⅰ)的结果给出R的估计值.
附K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),
PK2≥k
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii)R=6;
【解析】
(1)由已知K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90-60×10)250×150×100×100=24,
又P(K2≥6.635)=0.01,24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为R=P(B|A)P(B|A)⋅P(B|A)P(B|A)=P(AB)P(A)⋅P(A)P(AB)⋅P(AB)P(A)⋅P(A)P(AB),
所以R=P(AB)P(B)⋅P(B)P(AB)⋅P(AB)P(B)⋅P(B)P(AB)
所以R=P(A|B)P(A|B)⋅P(A|B)P(A|B),
(ii) 由已知P(A|B)=40100,P(A|B)=10100,
又P(A|B)=60100,P(A|B)=90100,
所以R=P(A|B)P(A|B)⋅P(A|B)P(A|B)=6
9. 【2022年新高考2卷19】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1)44.65岁;(2)0.89;(3)0.0014.
【解析】
(1)平均年龄x=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023
+55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).
(2)设A={一人患这种疾病的年龄在区间[20,70)},所以
P(A)=1-P(A)=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89.
(3)设B={任选一人年龄位于区间[40,50),C={任选一人患这种疾病},
则由条件概率公式可得
P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.
10. 【2021年全国甲卷理科17】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)75%;60%;
(2)能.
(1)甲机床生产的产品中的一级品的频率为150200=75%,
乙机床生产的产品中的一级品的频率为120200=60%.
(2)K2=400(150×80-120×50)2270×130×200×200=40039>10>6.635,
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
11. 【2021年全国乙卷理科17】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为S12和S22.
(1)求x,y,S12,S22;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2S12+S2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1)x=10,y=10.3,S12=0.036,S22=0.04;(2)新设备生产产品的该项指标的均值较旧设备没有显著提高.
(1)x=9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.710=10,
y=10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+10.4+10.510=10.3,
S12=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,
S22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04.
(2)依题意,y-x=0.3=2×0.15=20.152=20.025,20.036+0.042=20.038,
y-x<2s12+s2210,所以新设备生产产品的该项指标的均值较旧设备没有显著提高.
12. 【2019年新课标3理科17】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,
根据直方图得到P(C)的估计值为0.70.
则由频率分布直方图得:
a+0.20+0.15=0.70.05+b+0.15=1-0.7,
解得乙离子残留百分比直方图中a=0.35,b=0.10.
(2)估计甲离子残留百分比的平均值为:
x甲=2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值为:
x乙=3×0.05+4×0.1+5×0.15+6×0.35+7×0.2+8×0.15=6.
专题13 计数原理与概率(亮点练): 这是一份专题13 计数原理与概率(亮点练),文件包含专题13计数原理与概率亮点练解析版docx、专题13计数原理与概率亮点练原卷版docx等2份教案配套教学资源,其中教案共51页, 欢迎下载使用。
专题12 统计与统计案例(亮点讲): 这是一份专题12 统计与统计案例(亮点讲),文件包含专题12统计与统计案例亮点讲解析版docx、专题12统计与统计案例亮点讲原卷版docx等2份教案配套教学资源,其中教案共115页, 欢迎下载使用。
专题11 圆锥曲线(亮点练): 这是一份专题11 圆锥曲线(亮点练),文件包含专题11圆锥曲线亮点练解析版docx、专题11圆锥曲线亮点练原卷版docx等2份教案配套教学资源,其中教案共79页, 欢迎下载使用。