2021届二轮(理科数学) 统计与概率 专题卷(全国通用)
展开
2021届二轮(理科数学) 统计与概率 专题卷(全国通用)一、选择题1、根据如下样本数据得到的回归方程为,若,则每增加1个单位,就( )3456742.5-0.50.5-2A.增加0.9个单位 B.减少0.9个单位 C.增加1个单位 D.减少1个单位2、某批产品有两种共120件,现要从中抽出10件进行检验,如果所抽的产品件数是产品件数的2倍多一件,则两件产品的件数分别为( )A.45,75 B.40,80 C.36,84 D.30,903、已知、之间的一组数据: 则与的线性回归方程必过点( )01231357A.(2,2) B.(1.5, 0) C. (1, 2) D.(1.5, 4)4、据市场调查的数据可知,某商品受季节影响,各月的价格波动比较大,2019年1月到12月,该商品价格的涨跌幅度的折线图如图所示.根据折线图,下列结论错误的是( )A.2019年1月该商品价格涨幅最大 B.2019年12月该商品价格跌幅最大C.2019年该商品2月的价格低于1月的价格 D.2019年从9月开始该商品的价格一直在下跌5、给出下列五个命题:①净三种个体按的比例分层抽样调查,如果抽取的个体为9个,则样本容易为30;②一组数据1、2、3、4、5的平均数、众数、中位数相同;③甲组数据的方差为5,乙组数据为5、6、9、10、5,那么这两组数据中较稳定的是甲;④已知具有线性相关关系的两个变量满足的回归直线方程为.则每增加1个单位,平均减少2个单位;⑤统计的10个样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在内的频率为0.4其中真命题为( )A.①②④ B.②④⑤ C.②③④ D.③④⑤6、实验测得四组(x, y)的值分别为(1, 2), (2, 3), (3, 4), (4, 4),则y与x间的线性回归方程是( )A.y=-1+x B.y=1+x C.y=1.5+0.7x D.y=1+2x7、已知、取值如表: 画散点图分析可知:与线性相关,且求得回归方程为,则的值(精确到)为( )A. B. C. D.8、以下四个命题中:①在回归分析中,可用相关指数的值判断的拟合效果,越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;③若数据的方差为1,则的方差为2;④对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.其中真命题的个数为( )A.1 B.2 C.3 D.49、某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是 ( )A. 各月的平均最低气温都在0℃以上B. 七月的平均温差比一月的平均温差大C. 三月和十一月的平均最高气温基本相同D. 平均最高气温高于20℃的月份有5个10、某班对一次实验成绩进行分析,利用随机数表法抽取样本时,先将50个同学按01,02,03,…,50进行编号,然后从随机数表第9行第11列开始向右读,则选出的第7个个体是( )(注:表为随机数表的第8行和第9行)A. 02 B. 13 C. 42 D. 4411、根据如下样本数据:得到的回归方程为=,则( )A. >0,b>0 B. >0,b<0C. <0,b>0 D. <0,b<012、若样本数据的标准差为8,则数据, , , 的标准差为( )A. 8 B. 15 C. 16 D. 32二、填空题13、某中学高一年级有400人,高二年级有320人,高三年级有280人,以每人被抽取的概率为0.2,向该中学抽取了一个容量为n的样本,则n=________.14、下面是某校学生日睡眠时间的抽样频率分布表(单位:h):日睡眠时间/h人数频率[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9]20.02合计1001试估计该校学生的日平均睡眠时间为________h.15、某大型超市有员工人,其中男性员工人,现管理部门按性别采用分层抽样的方法从超市的所有员工中抽取人进行问卷调查,若抽取到的男性员工比女性员工多人,则______.16、学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在[20,60)元的样本,其频率分布直方图如右图,其中支出在[50,60)元的同学有30人,则n的值为______.三、解答题17、某城市200户居民的月平均用电量(单位:度),以,,,,,分组的频率分布直方图如图:(1)求直方图中x的值;(2)在月平均用电量为,,的三组用户中,用分层抽样的方法抽取20户居民,则月平均用电量在的用户中应抽取多少户?(3)求月平均用电量的中位数和平均数.18、冬季昼夜温差大小与某反季节大豆新品种发芽多少之间有关系,某农科所对此关系进行了调查分析,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:,.)19、为备战某次运动会,某市体育局组建了一个由4个男运动员和2个女运动员组成的6人代表队并进行备战训练.(1)经过备战训练,从6人中随机选出2人进行成果检验,求选出的2人中至少有1个女运动员的概率.(2)检验结束后,甲、乙两名运动员的成绩用茎叶图表示如图:计算说明哪位运动员的成绩更稳定.
参考答案1、答案B由题意可得,因为回归方程为,若,且回归直线过点,所以,解得,故选B.2、答案C3、答案D因为,由题意可知样本中心为,由回归方程必过点样本中心,故选D.4、答案C根据折线图的变化情况判断涨幅、跌幅、上涨、下降等情况判断各选项.详解:根据折线图可知1,2019年1月该商品价格涨幅最大,12价格跌幅最大,从9月开始该商品的价格一直在下跌,2月的价格虽然涨幅小于1月的涨幅,但是价格仍在上涨,故选:C.5、答案B由题意①中,根据分层抽样的方法,即可求解是错误的;②中,利用平均数、众数、中位数的公式求解,即可得到判断;③中,利用平均数和方差的公式,即可得到判断;④中,根据回归系数的含义,即可得到判断;⑤中,根据古典概型的概率计算公式,即可求解,作出判断.详解,①样本容量为9÷=18,①是假命题;②数据1,2,3,3,4,5的平均数为×(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,②是真命题;③乙==7,s=×[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=×(4+1+4+9+4)=4.4,∴s>s,∴乙稳定,③是假命题;④是真命题;⑤数据落在[114.5,124.5)内的有120,122,116,120,共4个,故其频率为0.4,⑤是真命题.6、答案C7、答案1.7将代入回归方程为可得,则,解得,即精确到0.1后的值为.故选C.8、答案B根据回归分析相关指数和相关系数的概念可知①②正确.对③,由于,故错误.对于④越大约有把握,故错误.所以一共两个命题为真命题.9、答案D由图可知各月的平均最低气温都在0℃以上,A正确;由图可知在七月的平均温差大于,而一月的平均温差小于,所以七月的平均温差比一月的平均温差大,B正确;由图可知三月和十一月的平均最高气温都大约在,基本相同,C正确;由图可知平均最高气温高于20℃的月份有3个,所以不正确.故选D.考点统计图易错警示解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选B.10、答案A依题意,选取数据依次为,故为.11、答案B由题意可知,回归方程经过的样本数据对应得点附近,是减函数,所以,且回归方程经过点与附近,所以故选12、答案C样本数据, , , 的标准差为,所以方差为64,由可得数据, , , 的方差为,所以标准差为13、答案200由=0.2,得n=200.14、答案7.39法一:总睡眠时间约为:6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h).故平均睡眠时间约为=7.39(h).法二:求组中值与对应频率之积的和:6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).该校学生的日平均睡眠时间约为7.39 h.15、答案计算出分层抽样的抽样比,根据抽出男、女人数之间的关系,可得结果.详解总共有120人,男性员工90人,所以女性员工有30人由总共抽出人,所以抽样比为:,则男性员工抽了: 女性员工抽了:,又抽取到的男性员工比女性员工多人,所以,则故答案为:816、答案100由题意可知:前三个小组的频率之和=(0.01+0.024+0.036)×10=0.7,∴支出在[50,60)元的频率为1﹣0.7=0.3,∴n的值==100;故答案为:100.17、答案(1)0.0075;(2)10户;(3),.详解:(1)由直方图的性质可得,解得,所以直方图中x的值是0.0075.(2)因为月平均用电量为,,的三组用户的频率分别为0.25、0.15、0.1,所以这三组用户的月平均用电量比例为,所以月平均用电量在的用户中应抽取(户).(3)因为,所以月平均用电量的中位数在内,设中位数为a,则,解得.平均数,所以月平均用电量的中位数为224,平均数为225.6.18、答案(1)(2)(3)(2)中所得的线性回归方程可靠详解:(1)设抽到不相邻的两组数据为事件A,从5组数据中选取2组数据共有10种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),其中数据为12月份的日期数,每种情况都是可能出现的,事件A包括的基本事件有6种;∴P(A)==;∴选取的2组数据恰好是不相邻2天数据的概率是;(2)由数据,求得=×(11+13+12)=12,=×(25+30+26)=27,由公式,求得===2.5,=﹣=27﹣2.5×12=﹣3,∴y关于x的线性回归方程为=2.5x﹣3;.(3)当x=10时,=2.5×10﹣3=22,|22﹣23|<2;同样当x=8时,=2.5×8﹣3=17,|17﹣16|<2;∴(2)中所得的线性回归方程可靠.19、答案(1)(2)乙(2)根据题目中茎叶图的数据,计算甲、乙运动员的平均成绩与方差,比较大小即可得出结论.试题(1)把4个男运动员和2个女运动员分别记为a1,a2,a3,a4和b1,b2.则基本事件包括(a1,a2),(a1,a3),(a1,a4),(a1,b1),(a1,b2),(a2,a3),(a2,a4),(a2,b1),(a2,b2),(a3,a4),(a3,b1),(a3,b2),(a4,b1),(a4,b2),(b1,b2)共15种.其中至少有1个女运动员的情况有9种,故至少有1个女运动员的概率P==.(2)设甲运动员的平均成绩为甲,方差为s,乙运动员的平均成绩为乙,方差为s,可得甲==71,乙==71,s=[(68-71)2+(70-71)2+(71-71)2+(72-71)2+(74-71)2]=4,s=[(69-71)2+(70-71)2+(70-71)2+(72-71)2+(74-71)2]=3.2.因为甲=乙,s>s,故乙运动员的成绩更稳定.