还剩24页未读,
继续阅读
北师大高中数学选择性必修第一册第七章 统计案例 单元测试卷【含答案】
展开
这是一份北师大高中数学选择性必修第一册第七章 统计案例 单元测试卷【含答案】,共27页。
北师大高中数学选择性必修第一册第七章 统计案例 单元测试卷(原卷版)一、单项选择题:本题共8小题,每小题5分,共40分. 在每小题给出的四个选项中,只有一项是符合题目要求的. 1. 对于线性回归方程Y=,下列说法不正确的是 ( D )A.直线必经过点()B.X增加1个单位时,Y平均增加个单位C.样本数据中X=0时,可能有Y=D.样本数据中X=0时,一定有Y=2. 已知变量X,Y之间有线性相关关系,其线性回归方程为Y=-3+X,若xi=17,yi=4,则的值为 ( B )A.1 B.2C.-1 D.-23. 小明在做物理实验时,测量一根弹簧的劲度系数,得到了如下的结果:若弹簧长度Y与所挂重量X之间具有线性相关关系,则Y关于X的线性回归方程为 ( B )A.Y=0. 6X-10. 3B.Y=0. 6X+10. 3C.Y=10. 3X+0. 6D.Y=10. 3X-0. 64. 对两个变量x,y进行线性相关检验,得线性相关系数r1=0. 785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0. 956 8,则下列判断正确的是 ( C )A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强性比x与y的线性相关性强,故选C.5. 对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是 ( A )A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r36. 根据表中所示的样本数据得到的回归方程为Y=. 若=7. 9,则x每增加1个单位,y就 ( B )A.增加1. 4个单位 B.减少1. 4个单位C.增加1. 2个单位 D.减少1. 2个单位7. 某考察团对全国十大城市职工人均工资X与居民人均消费Y进行统计调查,Y与X具有相关关系,回归方程为Y=0. 66X+1. 562 (单位:千元),若某城市居民消费水平为7. 675,估计该城市消费额占人均工资收入的百分比为 ( D )A.66% B.72. 3%C.67. 3% D.83%3%. 故选D.8. 变量y与x的回归模型中,它们对应的相关系数r的值如下,其中拟合效果最好的模型是 ( C )A.模型1 B.模型2C.模型3 D.模型4二、多项选择题:本题共4小题,每小题5分,共20分. 在每小题给出的选项中,有多项符合题目要求. 全部选对的得5分,部分选对的得2分,有选错的得0分. 9. 某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年,“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2012年作为第1年)的函数. 运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是 ( AC )A.销售额y与年份序号x呈正相关关系B.销售额y与年份序号x线性相关不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8 454亿元10. 已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归方程为y=,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是 ( ABD )参考公式. A.a'=-2 B.b'=2C. >b' D. >a'11. 下列说法中正确的是 ( ABC )A.对于独立性检验,χ2的值越大,说明两事件相关的可信程度越大B.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0. 3x+4,则c,k的值分别是e4和0. 3C.在具有线性相关关系的两个变量的统计数据所得的线性回归方程Y=X中,=2,=1,=3,则=1D.通过回归直线Y=及回归系数,可以精确反映变量的取值和变化趋势12. 在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的线性回归方程为Y=,那么下面说法正确的是 ( BCD )A.直线Y=至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点B.直线Y=必经过点()C.直线Y=表示最接近Y与X之间真实关系的一条直线D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小三、填空题:本题共4小题,每小题5分,共20分. 13. 已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归方程为Y=2X+,若样本点(r,1)和(2,s)的偏差相同,则r和s的关系为s+2r=5. 14. 已知线性相关的变量X与Y的部分数据如表所示:若其线性回归方程是Y=1. 05X+0. 85,则m=6. 5.15. 某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过0. 10的前提下认为性别与休闲方式有关系.16. 某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如下数据:由表中数据,求得线性回归方程为Y=,则=9. 5,若某儿童的记忆能力为12时,预测他的识图能力为9. 5. 四、解答题:本题共6小题,共70分. 解答应写出文字说明、证明过程或演算步骤. 17. (10分)某单位为了了解用电量Y千瓦·时与气温X ℃之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表. 由表中数据得线性回归方程Y=中≈-2,预测当气温为-4 ℃时的用电量. 18. (12分)西瓜是夏日消暑的好水果,西瓜的销售价格Y(单位:千元/吨)与西瓜的年产量X(单位:吨)有关,下表数据为某地区连续6年来西瓜的年产量及对应的西瓜销售价格. (1)若Y与X有较强的线性相关关系,根据上表提供的数据,用最小二乘法求出Y与X的线性回归直线方程;(系数精确到0. 01)(2)若每吨西瓜的成本为4 810元,假设所有西瓜可以全部卖出,预测当年产量为多少吨时年利润最大?参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线Y=的斜率和截距的最小二乘估计分别为,其中=3. 5,=91,xiyi=146. 8.19. (12分)第24届冬奥会于2022年2月4日至2月20日在北京市和河北省张家口市联合举行,这是中国历史上第一次举办冬季奥运会,为了宣传冬奥会,让更多的人了解、喜爱冰雪项目,某校高三年级举办了冬奥会知识竞赛(总分100分),并随机抽取了n名中学生的成绩,绘制成如图所示的频率分布直方图. 已知前三组的频率分别为f1,f2,f3,2f2=f1+f3,第一组和第五组的频率相同. (1)求实数a,b的值,并估计这n名中学生的成绩平均值;(同一组中的数据用该组区间的中点值作代表)(2)已知抽取的n名中学生中,男女生人数相等,男生喜欢花样滑冰的人数占男生人数的,女生喜欢花样滑冰项的人数占女生人数的,且有95%的把握认为中学生喜欢花样滑冰与性别有关,求n的最小值.20. (12分)我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气. 推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容. 2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量. (1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;(2)建立y关于t的回归方程(系数精确到0. 01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:yi=9. 24,tiyi=39. 75,≈0. 53,≈2. 646. 参考公式:相关系数r=(ti-)(yi-)=yi. 回归方程t中斜率和截距的最小二乘估计公式分别为. 解:(1)作出散点图如图所示:由条形图数据和参考数据得21. (12分)某报社为了解大学生对国产电影的关注情况,就“是否关注国产电影”这一问题,随机调查了某大学的60名男生和60名女生,得到如下列联表:(1)从这60名女生中按“是否关注国产电影”进行分层抽样,抽取一个容量为6的样本,再从中随机选取2名进行深度采访,求“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率;(2)根据以上列联表,问有多大把握认为“大学生关注国产电影与性别有关”. 22. (12分)我国全面二孩政策已于2016年1月1日起正式实施. 国家统计局发布的数据显示,从2012年到2017年,中国的人口自然增长率变化始终不大,在5‰上下波动(如图). 为了了解年龄介于24岁至50岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为9组,每组选取150对夫妻进行调查统计有生育二孩意愿的夫妻数,得到下表:(1)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归方程,并求该模型的相关系数r;(结果保留两位小数)(2)从[24,26],[33,35],[39,41],[45,47],[48,50]这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这5对夫妻中任选2对夫妻. 求其中恰有一对不愿意生育二孩的夫妻的概率. (参考数据和公式:r=,(xi-)(yi-)=yi,xiyi=26 340,≈473. 96)北师大高中数学选择性必修第一册第七章 统计案例 单元测试卷(解析版)一、单项选择题:本题共8小题,每小题5分,共40分. 在每小题给出的四个选项中,只有一项是符合题目要求的. 1. 对于线性回归方程Y=,下列说法不正确的是 ( D )A.直线必经过点()B.X增加1个单位时,Y平均增加个单位C.样本数据中X=0时,可能有Y=D.样本数据中X=0时,一定有Y=解析:线性回归方程是对样本数据的一个近似描述,故由它得到的值也是一个近似值. 故选D.2. 已知变量X,Y之间有线性相关关系,其线性回归方程为Y=-3+X,若xi=17,yi=4,则的值为 ( B )A.1 B.2C.-1 D.-2解析:xi=1. 7,yi=0. 4,∴0. 4=-3+1. 7,∴=2,故选B.3. 小明在做物理实验时,测量一根弹簧的劲度系数,得到了如下的结果:若弹簧长度Y与所挂重量X之间具有线性相关关系,则Y关于X的线性回归方程为 ( B )A.Y=0. 6X-10. 3B.Y=0. 6X+10. 3C.Y=10. 3X+0. 6D.Y=10. 3X-0. 6解析:∵×(1+2+3+5+7+9)=4. 5,×(11+12+12+13+14+16)=13,∴两个变量间的回归直线必过点(4. 5,13),排除A,C,D,故选B.4. 对两个变量x,y进行线性相关检验,得线性相关系数r1=0. 785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0. 956 8,则下列判断正确的是 ( C )A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强解析:由线性相关系数r1=0. 785 9>0知x与y正相关,由线性相关系数r2=-0. 956 8<0知u与v负相关,又|r1|<|r2|,所以,变量u与v的线性相关性比x与y的线性相关性强,故选C.5. 对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是 ( A )A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3解析:由给出的四组数据的散点图可以看出,图1和图3是正相关,相关系数大于0,图2和图4是负相关,相关系数小于0,图1和图2的点相对更加集中,所以相关性更强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1. 故选A.6. 根据表中所示的样本数据得到的回归方程为Y=. 若=7. 9,则x每增加1个单位,y就 ( B )A.增加1. 4个单位 B.减少1. 4个单位C.增加1. 2个单位 D.减少1. 2个单位解析:设变量X,Y的平均值为,所以×(3+4+5+6+7)=5,×(4+2. 5-0. 5+0. 5-2)=0. 9,所以0. 9=5×+7. 9,所以=-1. 4,所以x每增加1个单位,y就减少1. 4个单位. 故选B.7. 某考察团对全国十大城市职工人均工资X与居民人均消费Y进行统计调查,Y与X具有相关关系,回归方程为Y=0. 66X+1. 562 (单位:千元),若某城市居民消费水平为7. 675,估计该城市消费额占人均工资收入的百分比为 ( D )A.66% B.72. 3%C.67. 3% D.83%解析:7. 675=0. 66X+1. 562⇒X≈9. 26,故估计该城市消费额占人均工资收入的百分比为×100%≈83%. 故选D.8. 变量y与x的回归模型中,它们对应的相关系数r的值如下,其中拟合效果最好的模型是 ( C )A.模型1 B.模型2C.模型3 D.模型4解析:线性回归分析中,相关系数为r,|r|越接近于1,相关程度越大;|r|越小,相关程度越小,∵模型3的相关系数r最大,∴模拟效果最好,故选C.二、多项选择题:本题共4小题,每小题5分,共20分. 在每小题给出的选项中,有多项符合题目要求. 全部选对的得5分,部分选对的得2分,有选错的得0分. 9. 某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年,“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2012年作为第1年)的函数. 运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是 ( AC )A.销售额y与年份序号x呈正相关关系B.销售额y与年份序号x线性相关不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8 454亿元解析:根据图象可知,散点从左下到右上分布,销售额y与年份序号x呈正相关关系,故A正确;因为相关系数0. 936>0. 75,靠近1,销售额y与年份序号x线性相关显著,B错误;根据三次函数回归曲线的相关指数0. 999>0. 936,相关指数越大,拟合效果越好,所以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,C正确;由三次多项式函数y=0. 168x3+28. 141x2-29. 027x+6. 889,当x=10时,y≈2 698. 72亿元,D错误. 10. 已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归方程为y=,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是 ( ABD )参考公式. A.a'=-2 B.b'=2C. >b' D. >a'解析:因为某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',所以b'=2,a'=-2,根据题意,得=3. 5,,xiyi=0+4+3+12+15+24=58,=1+4+9+16+25+36=91,所以,,所以<b',>a'. 故选ABD.11. 下列说法中正确的是 ( ABC )A.对于独立性检验,χ2的值越大,说明两事件相关的可信程度越大B.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0. 3x+4,则c,k的值分别是e4和0. 3C.在具有线性相关关系的两个变量的统计数据所得的线性回归方程Y=X中,=2,=1,=3,则=1D.通过回归直线Y=及回归系数,可以精确反映变量的取值和变化趋势解析:对于A,根据独立性检验的性质知,χ2的值越大,说明两个事件相关的可信程度越大,故A正确;对于B,由y=cekx,两边取自然对数,可得ln y=ln c+kx,z=ln y,则z=kx+ln c,因为z=0. 3x+4,所以则故B正确;对于C,由于回归直线过点(),=3-2×1=1,故C正确;对于D,通过回归直线Y=及回归系数,可预测变量的取值和变化趋势,故D错误. 故选ABC.12. 在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的线性回归方程为Y=,那么下面说法正确的是 ( BCD )A.直线Y=至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点B.直线Y=必经过点()C.直线Y=表示最接近Y与X之间真实关系的一条直线D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小解析:对于A,直线Y=由点拟合而成,可以不经过任何样本点,故A错;对于B,直线Y=必过样本点中心即点(),故B正确;对于C,直线Y=是采用最小二乘法求解出的直线方程,接近真实关系,故C正确;对于D,相关系数r的绝对值越接近于1,表示相关程度越大,越接近于0,相关程度越小,故D正确. 故选BCD.三、填空题:本题共4小题,每小题5分,共20分. 13. 已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归方程为Y=2X+,若样本点(r,1)和(2,s)的偏差相同,则r和s的关系为s+2r=5. 解析:根据偏差的定义,可得1-(2r+)=s-(2×2+),整理,得s+2r=5. 14. 已知线性相关的变量X与Y的部分数据如表所示:若其线性回归方程是Y=1. 05X+0. 85,则m=6. 5. 解析:由题意可得=5,,则=1. 05×5+0. 85,解得m=6. 5. 15. 某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过0. 10的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得χ2=≈3. 689>2. 706,因此,在犯错误的概率不超过0. 10的前提下认为性别与休闲方式有关系. 16. 某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如下数据:由表中数据,求得线性回归方程为Y=,则=,若某儿童的记忆能力为12时,预测他的识图能力为9. 5. 解析:由表中数据得=7,=5. 5,由()在直线Y=,即5. 5=×7+得,即线性回归方程为Y=. 所以当X=12时,Y=×12-=9. 5,即他的识图能力为9. 5. 四、解答题:本题共6小题,共70分. 解答应写出文字说明、证明过程或演算步骤. 17. (10分)某单位为了了解用电量Y千瓦·时与气温X ℃之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表. 由表中数据得线性回归方程Y=中≈-2,预测当气温为-4 ℃时的用电量. 解:=10,=40,回归直线过点(),所以40=-2×10+,所以=60,所以Y=-2X+60. 令X=-4,得Y=(-2)×(-4)+60=68. 故当气温为-4 ℃时,用电量预计为68千瓦·时. 18. (12分)西瓜是夏日消暑的好水果,西瓜的销售价格Y(单位:千元/吨)与西瓜的年产量X(单位:吨)有关,下表数据为某地区连续6年来西瓜的年产量及对应的西瓜销售价格. (1)若Y与X有较强的线性相关关系,根据上表提供的数据,用最小二乘法求出Y与X的线性回归直线方程;(系数精确到0. 01)(2)若每吨西瓜的成本为4 810元,假设所有西瓜可以全部卖出,预测当年产量为多少吨时年利润最大?参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线Y=的斜率和截距的最小二乘估计分别为,其中=3. 5,=91,xiyi=146. 8. 解:(1)设Y与X的回归直线方程为Y==≈-0. 81,×3. 5≈10. 51,所以Y=-0. 81X+10. 51. (2)设年利润为Z千元,则Z=(-0. 81X+10. 51)×X-×X=-0. 81X2+5. 7X,当X=-≈3. 52时,Z取最大值,所以当年产量为3. 52吨时,年利润最大. 19. (12分)第24届冬奥会于2022年2月4日至2月20日在北京市和河北省张家口市联合举行,这是中国历史上第一次举办冬季奥运会,为了宣传冬奥会,让更多的人了解、喜爱冰雪项目,某校高三年级举办了冬奥会知识竞赛(总分100分),并随机抽取了n名中学生的成绩,绘制成如图所示的频率分布直方图. 已知前三组的频率分别为f1,f2,f3,2f2=f1+f3,第一组和第五组的频率相同. (1)求实数a,b的值,并估计这n名中学生的成绩平均值;(同一组中的数据用该组区间的中点值作代表)(2)已知抽取的n名中学生中,男女生人数相等,男生喜欢花样滑冰的人数占男生人数的,女生喜欢花样滑冰项的人数占女生人数的,且有95%的把握认为中学生喜欢花样滑冰与性别有关,求n的最小值. 解:(1)由题意可知,解得各组频率依次为0. 05,0. 25,0. 45,0. 2,0. 05,∴=0. 05×50+0. 25×60+0. 45×70+0. 2×80+0. 05×90=69. 5(分). (2)设男生人数为x,依题意可得列联表如下:χ2=x>3. 841,∴x≥29. 又x=4k,k∈N+,且各组的频数为正整数,故xmin=40,nmin=80. 20. (12分)我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气. 推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容. 2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量. (1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;(2)建立y关于t的回归方程(系数精确到0. 01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:yi=9. 24,tiyi=39. 75,≈0. 53,≈2. 646. 参考公式:相关系数r=(ti-)(yi-)=yi. 回归方程t中斜率和截距的最小二乘估计公式分别为. 解:(1)作出散点图如图所示:由条形图数据和参考数据得=4,(ti-)2=28,≈0. 53,(ti-)(yi-)=yi=39. 75-4×9. 24=2. 79,r≈≈0. 99. 因为y与t的相关系数近似为0. 99,说明y与t的线性相关性相当高,从而可以用线性回归模型拟合y与t的关系. (2)由=1. 32及(1)得≈0. 10,≈1. 32-0. 10×4=0. 92,所以,y关于t的回归方程为y=0. 92+0. 10t. 将t=11代入回归方程得y=0. 92+0. 10×11=2. 02,所以预测11月份该省煤改气、煤改电的用户数量达到2. 02万户. 21. (12分)某报社为了解大学生对国产电影的关注情况,就“是否关注国产电影”这一问题,随机调查了某大学的60名男生和60名女生,得到如下列联表:(1)从这60名女生中按“是否关注国产电影”进行分层抽样,抽取一个容量为6的样本,再从中随机选取2名进行深度采访,求“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率;(2)根据以上列联表,问有多大把握认为“大学生关注国产电影与性别有关”. 解:(1)根据分层抽样,可得抽取的容量为6的样本中,关注国产电影的女生有×40=4(名),不关注国产电影的女生有×20=2(名). 所以“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率为P=. (2)根据题中的列联表,得χ2=≈4. 444. 由4. 444>3. 841,可知有95%的把握认为“大学生关注国产电影与性别有关”. 22. (12分)我国全面二孩政策已于2016年1月1日起正式实施. 国家统计局发布的数据显示,从2012年到2017年,中国的人口自然增长率变化始终不大,在5‰上下波动(如图). 为了了解年龄介于24岁至50岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为9组,每组选取150对夫妻进行调查统计有生育二孩意愿的夫妻数,得到下表:(1)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归方程,并求该模型的相关系数r;(结果保留两位小数)(2)从[24,26],[33,35],[39,41],[45,47],[48,50]这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这5对夫妻中任选2对夫妻. 求其中恰有一对不愿意生育二孩的夫妻的概率. (参考数据和公式:r=,(xi-)(yi-)=yi,xiyi=26 340,≈473. 96)解:(1)由题意可求得=37,yi=720,=80,yi=26 640,xiyi=26 340,∴(xi-)(yi-)=yi=26 340-26 640=-300. 又∵(xi-)2=122+92+62+32+32+62+92+122=540,(yi-)2=0+1+49+36+16+9+9+100+196=416,∴(xi-)2·(yi-)2=540×416=224 640. ∴≈-0. 56. ∴≈100. 72. ∴线性回归方程为Y=-0. 56X+100. 72. ∴r==≈-0. 63. (2)由题意可知,在[24,26],[33,35],[39,41]年龄段中,超过半数的夫妻有生育二孩意愿,在[45,47],[48,50]年龄段中,超过半数的夫妻没有生育二孩意愿. 设从[24,26],[33,35],[39,41]年龄段中选出的夫妻分别为A1,A2,A3,从[45,47],[48,50]年龄段中选出的夫妻分别为B1,B2. 则从中选出2对夫妻的所有可能结果为(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A2,A3),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),共10种情况. 其中恰有一对不愿意生育二孩的夫妻的情况有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),共6种. ∴恰有一对不愿意生育二孩的夫妻的概率P=. 所挂重量X/N123579弹簧长度Y/cm111212131416X34567Y4. 02. 5-0. 50. 5-2. 0模型1234r0. 480. 150. 960. 30x123456y021334X24568Y34. 5m7. 59读书健身总计女243155男82634总计325789记忆能力X46810识图能力Y3568气温/℃181310-1用电量/(千瓦·时)24343864X123456Y9. 58. 98. 17. 56. 85. 2男生女生总计关注国产电影504090不关注国产电影102030总计6060120年龄区间[24,26][27,29][30,32][33,35][36,38][39,41][42,44][45,47][48,50]有意愿数808187868483837066所挂重量X/N123579弹簧长度Y/cm111212131416X34567Y4. 02. 5-0. 50. 5-2. 0模型1234r0. 480. 150. 960. 30x123456y021334X24568Y34. 5m7. 59读书健身总计女243155男82634总计325789记忆能力X46810识图能力Y3568气温/℃181310-1用电量/(千瓦·时)24343864X123456Y9. 58. 98. 17. 56. 85. 2喜欢花样滑冰不喜欢花样滑冰合计男生xxx女生xxx合计xx2x男生女生总计关注国产电影504090不关注国产电影102030总计6060120年龄区间[24,26][27,29][30,32][33,35][36,38][39,41][42,44][45,47][48,50]有意愿数808187868483837066
北师大高中数学选择性必修第一册第七章 统计案例 单元测试卷(原卷版)一、单项选择题:本题共8小题,每小题5分,共40分. 在每小题给出的四个选项中,只有一项是符合题目要求的. 1. 对于线性回归方程Y=,下列说法不正确的是 ( D )A.直线必经过点()B.X增加1个单位时,Y平均增加个单位C.样本数据中X=0时,可能有Y=D.样本数据中X=0时,一定有Y=2. 已知变量X,Y之间有线性相关关系,其线性回归方程为Y=-3+X,若xi=17,yi=4,则的值为 ( B )A.1 B.2C.-1 D.-23. 小明在做物理实验时,测量一根弹簧的劲度系数,得到了如下的结果:若弹簧长度Y与所挂重量X之间具有线性相关关系,则Y关于X的线性回归方程为 ( B )A.Y=0. 6X-10. 3B.Y=0. 6X+10. 3C.Y=10. 3X+0. 6D.Y=10. 3X-0. 64. 对两个变量x,y进行线性相关检验,得线性相关系数r1=0. 785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0. 956 8,则下列判断正确的是 ( C )A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强性比x与y的线性相关性强,故选C.5. 对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是 ( A )A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r36. 根据表中所示的样本数据得到的回归方程为Y=. 若=7. 9,则x每增加1个单位,y就 ( B )A.增加1. 4个单位 B.减少1. 4个单位C.增加1. 2个单位 D.减少1. 2个单位7. 某考察团对全国十大城市职工人均工资X与居民人均消费Y进行统计调查,Y与X具有相关关系,回归方程为Y=0. 66X+1. 562 (单位:千元),若某城市居民消费水平为7. 675,估计该城市消费额占人均工资收入的百分比为 ( D )A.66% B.72. 3%C.67. 3% D.83%3%. 故选D.8. 变量y与x的回归模型中,它们对应的相关系数r的值如下,其中拟合效果最好的模型是 ( C )A.模型1 B.模型2C.模型3 D.模型4二、多项选择题:本题共4小题,每小题5分,共20分. 在每小题给出的选项中,有多项符合题目要求. 全部选对的得5分,部分选对的得2分,有选错的得0分. 9. 某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年,“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2012年作为第1年)的函数. 运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是 ( AC )A.销售额y与年份序号x呈正相关关系B.销售额y与年份序号x线性相关不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8 454亿元10. 已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归方程为y=,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是 ( ABD )参考公式. A.a'=-2 B.b'=2C. >b' D. >a'11. 下列说法中正确的是 ( ABC )A.对于独立性检验,χ2的值越大,说明两事件相关的可信程度越大B.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0. 3x+4,则c,k的值分别是e4和0. 3C.在具有线性相关关系的两个变量的统计数据所得的线性回归方程Y=X中,=2,=1,=3,则=1D.通过回归直线Y=及回归系数,可以精确反映变量的取值和变化趋势12. 在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的线性回归方程为Y=,那么下面说法正确的是 ( BCD )A.直线Y=至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点B.直线Y=必经过点()C.直线Y=表示最接近Y与X之间真实关系的一条直线D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小三、填空题:本题共4小题,每小题5分,共20分. 13. 已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归方程为Y=2X+,若样本点(r,1)和(2,s)的偏差相同,则r和s的关系为s+2r=5. 14. 已知线性相关的变量X与Y的部分数据如表所示:若其线性回归方程是Y=1. 05X+0. 85,则m=6. 5.15. 某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过0. 10的前提下认为性别与休闲方式有关系.16. 某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如下数据:由表中数据,求得线性回归方程为Y=,则=9. 5,若某儿童的记忆能力为12时,预测他的识图能力为9. 5. 四、解答题:本题共6小题,共70分. 解答应写出文字说明、证明过程或演算步骤. 17. (10分)某单位为了了解用电量Y千瓦·时与气温X ℃之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表. 由表中数据得线性回归方程Y=中≈-2,预测当气温为-4 ℃时的用电量. 18. (12分)西瓜是夏日消暑的好水果,西瓜的销售价格Y(单位:千元/吨)与西瓜的年产量X(单位:吨)有关,下表数据为某地区连续6年来西瓜的年产量及对应的西瓜销售价格. (1)若Y与X有较强的线性相关关系,根据上表提供的数据,用最小二乘法求出Y与X的线性回归直线方程;(系数精确到0. 01)(2)若每吨西瓜的成本为4 810元,假设所有西瓜可以全部卖出,预测当年产量为多少吨时年利润最大?参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线Y=的斜率和截距的最小二乘估计分别为,其中=3. 5,=91,xiyi=146. 8.19. (12分)第24届冬奥会于2022年2月4日至2月20日在北京市和河北省张家口市联合举行,这是中国历史上第一次举办冬季奥运会,为了宣传冬奥会,让更多的人了解、喜爱冰雪项目,某校高三年级举办了冬奥会知识竞赛(总分100分),并随机抽取了n名中学生的成绩,绘制成如图所示的频率分布直方图. 已知前三组的频率分别为f1,f2,f3,2f2=f1+f3,第一组和第五组的频率相同. (1)求实数a,b的值,并估计这n名中学生的成绩平均值;(同一组中的数据用该组区间的中点值作代表)(2)已知抽取的n名中学生中,男女生人数相等,男生喜欢花样滑冰的人数占男生人数的,女生喜欢花样滑冰项的人数占女生人数的,且有95%的把握认为中学生喜欢花样滑冰与性别有关,求n的最小值.20. (12分)我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气. 推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容. 2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量. (1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;(2)建立y关于t的回归方程(系数精确到0. 01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:yi=9. 24,tiyi=39. 75,≈0. 53,≈2. 646. 参考公式:相关系数r=(ti-)(yi-)=yi. 回归方程t中斜率和截距的最小二乘估计公式分别为. 解:(1)作出散点图如图所示:由条形图数据和参考数据得21. (12分)某报社为了解大学生对国产电影的关注情况,就“是否关注国产电影”这一问题,随机调查了某大学的60名男生和60名女生,得到如下列联表:(1)从这60名女生中按“是否关注国产电影”进行分层抽样,抽取一个容量为6的样本,再从中随机选取2名进行深度采访,求“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率;(2)根据以上列联表,问有多大把握认为“大学生关注国产电影与性别有关”. 22. (12分)我国全面二孩政策已于2016年1月1日起正式实施. 国家统计局发布的数据显示,从2012年到2017年,中国的人口自然增长率变化始终不大,在5‰上下波动(如图). 为了了解年龄介于24岁至50岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为9组,每组选取150对夫妻进行调查统计有生育二孩意愿的夫妻数,得到下表:(1)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归方程,并求该模型的相关系数r;(结果保留两位小数)(2)从[24,26],[33,35],[39,41],[45,47],[48,50]这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这5对夫妻中任选2对夫妻. 求其中恰有一对不愿意生育二孩的夫妻的概率. (参考数据和公式:r=,(xi-)(yi-)=yi,xiyi=26 340,≈473. 96)北师大高中数学选择性必修第一册第七章 统计案例 单元测试卷(解析版)一、单项选择题:本题共8小题,每小题5分,共40分. 在每小题给出的四个选项中,只有一项是符合题目要求的. 1. 对于线性回归方程Y=,下列说法不正确的是 ( D )A.直线必经过点()B.X增加1个单位时,Y平均增加个单位C.样本数据中X=0时,可能有Y=D.样本数据中X=0时,一定有Y=解析:线性回归方程是对样本数据的一个近似描述,故由它得到的值也是一个近似值. 故选D.2. 已知变量X,Y之间有线性相关关系,其线性回归方程为Y=-3+X,若xi=17,yi=4,则的值为 ( B )A.1 B.2C.-1 D.-2解析:xi=1. 7,yi=0. 4,∴0. 4=-3+1. 7,∴=2,故选B.3. 小明在做物理实验时,测量一根弹簧的劲度系数,得到了如下的结果:若弹簧长度Y与所挂重量X之间具有线性相关关系,则Y关于X的线性回归方程为 ( B )A.Y=0. 6X-10. 3B.Y=0. 6X+10. 3C.Y=10. 3X+0. 6D.Y=10. 3X-0. 6解析:∵×(1+2+3+5+7+9)=4. 5,×(11+12+12+13+14+16)=13,∴两个变量间的回归直线必过点(4. 5,13),排除A,C,D,故选B.4. 对两个变量x,y进行线性相关检验,得线性相关系数r1=0. 785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0. 956 8,则下列判断正确的是 ( C )A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强解析:由线性相关系数r1=0. 785 9>0知x与y正相关,由线性相关系数r2=-0. 956 8<0知u与v负相关,又|r1|<|r2|,所以,变量u与v的线性相关性比x与y的线性相关性强,故选C.5. 对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是 ( A )A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3解析:由给出的四组数据的散点图可以看出,图1和图3是正相关,相关系数大于0,图2和图4是负相关,相关系数小于0,图1和图2的点相对更加集中,所以相关性更强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1. 故选A.6. 根据表中所示的样本数据得到的回归方程为Y=. 若=7. 9,则x每增加1个单位,y就 ( B )A.增加1. 4个单位 B.减少1. 4个单位C.增加1. 2个单位 D.减少1. 2个单位解析:设变量X,Y的平均值为,所以×(3+4+5+6+7)=5,×(4+2. 5-0. 5+0. 5-2)=0. 9,所以0. 9=5×+7. 9,所以=-1. 4,所以x每增加1个单位,y就减少1. 4个单位. 故选B.7. 某考察团对全国十大城市职工人均工资X与居民人均消费Y进行统计调查,Y与X具有相关关系,回归方程为Y=0. 66X+1. 562 (单位:千元),若某城市居民消费水平为7. 675,估计该城市消费额占人均工资收入的百分比为 ( D )A.66% B.72. 3%C.67. 3% D.83%解析:7. 675=0. 66X+1. 562⇒X≈9. 26,故估计该城市消费额占人均工资收入的百分比为×100%≈83%. 故选D.8. 变量y与x的回归模型中,它们对应的相关系数r的值如下,其中拟合效果最好的模型是 ( C )A.模型1 B.模型2C.模型3 D.模型4解析:线性回归分析中,相关系数为r,|r|越接近于1,相关程度越大;|r|越小,相关程度越小,∵模型3的相关系数r最大,∴模拟效果最好,故选C.二、多项选择题:本题共4小题,每小题5分,共20分. 在每小题给出的选项中,有多项符合题目要求. 全部选对的得5分,部分选对的得2分,有选错的得0分. 9. 某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年,“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2012年作为第1年)的函数. 运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是 ( AC )A.销售额y与年份序号x呈正相关关系B.销售额y与年份序号x线性相关不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8 454亿元解析:根据图象可知,散点从左下到右上分布,销售额y与年份序号x呈正相关关系,故A正确;因为相关系数0. 936>0. 75,靠近1,销售额y与年份序号x线性相关显著,B错误;根据三次函数回归曲线的相关指数0. 999>0. 936,相关指数越大,拟合效果越好,所以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,C正确;由三次多项式函数y=0. 168x3+28. 141x2-29. 027x+6. 889,当x=10时,y≈2 698. 72亿元,D错误. 10. 已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归方程为y=,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是 ( ABD )参考公式. A.a'=-2 B.b'=2C. >b' D. >a'解析:因为某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',所以b'=2,a'=-2,根据题意,得=3. 5,,xiyi=0+4+3+12+15+24=58,=1+4+9+16+25+36=91,所以,,所以<b',>a'. 故选ABD.11. 下列说法中正确的是 ( ABC )A.对于独立性检验,χ2的值越大,说明两事件相关的可信程度越大B.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0. 3x+4,则c,k的值分别是e4和0. 3C.在具有线性相关关系的两个变量的统计数据所得的线性回归方程Y=X中,=2,=1,=3,则=1D.通过回归直线Y=及回归系数,可以精确反映变量的取值和变化趋势解析:对于A,根据独立性检验的性质知,χ2的值越大,说明两个事件相关的可信程度越大,故A正确;对于B,由y=cekx,两边取自然对数,可得ln y=ln c+kx,z=ln y,则z=kx+ln c,因为z=0. 3x+4,所以则故B正确;对于C,由于回归直线过点(),=3-2×1=1,故C正确;对于D,通过回归直线Y=及回归系数,可预测变量的取值和变化趋势,故D错误. 故选ABC.12. 在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的线性回归方程为Y=,那么下面说法正确的是 ( BCD )A.直线Y=至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点B.直线Y=必经过点()C.直线Y=表示最接近Y与X之间真实关系的一条直线D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小解析:对于A,直线Y=由点拟合而成,可以不经过任何样本点,故A错;对于B,直线Y=必过样本点中心即点(),故B正确;对于C,直线Y=是采用最小二乘法求解出的直线方程,接近真实关系,故C正确;对于D,相关系数r的绝对值越接近于1,表示相关程度越大,越接近于0,相关程度越小,故D正确. 故选BCD.三、填空题:本题共4小题,每小题5分,共20分. 13. 已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归方程为Y=2X+,若样本点(r,1)和(2,s)的偏差相同,则r和s的关系为s+2r=5. 解析:根据偏差的定义,可得1-(2r+)=s-(2×2+),整理,得s+2r=5. 14. 已知线性相关的变量X与Y的部分数据如表所示:若其线性回归方程是Y=1. 05X+0. 85,则m=6. 5. 解析:由题意可得=5,,则=1. 05×5+0. 85,解得m=6. 5. 15. 某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过0. 10的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得χ2=≈3. 689>2. 706,因此,在犯错误的概率不超过0. 10的前提下认为性别与休闲方式有关系. 16. 某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如下数据:由表中数据,求得线性回归方程为Y=,则=,若某儿童的记忆能力为12时,预测他的识图能力为9. 5. 解析:由表中数据得=7,=5. 5,由()在直线Y=,即5. 5=×7+得,即线性回归方程为Y=. 所以当X=12时,Y=×12-=9. 5,即他的识图能力为9. 5. 四、解答题:本题共6小题,共70分. 解答应写出文字说明、证明过程或演算步骤. 17. (10分)某单位为了了解用电量Y千瓦·时与气温X ℃之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表. 由表中数据得线性回归方程Y=中≈-2,预测当气温为-4 ℃时的用电量. 解:=10,=40,回归直线过点(),所以40=-2×10+,所以=60,所以Y=-2X+60. 令X=-4,得Y=(-2)×(-4)+60=68. 故当气温为-4 ℃时,用电量预计为68千瓦·时. 18. (12分)西瓜是夏日消暑的好水果,西瓜的销售价格Y(单位:千元/吨)与西瓜的年产量X(单位:吨)有关,下表数据为某地区连续6年来西瓜的年产量及对应的西瓜销售价格. (1)若Y与X有较强的线性相关关系,根据上表提供的数据,用最小二乘法求出Y与X的线性回归直线方程;(系数精确到0. 01)(2)若每吨西瓜的成本为4 810元,假设所有西瓜可以全部卖出,预测当年产量为多少吨时年利润最大?参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线Y=的斜率和截距的最小二乘估计分别为,其中=3. 5,=91,xiyi=146. 8. 解:(1)设Y与X的回归直线方程为Y==≈-0. 81,×3. 5≈10. 51,所以Y=-0. 81X+10. 51. (2)设年利润为Z千元,则Z=(-0. 81X+10. 51)×X-×X=-0. 81X2+5. 7X,当X=-≈3. 52时,Z取最大值,所以当年产量为3. 52吨时,年利润最大. 19. (12分)第24届冬奥会于2022年2月4日至2月20日在北京市和河北省张家口市联合举行,这是中国历史上第一次举办冬季奥运会,为了宣传冬奥会,让更多的人了解、喜爱冰雪项目,某校高三年级举办了冬奥会知识竞赛(总分100分),并随机抽取了n名中学生的成绩,绘制成如图所示的频率分布直方图. 已知前三组的频率分别为f1,f2,f3,2f2=f1+f3,第一组和第五组的频率相同. (1)求实数a,b的值,并估计这n名中学生的成绩平均值;(同一组中的数据用该组区间的中点值作代表)(2)已知抽取的n名中学生中,男女生人数相等,男生喜欢花样滑冰的人数占男生人数的,女生喜欢花样滑冰项的人数占女生人数的,且有95%的把握认为中学生喜欢花样滑冰与性别有关,求n的最小值. 解:(1)由题意可知,解得各组频率依次为0. 05,0. 25,0. 45,0. 2,0. 05,∴=0. 05×50+0. 25×60+0. 45×70+0. 2×80+0. 05×90=69. 5(分). (2)设男生人数为x,依题意可得列联表如下:χ2=x>3. 841,∴x≥29. 又x=4k,k∈N+,且各组的频数为正整数,故xmin=40,nmin=80. 20. (12分)我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气. 推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容. 2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量. (1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;(2)建立y关于t的回归方程(系数精确到0. 01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:yi=9. 24,tiyi=39. 75,≈0. 53,≈2. 646. 参考公式:相关系数r=(ti-)(yi-)=yi. 回归方程t中斜率和截距的最小二乘估计公式分别为. 解:(1)作出散点图如图所示:由条形图数据和参考数据得=4,(ti-)2=28,≈0. 53,(ti-)(yi-)=yi=39. 75-4×9. 24=2. 79,r≈≈0. 99. 因为y与t的相关系数近似为0. 99,说明y与t的线性相关性相当高,从而可以用线性回归模型拟合y与t的关系. (2)由=1. 32及(1)得≈0. 10,≈1. 32-0. 10×4=0. 92,所以,y关于t的回归方程为y=0. 92+0. 10t. 将t=11代入回归方程得y=0. 92+0. 10×11=2. 02,所以预测11月份该省煤改气、煤改电的用户数量达到2. 02万户. 21. (12分)某报社为了解大学生对国产电影的关注情况,就“是否关注国产电影”这一问题,随机调查了某大学的60名男生和60名女生,得到如下列联表:(1)从这60名女生中按“是否关注国产电影”进行分层抽样,抽取一个容量为6的样本,再从中随机选取2名进行深度采访,求“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率;(2)根据以上列联表,问有多大把握认为“大学生关注国产电影与性别有关”. 解:(1)根据分层抽样,可得抽取的容量为6的样本中,关注国产电影的女生有×40=4(名),不关注国产电影的女生有×20=2(名). 所以“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率为P=. (2)根据题中的列联表,得χ2=≈4. 444. 由4. 444>3. 841,可知有95%的把握认为“大学生关注国产电影与性别有关”. 22. (12分)我国全面二孩政策已于2016年1月1日起正式实施. 国家统计局发布的数据显示,从2012年到2017年,中国的人口自然增长率变化始终不大,在5‰上下波动(如图). 为了了解年龄介于24岁至50岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为9组,每组选取150对夫妻进行调查统计有生育二孩意愿的夫妻数,得到下表:(1)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归方程,并求该模型的相关系数r;(结果保留两位小数)(2)从[24,26],[33,35],[39,41],[45,47],[48,50]这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这5对夫妻中任选2对夫妻. 求其中恰有一对不愿意生育二孩的夫妻的概率. (参考数据和公式:r=,(xi-)(yi-)=yi,xiyi=26 340,≈473. 96)解:(1)由题意可求得=37,yi=720,=80,yi=26 640,xiyi=26 340,∴(xi-)(yi-)=yi=26 340-26 640=-300. 又∵(xi-)2=122+92+62+32+32+62+92+122=540,(yi-)2=0+1+49+36+16+9+9+100+196=416,∴(xi-)2·(yi-)2=540×416=224 640. ∴≈-0. 56. ∴≈100. 72. ∴线性回归方程为Y=-0. 56X+100. 72. ∴r==≈-0. 63. (2)由题意可知,在[24,26],[33,35],[39,41]年龄段中,超过半数的夫妻有生育二孩意愿,在[45,47],[48,50]年龄段中,超过半数的夫妻没有生育二孩意愿. 设从[24,26],[33,35],[39,41]年龄段中选出的夫妻分别为A1,A2,A3,从[45,47],[48,50]年龄段中选出的夫妻分别为B1,B2. 则从中选出2对夫妻的所有可能结果为(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A2,A3),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),共10种情况. 其中恰有一对不愿意生育二孩的夫妻的情况有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),共6种. ∴恰有一对不愿意生育二孩的夫妻的概率P=. 所挂重量X/N123579弹簧长度Y/cm111212131416X34567Y4. 02. 5-0. 50. 5-2. 0模型1234r0. 480. 150. 960. 30x123456y021334X24568Y34. 5m7. 59读书健身总计女243155男82634总计325789记忆能力X46810识图能力Y3568气温/℃181310-1用电量/(千瓦·时)24343864X123456Y9. 58. 98. 17. 56. 85. 2男生女生总计关注国产电影504090不关注国产电影102030总计6060120年龄区间[24,26][27,29][30,32][33,35][36,38][39,41][42,44][45,47][48,50]有意愿数808187868483837066所挂重量X/N123579弹簧长度Y/cm111212131416X34567Y4. 02. 5-0. 50. 5-2. 0模型1234r0. 480. 150. 960. 30x123456y021334X24568Y34. 5m7. 59读书健身总计女243155男82634总计325789记忆能力X46810识图能力Y3568气温/℃181310-1用电量/(千瓦·时)24343864X123456Y9. 58. 98. 17. 56. 85. 2喜欢花样滑冰不喜欢花样滑冰合计男生xxx女生xxx合计xx2x男生女生总计关注国产电影504090不关注国产电影102030总计6060120年龄区间[24,26][27,29][30,32][33,35][36,38][39,41][42,44][45,47][48,50]有意愿数808187868483837066
相关资料
更多