


高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(练)(带答案)试卷
展开
这是一份高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(练)(带答案)试卷,共8页。
变量间的相关性与统计案例[澄清盲点误点]一、关键点练明1.(分类变量)为调查中学生近视情况,测得某校男生150名中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )A.回归分析 B.均值与方差C.独立性检验 D.概率解析:选C “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.2.(回归分析)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间具有线性相关关系,设其回归直线方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为( )A.160 B.163C.166 D.170解析:选C 易知==22.5,==160.因为=4,所以160=4×22.5+,解得=70,所以回归直线方程为=4x+70,当x=24时,=96+70=166.故选C.3.(独立性检验)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表: 理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析:K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%二、易错点练清1.(独立性检验理解不当)某医疗机构通过抽样调查(样本容量n=1 000),利用2×2列联表和K2统计量研究患肺病是否与吸烟有关.计算得K2=4.453,经查阅临界值表知P(K2≥3.841)≈0.05,现给出四个结论,其中正确的是( )A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”解析:选C 由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.故选C.2.(忽视回归直线过样本点中心)已知变量x和y的统计数据如下表:x34567y2.5344.56根据上表可得回归直线方程为=x-0.25,据此可以预测当x=8时,=( )A.6.4 B.6.25C.6.55 D.6.45解析:选C 由题意知==5,==4,将点(5,4)代入=x-0.25,解得=0.85,则=0.85x-0.25,所以当x=8时,=0.85×8-0.25=6.55,故选C. 一、综合练——练思维敏锐度1.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x解析:选D 用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y=a+bln x.2.(多选)下列说法正确的是( )A.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越差B.某地气象局预报:6月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学C.回归分析模型中,残差平方和越小,说明模型的拟合效果越好D.在回归直线方程=0.1x+10中,当解释变量每增加1个单位时,预报变量增加0.1个单位解析:选CD 对A项,在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故A错误;对B项,概率只说明事件发生的可能性,某次事件不一定发生,所以并不能说明天气预报不科学,故B错误;对C项,在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,故C正确;对D项,在回归直线方程=0.1x+10中,当解释变量x每增加1个单位时,预报变量增加0.1个单位,故D正确,故选C、D.3.某模具厂采用了新工艺后,原材料支出费用x与销售额y(单位:万元)之间有如下数据,由散点图可知,销售额y与原材料支出费用x有较好的线性相关关系,其线性回归方程是=x+48,则当原材料支出费用为40时,预估销售额为( )x1015202530y110125160185220A.252 B.268C.272 D.288解析:选C 由题意得=20,=160,将点代入回归方程=x+48中,得=5.6,∴回归方程为=5.6x+48,∴当x=40时,=272,故选C.4.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表. 非一线一线总计愿生452065不愿生132235总计5842100计算得,K2≈9.616.参照下表,P(K2≥k0)0.0500.0100.001k03.8416.63510.828下列结论正确的是( )A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”解析:选C 因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.5.(多选)我国5G技术研发试验在2016~2018年进行,分为5G关键技术试验、5G技术方案验证和5G系统验证三个阶段.2020年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了近5个月来5G手机的实际销量,如下表所示:月份2020年8月2020年9月2020年10月2020年11月2020年12月月份编号x12345销量y/部5096a185227若y与x线性相关,且求得线性回归方程为=45x+5,则下列说法正确的是( )A.a=142B.y与x正相关C.y与x的相关系数为负数D.2021年2月该手机商城的5G手机销量约为365部解析:选AB ==3,==,因为点(,)在回归直线上,所以=45×3+5,解得a=142,所以选项A正确;从表格数据看,y随x的增大而增大,所以y与x正相关,所以选项B正确;因为y与x正相关,所以y与x的相关系数为正数,所以选项C错误;2021年2月对应的月份编号x=7,当x=7时,=45×7+5=320,所以2021年2月该手机商城的5G手机销量约为320部,所以选项D错误.故选A、B.6.(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表: 夜晚天气日落云里走 下雨未下雨出现255未出现2545临界值表P(K2≥k0)0.100.050.0100.001k02.7063.8416.63510.828并计算得到K2≈19.05,下列小波对地区A天气判断正确的是( )A.夜晚下雨的概率约为B.未出现“日落云里走”夜晚下雨的概率约为C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨解析:选D 由题意,把频率看作概率可得夜晚下雨的概率约为=,故A判断正确;未出现“日落云里走”,夜晚下雨的概率约为=,故B判断正确;由K2≈19.05>10.828,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C判断正确,D判断错误,故选D.7.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y与x的回归直线方程为=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,则年教育支出平均增加________万元.解析:因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.答案:0.158.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人) 几何题代数题总计男同学22830女同学81220总计302050 根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________.附表:P(K2≥k0)0.100.050.0250.0100.001k02.7063.8415.0246.63510.828 解析:由列联表计算K2的观测值k=≈5.556>5.024.∴推断犯错误的概率不超过0.025.答案:0.0259.近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:年份12345羊只数量/万只1.40.90.750.60.3草地植被指数1.14.315.631.349.7根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为r1,去掉第一年数据后得到的相关系数为r2,则|r1|<|r2|;③可以利用回归直线方程,准确地得到当羊只数量为2万只时的草地植被指数.以上判断中正确的个数是________.解析:对于①,羊只数量与草地植被指数成负相关关系,不是减函数关系,所以①错误;对于②,用这五组数据得到的两变量间的相关系数为r1,因为第一年数据(1.4,1.1)是离群值,去掉后得到的相关系数为r2,其相关性更强,所以|r1|<|r2|,②正确;对于③,利用回归直线方程,不能准确得到当羊只数量为2万只时的草地植被指数,得到的只是预测值,所以③错误.综上知,正确的判断序号是②,共1个.答案:110.“学习强国”APP是由中宣部主管以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容的“PC端+手机客户端”两大终端二合一模式的学习平台,2019年1月1日上线后便成了党员干部群众学习的“新助手”,为了调研某地党员在“学习强国”APP的学习情况,研究人员随机抽取了200名该地党员进行调查,将他们某两天在“学习强国”APP上所得的分数统计如表(1)所示:表(1)分数[60,70)[70,80)[80,90)[90,100]人数501002030 (1)现用分层抽样的方法从80分及以上的党员中随机抽取5人,再从抽取的5人中随机选取2人作为学习小组长,求所选取的两位小组长的分数都在上的概率;(2)为了调查“学习强国”APP得分情况是否受到所在单位的影响,研究人员随机抽取了机关事业单位党员以及国有企业党员作出调查,得到的数据如表所示:表(2) 机关事业单位党员国有企业党员分数超过80220150分数不超过808050判断是否有99%的把握认为“学习强国”APP得分情况受所在单位的影响.附:K2=,n=a+b+c+d.P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828解:(1)由题意得,分数在上抽取2人,记为a,b;分数在上抽取3人,记为A,B,C.选取2人作为学习小组长的基本事件有10个,即(a,b),(a,A),(a,B),(a,C),(b,A),(b,B),(b,C),(A,B),(A,C),(B,C),其中两位小组长的分数都在上的有(A,B),(A,C),(B,C)共3个基本事件,∴所求概率P=.(2)完善表格如下: 机关事业单位党员国有企业党员总计分数超过80220150370分数不超过808050130总计300200500 K2=≈0.173<6.635,故没有99%的把握认为“学习强国”APP得分情况受所在单位的影响.11.一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资料:日期第一年第二年第三年第四年优惠金额x/千元10111312销售量y/辆22243127 (1)求出y关于x的线性回归方程=x+;(2)若第5年优惠金额8.5千元,估计第5年的销售量y(辆)的值.参考公式:=,=-.解:(1)由题中数据可得=11.5,=26,xiyi=1 211,x=534,∴====3,故=-=26-3×11.5=-8.5,∴y关于x的线性回归方程为=3x-8.5.(2)由(1)得,当x=8.5时,=17,∴第5年优惠金额为8.5千元时,销售量估计为17辆.
相关试卷
这是一份高端精品高中数学一轮专题-抛物线(练)(带答案)试卷,共9页。
这是一份高端精品高中数学一轮专题-双曲线(练)(带答案)试卷,共10页。
这是一份高端精品高中数学一轮专题-椭圆(练)(带答案)试卷,共11页。