高考数学一轮复习考点规范练56变量间的相关关系统计案例含解析新人教A版理
展开
这是一份高考数学一轮复习考点规范练56变量间的相关关系统计案例含解析新人教A版理,共10页。试卷主要包含了两个随机变量x,y的取值如下表,8)的残差为0等内容,欢迎下载使用。
考点规范练56 变量间的相关关系、统计案例基础巩固1.(2020全国Ⅰ,理5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+bln x答案:D解析:结合题中散点图,由图象的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+blnx.2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若在统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确答案:C解析:独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.3.两个随机变量x,y的取值如下表:x0134y2.24.34.86.7若x,y具有线性相关关系,且x+2.6,则下列四个结论错误的是( )A.x与y是正相关B.当x=6时,y的估计值为8.3C.x每增加一个单位,y大约增加0.95个单位D.样本点(3,4.8)的残差为0.56答案:D解析:由表格中的数据可知选项A正确;(0+1+3+4)=2,(2.2+4.3+4.8+6.7)=4.5,∴4.5=2+2.6,即=0.95,=0.95x+2.6.当x=6时,=0.95×6+2.6=8.3,故选项B正确;由=0.95+2.6可知选项C正确;当x=3时,=0.95×3+2.6=5.45,残差是5.45-4.8=0.65,故选项D错误.4.“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:性别“光盘”做不到“光盘”能做到“光盘”男4510女3015则下面的正确结论是( )A.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”答案:A解析:由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=3.030.因为2.706<3.030,所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”,故选A.5.若两个分类变量X和Y的2×2列联表如下:变量X变量Y合计y1y2x151520x2401050合计452570则在犯错误的概率不超过 的前提下认为X与Y之间有关系. 答案:0.001解析:K2的观测值k=18.822>10.828,所以在犯错误的概率不超过0.001的前提下认为X与Y之间有关系.6.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,=720.(1)求家庭的月储蓄对月收入x的线性回归方程x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.解:(1)由题意知n=10,xi==8,yi==2,又-10=720-10×82=80,xiyi-10=184-10×8×2=24,由此得=0.3,=2-0.3×8=-0.4,故所求线性回归方程为=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(=0.3>0),因此x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).能力提升7.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁、9岁、12岁、15岁、18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是( )A.根据样本数据,估计该地区青少年身高与年龄成正相关B.所抽取数据中,5 000名青少年平均身高约为145 cmC.直线l的斜率的值近似等于样本中青少年平均身高每年的增量D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上答案:D解析:在给定范围内,随着年龄的增加,年龄越大,身高越高,该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均身高约是145cm,故B正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误,故选D.8.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( )A>b',>a' B>b',<a'C<b',>a' D<b',<a'答案:C解析:由题意可知,b'=2,a'=-2,=-,则<b',>a',故选C.9.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下的列联表:班级成绩总计优秀非优秀甲班10b 乙班c30 总计 已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是 .(填序号) ①列联表中c的值为30,b的值为35;②列联表中c的值为15,b的值为50;③根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,能认为“成绩与班级有关系”;④根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,不能认为“成绩与班级有关系”.答案:③解析:由题意知,成绩优秀的学生人数是30,成绩非优秀的学生人数是75,所以c=20,b=45,①②错误.根据列联表中的数据,得到K2的观测值k=6.6>5.024,因此在犯错误的概率不超过0.025的前提下认为“成绩与班级有关系”.故③正确,④错误.高考预测10.国内某知名大学有男生14 000人,女生10 000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表.(平均每天运动的时间单位:h,该校学生平均每天运动的时间范围是[0,3])男生平均每天运动的时间分布情况:平均每天运动的时间[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3]人 数212231810x女生平均每天运动的时间分布情况:平均每天运动的时间[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3]人 数51218103y(1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1);(2)若规定平均每天运动的时间不少于2 h的学生为“运动达人”,低于2 h的学生为“非运动达人”.①请根据样本估算该校“运动达人”的数量;②请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断能否在犯错误的概率不超过 0.05 的前提下认为“运动达人”与性别有关?性别运动总计运动达人非运动达人男生 女生 总计 参考公式:K2=,其中n=a+b+c+d.参考数据:P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828解:(1)由分层抽样可知,抽取的男生人数为120=70,抽取的女生人数为120-70=50,故x=5,y=2.则该校男生平均每天运动的时间为≈1.5(h),故该校男生平均每天运动的时间约为1.5h.(2)①样本中“运动达人”所占比例是,故估计该校“运动达人”有(14000+10000)=4000(人).②由表格可知:性别运动总计运动达人非运动达人男生155570女生54550总计20100120故K2的观测值k=2.743<3.841.故在犯错误的概率不超过0.05的前提下不能认为“运动达人”与性别有关.
相关试卷
这是一份2023年高考数学一轮复习课时规范练56变量间的相关关系统计案例含解析新人教A版理,共7页。试卷主要包含了相关变量的样本数据如下表,,5x+2,3时,x一定是8,已知下列说法等内容,欢迎下载使用。
这是一份高考数学一轮复习考点规范练54随机抽样含解析新人教A版理,共8页。
这是一份高考数学一轮复习考点规范练49椭圆含解析新人教A版理,共11页。试卷主要包含了设F1,F2为椭圆C等内容,欢迎下载使用。