所属成套资源:高二化学期末回归同步练习(2019人教版选择性必修第三册)
- 习题课(二) 随机变量及其分布 试卷 0 次下载
- 习题课(三) 成对数据的统计分析 试卷 0 次下载
- 章末综合检测(二) 随机变量及其分布(A、B卷) 试卷 0 次下载
- 习题课(一) 计数原理 试卷 0 次下载
- 章末综合检测(一) 计数原理(A、B卷) 试卷 0 次下载
章末综合检测(三) 成对数据的统计分析(A、B卷)
展开这是一份章末综合检测(三) 成对数据的统计分析(A、B卷),共24页。试卷主要包含了单项选择题,多项选择题,填空题,解答题等内容,欢迎下载使用。
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.可用来分析身高与体重有关系的是( )
A.残差分析 B.线性回归模型
C.等高堆积条形图 D.独立检验
解析:选B 因为身高与体重是两个具有相关关系的变量,所以要用线性回归模型来解决.
2.两个变量y与x的经验回归模型中,分别选择了四个不同模型来拟合y与x之间的关系,它们的相关指数R2如下,其中拟合效果最好的模型是( )
A.模型1 B.模型2
C.模型3 D.模型4
解析:选A 两个变量y与x的经验回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果越好,所给出的四个选项中0.98是相关指数最大的值,所以拟合效果最好的模型是模型1.
3.已知一组观测值(x1,y1),(x2,y2),…,(xn,yn)满足yi=a+bxi+ei(i=1,2,…,n),若ei恒为0,则R2=( )
A.0 B.0.5
C.0.9 D.1
解析:选D 若ei恒为0,则残差平方和
eq \i\su(i=1,n, )(yi-eq \(y,\s\up6(^))i)2=eq \i\su(i=1,n,e)eq \\al(2,i)=0,
所以R2=1-eq \f(\i\su(i=1,n, )yi-\(y,\s\up6(^))i2,\i\su(i=1,n, )yi-\(y,\s\up6(-))2)=1-0=1.
4.如果有95%的把握说事件A和B有关系,那么具体计算出的数据为( )
A.χ2>3.841 B.χ2<3.841
C.χ2>6.635 D.χ2<6.635
解析:选A 由独立性判断的方法可知,如果有95%的把握,即小概率值α=0.05,则χ2>3.841.
5.观察两个变量(存在线性相关关系)得如下数据:
则两变量间的线性经验回归方程为( )
A.eq \(y,\s\up6(^))=eq \f(1,2)x+1 B.eq \(y,\s\up6(^))=x
C.eq \(y,\s\up6(^))=2x+eq \f(1,3) D.eq \(y,\s\up6(^))=x+1
解析:选B 根据表中数据得eq \(x,\s\up6(-))=eq \f(1,8)×(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,eq \(y,\s\up6(-))=eq \f(1,8)×(-9-7-5-3+4.01+4.99+7+8)=0,所以两变量x,y的经验回归方程过样本点的中心(0,0),可以排除A、C、D选项,故选B.
6.2020年初,新型冠状病毒(COVID19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:
由表格可得y关于x的二次回归方程为eq \(y,\s\up6(^))=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为( )
A.5 B.4
C.1 D.0
解析:选A 设t=x2,则eq \(t,\s\up6(-))=eq \f(1,5)(1+4+9+16+25)=11,eq \(y,\s\up6(-))=eq \f(1,5)(2+17+36+93+142)=58,a=58-6×11=-8,所以eq \(y,\s\up6(^))=6x2-8.令x=4,得e4=y4-eq \(y,\s\up6(^))4=93-6×42+8=5.
7.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:
参考数据及公式:
其中χ2=eq \f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.
则下列结论正确的是( )
A.根据小概率值α=0.05的独立性检验,认为爱吃零食与性别有关
B.根据小概率值α=0.05的独立性检验,认为爱吃零食与性别无关
C.根据小概率值α=0.01的独立性检验,认为爱吃零食与性别有关
D.根据小概率值α=0.1的独立性检验,认为爱吃零食与性别无关
解析:选A 零假设为
H0:是否爱吃零食与性别相互独立,即是否爱吃零食与性别无关.
根据列联表中的数据,经计算得到
χ2=eq \f(100×10×30-40×202,50×50×30×70)≈4.762>3.841=x0.05,
所以依据小概率值α=0.05的独立性检验,推断H0不成立,即认为是否爱吃零食与性别有关.同理可得,根据小概率值α=0.01的独立性检验,认为爱吃零食与性别无关;根据小概率值α=0.1的独立性检验,认为爱吃零食与性别有关.
8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为eq \(y,\s\up6(^))=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72%
C.67% D.66%
解析:选A 将eq \(y,\s\up6(^))=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分)
9.下列说法正确的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性经验回归模型中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的水平带状区域的宽度越狭窄,其模型拟合的精度越高
D.在经验回归模型中,R2为0.98的模型比R2为0.80的模型拟合的效果好
解析:选ACD 由于线性相关系数|r|≤1,且当|r|越大,线性相关性越强,故r<0时,选项B不正确,A、C、D均正确.
10.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,则下列结论正确的是( )
A.y与x负相关且eq \(y,\s\up6(^))=2.347x-6.423
B.y与x负相关且eq \(y,\s\up6(^))=-3.476x+5.648
C.y与x正相关且eq \(y,\s\up6(^))=5.437x+8.493
D.y与x正相关且eq \(y,\s\up6(^))=-4.326x-4.578
解析:选BC 正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故正确的为B、C.
11.以下关于线性经验回归的判断中,正确的选项为( )
A.若散点图中所有点都在一条直线附近,则这条直线为经验回归直线
B.散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点
C.已知线性经验回归方程为eq \(y,\s\up6(^))=0.50x-0.81,则x=25时,y的估计值为11.69
D.线性经验回归方程的意义是它反映了样本整体的变化趋势
解析:选BCD 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数eq \(a,\s\up6(^)),eq \(b,\s\up6(^))得到的直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))才是回归直线,所以A错误;B正确;将x=25代入eq \(y,\s\up6(^))=0.50x-0.81,得eq \(y,\s\up6(^))=11.69,所以C正确;D正确.
12.有两个分类变量X与Y,其2×2列联表如下表所示:
其中a,15-a均为大于5的整数,根据小概率值α=0.05的独立性检验,认为X与Y之间有关,则a等于( )
A.7 B.8
C.9 D.6
解析:选BC 根据小概率值α=0.05的独立性检验,认为X与Y之间有关,需要χ2的值大于或等于3.841,
由χ2=eq \f(65×[a30+a-20-a15-a]2,20×45×15×50)
=eq \f(1313a-602,5 400)≥3.841,
解得a≥7.69或a≤1.54.而a>5且15-a>5,a∈Z,
所以a=8或a=9.
三、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
13.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:
则χ2=________(保留到小数点后两位有效数字).
解析:由列联表知
χ2=eq \f(100×10×15-50×252,60×40×65×35)≈22.16.
答案:22.16
14.已知样本容量为11,计算得eq \i\su(i=1,11,x)i=510,eq \i\su(i=1,11,y)i=214,经验回归方程为eq \(y,\s\up6(^))=0.3x+eq \(a,\s\up6(^)),则eq \x\t(x)≈________,eq \(a,\s\up6(^))≈________.(精确到0.01)
解析:由题意得eq \x\t(x)=eq \f(1,11)eq \i\su(i=1,11,x)i=eq \f(510,11)≈46.36,eq \x\t(y)=eq \f(1,11)eq \i\su(i=1,11,y)i=eq \f(214,11),因为eq \x\t(y)=0.3eq \x\t(x)+eq \(a,\s\up6(^)),所以eq \f(214,11)=0.3×eq \f(510,11)+eq \(a,\s\up6(^)),可得eq \(a,\s\up6(^))≈5.55.
答案:46.36 5.55
15.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,根据表中数据,得到χ2=eq \f(50×13×20-10×72,23×27×20×30)≈4.844>3.841,所以能根据小概率值α=________,我们断定主修统计专业与性别有关系.
解析:因为P(χ2≥3.841)=0.05,所以小概率值α=0.05.
答案:0.05
16.下表是降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于x的线性经验回归方程eq \(y,\s\up6(^))=0.7x+0.35,那么表中m的值为________.
解析:根据所给的表格可以求出
eq \(x,\s\up6(-))=eq \f(3+4+5+6,4)=4.5,eq \(y,\s\up6(-))=eq \f(2.5+m+4+4.5,4)=eq \f(11+m,4),
因为这组数据的样本点的中心在线性经验回归直线上,
所以eq \f(11+m,4)=0.7×4.5+0.35,所以m=3.
答案:3
四、解答题(本大题共6小题,共70分.解答应写出必要的文字说明、证明过程或演算步骤)
17.(10分)一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).
(1)假定y与x之间有线性相关关系,求y对x的经验回归方程.
(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1转/秒)
解:(1)设经验回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),
易知eq \(x,\s\up6(-))=12.5,eq \(y,\s\up6(-))=8.25,eq \i\su(i=1,4,x)eq \\al(2,i)=660,eq \i\su(i=1,4,x)iyi=438.
于是eq \(b,\s\up6(^))=eq \f(438-4×12.5×8.25,660-4×12.52)=eq \f(51,70),
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))=8.25-eq \f(51,70)×12.5=-eq \f(6,7).
所以所求的经验回归方程为eq \(y,\s\up6(^))=eq \f(51,70)x-eq \f(6,7).
(2)由eq \(y,\s\up6(^))=eq \f(51,70)x-eq \f(6,7)≤10,得x≤eq \f(760,51).
因为eq \f(760,51)≈14.9,所以机器的速度不得超过14转/秒.
18.(12分)为做好2022年北京冬季奥运会的宣传工作,组委会计划从某大学选取若干名大学生志愿者,某记者在该大学随机调查了1 000名大学生,以了解他们是否愿意做志愿者工作,得到的数据如表所示:
(1)根据题意完成表格.
(2)依据小概率值α=0.05的独立性检验,分析愿意做志愿者工作与性别是否有关?
参考公式及数据:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
解:(1)补全列联表得:
(2)零假设为
H0:愿意做志愿者工作与性别是相互独立,即愿意做志愿者工作与性别是无关的.
根据列联表中的数据,经计算得到
χ2=eq \f(1 000×500×90-110×3002,610×390×800×200)=eq \f(3 000,793)≈3.783<3.841=x0.05,
所以依据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,即愿意做志愿者工作与性别是无关的.
19.(12分)在统计学中,偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差,班主任为了了解个别学生的偏科情况,对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行学科偏差分析,决定从全班56位同学中随机抽取一个容量为8的样本进行分析,得到他们的两科成绩偏差数据如表:
(1)已知x与y之间具有线性相关关系,求y关于x的经验回归方程;
(2)若这次考试该班数学平均分为118分,物理平均分为90.5,试预测数学成绩126分的同学的物理成绩.
参考数据:eq \i\su(i=1,8,x)iyi=324,eq \i\su(i=1,8,x)eq \\al(2,i)=1 256.
解:(1)由题意,eq \(x,\s\up6(-))=eq \f(1,8)×[20+15+13+3+2+(-5)+(-10)+(-18)]=eq \f(5,2),
eq \(y,\s\up6(-))=eq \f(1,8)×[6.5+3.5+3.5+1.5+0.5+(-0.5)+(-2.5)+(-3.5)]=eq \f(9,8),
eq \(b,\s\up6(^))=eq \f(\i\su(i=1,8,x)iyi-8\(x,\s\up6(-))\(y,\s\up6(-)),\i\su(i=1,8,x)\\al(2,i)-8\(x,\s\up6(-))2)=eq \f(324-8×\f(5,2)×\f(9,8),1 256-8×\b\lc\(\rc\)(\a\vs4\al\c1(\f(5,2)))2)=eq \f(1,4),
所以eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))=eq \f(9,8)-eq \f(1,4)×eq \f(5,2)=eq \f(1,2),
故经验回归方程为eq \(y,\s\up6(^))=eq \f(1,4)x+eq \f(1,2).
(2)由题意,设该同学的物理成绩为ω,
则物理偏差为ω-90.5.
而数学偏差为126-118=8,
由(1)的结论可得,ω-90.5=eq \f(1,4)×8+eq \f(1,2),
解得ω=93,
所以可以预测这位同学的物理成绩为93分.
20.(12分)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展,下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
(1)求新能源乘用车的销量y关于年份x的线性相关系数r,并判断y与x是否线性相关;
(2)请将列联表补充完整,并根据小概率值α=0.1的独立性检验,能否认为购车车主是否购置新能源乘用车与性别有关.
参考公式:r=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,n, )xi-\(x,\s\up6(-))2) \r(\i\su(i=1,n, )yi-\(y,\s\up6(-))2))
χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d,eq \r(635)≈25,若r>0.9,则可判断y与x线性相关.
附表:
解:(1)依题意,
eq \(x,\s\up6(-))=eq \f(2 014+2 015+2 016+2 017+2 018,5)=2 016,
eq \(y,\s\up6(-))=eq \f(8+10+13+25+24,5)=16,
所以eq \i\su(i=1,5, )(xi-eq \(x,\s\up6(-)))(yi-eq \(y,\s\up6(-)))=(-2)×(-8)+(-1)×(-6)+1×9+2×8=47,
eq \i\su(i=1,5, )(xi-eq \(x,\s\up6(-)))2=4+1+1+4=10,
eq \i\su(i=1,5, )(yi-eq \(y,\s\up6(-)))2=64+36+9+81+64=254,
则r=eq \f(\i\su(i=1,5, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,5, )xi-\(x,\s\up6(-))2)\r(\i\su(i=1,5, )yi-\(y,\s\up6(-))2))=eq \f(47,\r(10)×\r(254))=eq \f(47,2\r(635))≈0.93>0.9,故y与x线性相关.
(2)依题意,完善表格如下:
零假设为
H0:购车车主是否购置新能源乘用车与性别相互独立,即购置新能源乘用车与性别无关,
根据表格数据得
χ2=eq \f(30×18×4-2×62,20×10×24×6)=3.75>2.706,
所以根据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为购车车主是否购置新能源乘用车与性别有关.
21.(12分)自从高中生通过高校自主招生可获得加分进入高校的政策出台后,自主招生越来越受到高中生家长的重视.某机构为了调查A城市和B城市的高中家长对于自主招生的关注程度,在这两个城市中抽取了100名高中生家长进行了调查,得到下表:
(1)完成上面的列联表;
(2)根据上面列联表的数据,能否根据小概率值α=0.05的独立性检验,判断家长对自主招生关注与否与所处城市有关系;
(3)为了进一步研究家长对自主招生的看法,该机构从关注的学生家长里面,按照分层随机抽样方法抽取了5人,并再从这5人里面抽取2人进行采访,求所抽取的2人恰好A,B两城市各一人的概率.
参考公式:χ2=eq \f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d).
附表:
解:(1)列联表如下:
(2)零假设为
H0:家长对自主招生关注与否与所处城市相互独立,即家长对自主招生关注与否与所处城市无关.
根据列联表中的数据,经计算得到
χ2=eq \f(100×20×20-30×302,50×50×50×50)=4>3.841.
所以根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为家长对自主招生的关注与否与所处城市是有关的.
(3)关注的人共有50人,按照分层随机抽样的方法,A城市2人,B城市3人,从5人中抽取2人有Ceq \\al(2,5)=10种不同的方法,A,B两城市各取一人有Ceq \\al(1,2)Ceq \\al(1,3)=2×3=6种不同的方法,故所抽取的2人恰好A,B两城市各一人的概率为eq \f(C\\al(1,3)C\\al(1,2),C\\al(2,5))=eq \f(6,10)=0.6.
22.(12分)为了鼓励市民节约用电,实行“阶梯式”电价,将某边远山区每户居民月用电量划分为三档:月用电量不超过150度,按0.6元/度收费,超过150度但不超过250度的部分每度收费加价0.1元,超过250度的部分每度收费再加价0.3元.
(1)求该边远山区某户居民月用电费用n(单位:元)关于月用电量m(单位:度)的函数解析式.
(2)已知该边远山区贫困户的月用电量y(单位:度)与该户长期居住的人口数x(单位:人)间近似地满足线性相关关系eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))(eq \(b,\s\up6(^))的值精确到整数),其数据如下表:
现政府为减轻贫困家庭的经济负担,计划对该边远山区的贫困家庭进行一定的经济补偿,给出两种补偿方案供选择:一是根据该家庭人数,每人每月补偿6元;二是根据用电量每人每月补偿S=78.4-y(y为用电量)元,请根据家庭人数x分析,一个贫困家庭选择哪种补偿方式可以获得更多的补偿?
解:(1)当0≤m≤150时,n=0.6m;
当150
(2)由表中数据得,eq \x\t(x)=eq \f(1,4)×(14+15+17+18)=16,
eq \x\t(y)=eq \f(1,4)×(161+168+191+200)=180,
eq \i\su(i=1,4,x)iyi=14×161+15×168+17×191+18×200=11 621,
eq \i\su(i=1,4,x)eq \\al(2,i)=142+152+172+182=1 034,
∴eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\x\t(x) \x\t(y),\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2)=eq \f(11 621-4×16×180,1 034-4×162)=10.1≈10,
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=180-10×16=20,
∴y关于x的经验回归方程为eq \(y,\s\up6(^))=10x+20.
第一种补偿为S1=6x,
第二种补偿为S=78.4-y=78.4-(10x+20)=58.4-10x.
由6x-(58.4-10x)=16x-58.4≥0,得x≥3.65.
∴当家庭人数x≥4时,按第一种方式补偿较好;
当家庭人数x<4时,按第二种方式补偿较好.
B卷——高考能力达标卷
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列属于相关关系的是( )
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
解析:选B A与D是函数关系,C中两变量没有关系,B中居民收入与储蓄存款是相关的,但不具有函数关系.
2.已知一个经验回归方程为eq \(y,\s\up6(^))=1.5x+45,其中x的取值依次为1,7,5,13,19,则eq \(y,\s\up6(-))=( )
A.58.5 B.46.5
C.60 D.75
解析:选A eq \(x,\s\up6(-))=eq \f(1+7+5+13+19,5)=9,
因为经验回归直线必过样本点的中心(eq \(x,\s\up6(-)),eq \(y,\s\up6(-))),
所以eq \(y,\s\up6(-))=1.5×9+45=13.5+45=58.5.
3.已知每一吨铸铁成本y(元)与铸件废品率x%建立的经验回归方程eq \(y,\s\up6(^))=56+8x,则下列说法正确的是( )
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
解析:选C 根据经验回归方程知y是关于x的单调增函数,并且由系数知x每增加一个单位,y平均增加8个单位.
4.某商品销售量y(件)与销售价格x(元/件)负相关,则其经验回归方程可能是( )
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
解析:选A 由于销售量y与销售价格x成负相关,故排除B、D.又当x=10时,A中y=100,而C中y=-300,C不符合题意.
5.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为eq \(y,\s\up6(^))=0.85x-85.71,则下列说法错误的是( )
A.y与x具有正的线性相关关系
B.经验回归直线过样本点的中心
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:选D 选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79(kg).故D选项错误.
6.如图所示的是调查某地区男、女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的比例约为80%
C.男生比女生喜欢理科的可能性大些
D.男生中不喜欢理科的比例约为60%
解析:选C 由题图可知女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.
7.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
解析:选B 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
8.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:
根据表中数据,分析数学成绩与物理成绩有关联的出错率不超过( )
A.0.5% B.1%
C.0.1% D.5%
解析:选D 由表中数据代入公式得
χ2=eq \f(300×37×143-85×352,122×178×72×228)≈4.514>3.841=x0.05,
所以判断的出错率不超过5%.
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分)
9.给出下列实际问题,其中用独立性检验可以解决的问题有( )
A.一种药物对某种病的治愈率
B.两种药物治疗同一种病是否有区别
C.吸烟得肺病的概率
D.吸烟与性别是否有关系
答案:BD
10.对于经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),下列说法正确的是( )
A.直线必经过点(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)))
B.x增加1个单位时,y平均增加eq \(b,\s\up6(^))个单位
C.样本数据中x=0时,可能有y=eq \(a,\s\up6(^))
D.样本数据中x=0时,一定有y=eq \(a,\s\up6(^))
解析:选ABC 经验回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.
11.下列说法中正确的有( )
A.若r>0,则x增大时,y也相应增大
B.若r<0,则x增大时,y也相应增大
C.若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上
D.|r|越接近1,相关关系越强
解析:选ACD 若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故A正确.r<0,表示两个变量负相关,x增大时,y相应减小,故B错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故C正确,D正确.
12.根据如下样本数据:
得到的经验回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),则( )
A.eq \(a,\s\up6(^))>0 B.eq \(a,\s\up6(^))<0
C.eq \(b,\s\up6(^))>0 D.eq \(b,\s\up6(^))<0
解析:选AD 根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直线与y轴的交点在y轴正半轴,所以eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))<0.
三、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
13.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为eq \(y,\s\up6(^))=6+0.4x.由此可以估计:若两名同学的总成绩相差50分,则他们的数学成绩大约相差________分.
解析:令两人的总成绩分别为x1,x2.则对应的数学成绩估计为eq \(y,\s\up6(^))1=6+0.4x1,eq \(y,\s\up6(^))2=6+0.4x2,
所以|eq \(y,\s\up6(^))1-eq \(y,\s\up6(^))2|=|0.4(x1-x2)|=0.4×50=20.
答案:20
14.为了判断高三年级学生选修文科是否与性别有关,现随机抽取70名学生,得到如图所示2×2列联表:
已知P(χ2≥3.841)≈0.05,P(χ2≥6.635)≈0.01.根据表中数据,得到χ2≈4.667,则在犯错误的概率不大于________的前提下认为选修文科与性别有关.
解析:由题意知, χ2≈4.667,因为6.635>4.667>3.841,所以在犯错误的概率不大于0.05的前提下认为选修文科与性别有关.
答案:0.05
15.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分的含量x之间的关系,现取8对观测值,计算得eq \i\su(i=1,8,x)i=52,eq \i\su(i=1,8,y)i=228,eq \i\su(i=1,8,x)eq \\al(2,i)=478,eq \i\su(i=1,8,x)iyi=1 849,则y对x的经验回归方程是____________.(精确到0.01)
解析:由回归系数的计算公式,得eq \(b,\s\up6(^))=eq \f(\i\su(i=1,8,x)iyi-8\(x,\s\up6(-)) \(y,\s\up6(-)),\i\su(i=1,8,x)\\al(2,i)-8\(x,\s\up6(-))2)≈2.62,eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))=11.47,故所求的经验回归方程为eq \(y,\s\up6(^))=2.62x+11.47.
答案:eq \(y,\s\up6(^))=2.62x+11.47
16.已知x,y之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=eq \f(1,3)x+1与l2:y=eq \f(1,2)x+eq \f(1,2),利用最小二乘法判断拟合程度更好的直线是______________.
解析:用y=eq \f(1,3)x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(4,3)))2+(2-2)2+(3-3)2+eq \b\lc\(\rc\)(\a\vs4\al\c1(4-\f(10,3)))2+eq \b\lc\(\rc\)(\a\vs4\al\c1(5-\f(11,3)))2=eq \f(7,3).用y=eq \f(1,2)x+eq \f(1,2)作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2+eq \b\lc\(\rc\)(\a\vs4\al\c1(3-\f(7,2)))2+(4-4)2+eq \b\lc\(\rc\)(\a\vs4\al\c1(5-\f(9,2)))2=eq \f(1,2).
因为S2
四、解答题(本大题共6小题,共70分.解答应写出必要的文字说明、证明过程或演算步骤)
17.(10分)某班5名学生的数学和物理成绩如下表:
(1)画出散点图;
(2)求物理成绩y关于数学成绩x的经验回归方程(结果保留三位小数).
解:(1)散点图如图所示.
(2)因为eq \x\t(x)=eq \f(1,5)×(88+76+73+66+63)=73.2,
eq \x\t(y)=eq \f(1,5)×(78+65+71+64+61)=67.8,
eq \i\su(i=1,5,x)iyi=88×78+76×65+73×71+66×64+63×61=25 054,
eq \i\su(i=1,5,x)eq \\al(2,i)=882+762+732+662+632=27 174,
所以eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5,x)iyi-5\a\vs4\al(\(x,\s\up6(-)))\(y,\s\up6(-)),\i\su(i=1,5,x)\\al(2,i)-5\x\t(x)2)≈0.625,
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))≈67.8-0.625×73.2=22.050.
因此y关于x的经验回归方程为eq \(y,\s\up6(^))=22.050+0.625x.
18.(12分)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上.若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,则使用微信的人中75%是青年人.如果规定每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中,中年人有40人.
(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,请完成下面的2×2列联表;
(2)根据列联表中的数据,依据小概率值α=0.001的独立性检验分析该公司经常使用微信的员工与年龄的关系.
解:(1)由已知可得,该公司员工中使用微信的有200×90%=180(人).
经常使用微信的有180-60=120(人),
使用微信的人中青年人有180×75%=135(人),
故2×2列联表如下:
(2)零假设为
H0:该公司经常使用微信的员工与年龄相互独立,即该公司经常使用微信的员工与年龄无关.
将列联表中的数据代入公式可得,
χ2=eq \f(180×80×5-40×552,135×45×120×60)≈13.333>10.828=x0.001,
所以根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为该公司经常使用微信的员工与年龄有关.
19.(12分)下面给出了根据我国2012年~2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和经验回归方程的残差图(2012年~2018年的年份代码x分别为1~7).
(1)根据散点图分析y与x之间的相关关系;
(2)根据散点图相应数据计算得eq \i\su(i=1,7,y)i=1 074,eq \i\su(i=1,7,x)iyi=4 517,求y关于x的经验回归方程;
(3)根据经验回归方程的残差图,分析经验回归方程的拟合效果.
附:经验回归方程eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x中斜率和截距的最小二乘估计公式分别为:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
解:(1)由散点图可以看出,点大致分布在某一直线的附近,且当x由小变大时,y也由小变大,从而y与x之间是正相关关系.
(2)由题中数据可得eq \x\t(x)=eq \f(1,7)(1+2+3+4+5+6+7)=4,eq \x\t(y)=eq \f(1,7)×1 074=eq \f(1 074,7),
从而eq \(b,\s\up6(^))=eq \f(\i\su(i=1,7,x)iyi-7\x\t(x)·\x\t(y),\i\su(i=1,7,x)\\al(2,i)-7\x\t(x)2)=
eq \f(4 517-7×\f(1,7)×1 074×4,12+22+32+42+52+62+72-7×42)=eq \f(221,28),
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=eq \f(1 074,7)-eq \f(221,28)×4=eq \f(853,7),
从而所求y关于x的经验回归方程为eq \(y,\s\up6(^))=eq \f(221,28)x+eq \f(853,7).
(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.
20.(12分)流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
(1)求y关于x的经验回归方程;
(2)计算变量x,y的相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强?(若|r|∈[0.75,1],则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.3),则x,y相关性较弱.)
参考数据:eq \r(30)≈5.477.
参考公式:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\i\su(i=1,n, )xi-\(x,\s\up6(-))2)=eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up6(-))\a\vs4\al(\(y,\s\up6(-))),\i\su(i=1,n,x)\\al(2,i)-n\(x,\s\up6(-))2),
相关系数r=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,n, )xi-\(x,\s\up6(-))2\i\su(i=1,n, )yi-\(y,\s\up6(-))2)) .
解:(1)由题意得,eq \(x,\s\up6(-))=4,eq \(y,\s\up6(-))=17,
由公式求得eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\i\su(i=1,5, )xi-\(x,\s\up6(-))2)=-3.2,
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))=17+3.2×4=29.8,
故y关于x的经验回归方程为eq \(y,\s\up6(^))=-3.2x+29.8.
(2)∵r=eq \f(\i\su(i=1,5, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,5, )xi-\(x,\s\up6(-))2\i\su(i=1,5, )yi-\(y,\s\up6(-))2))=eq \f(-32,\r(10×108))=eq \f(-16,3\r(30))≈-0.97,
∴r<0,说明x,y负相关.
又|r|∈[0.75,1],说明x,y相关性很强.
∴可以认为该幼儿园去年春季患流感人数与年龄负相关很强.
21.(12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:
(1)从评分等级为(4,5]的人中随机选取2人,求恰有1人是男性的概率;
(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下面列联表,并根据小概率值α=0.05的独立性检验,分析性别与对商品满意度是否有关.
解:(1)因为从评分等级(4,5]的20人中随机选取2人,共有Ceq \\al(2,20)=190种选法,其中恰有1人为男性的共有Ceq \\al(1,12)Ceq \\al(1,8)=96种选法,所以所求概率P=eq \f(96,190)=eq \f(48,95).
(2)列联表如下:
零假设为
H0:性别与对商品满意度相互独立,即性别与对商品满意度无关.
由公式得χ2=eq \f(100×32×30-20×182,50×50×52×48)≈5.769>3.841=x0.05,
所以根据小概率值α=0.05的独立性检验,我们推断H0不成立,即可以认为性别与对商品满意度有关.
22.(12分)已知具有相关关系的两个变量x,y之间的几组数据如下表所示:
(1)请根据上表数据在图中绘制散点图;
(2)请根据上表提供的数据,求出y关于x的经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),并估计当x=20时eq \(y,\s\up6(^))的值;
(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列及数学期望.
参考公式:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\x\t(x) \x\t(y),\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
解:(1)散点图如图所示.
(2)依题意得,eq \x\t(x)=eq \f(1,5)×(2+4+6+8+10)=6,
eq \x\t(y)=eq \f(1,5)×(3+6+7+10+12)=7.6,
eq \i\su(i=1,5,x)eq \\al(2,i)=4+16+36+64+100=220,
eq \i\su(i=1,5,x)iyi=6+24+42+80+120=272,
eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5,x)iyi-5\x\t(x) \x\t(y),\i\su(i=1,5,x)\\al(2,i)-5\x\t(x)2)=eq \f(272-5×6×7.6,220-5×62)=1.1,
所以eq \(a,\s\up6(^))=7.6-1.1×6=1,
所以经验回归方程为 eq \(y,\s\up6(^))=1.1x+1,
故当x=20时,eq \(y,\s\up6(^))=23.
(3)可以判断,落在直线2x-y-4=0右下方的点的坐标满足2x-y-4>0,
所以符合条件的点的坐标为(6,7),(8,10),(10,12),
故ξ的所有可能取值为1,2,3.
P(ξ=1)=eq \f(C\\al(2,2)C\\al(1,3),C\\al(3,5))=eq \f(3,10),
P(ξ=2)=eq \f(C\\al(1,2)C\\al(2,3),C\\al(3,5))=eq \f(3,5),
P(ξ=3)=eq \f(C\\al(3,3),C\\al(3,5))=eq \f(1,10),
故ξ的分布列为
E(ξ)=1×eq \f(3,10)+2×eq \f(3,5)+3×eq \f(1,10)=eq \f(9,5).模型
1
2
3
4
R2
0.98
0.80
0.50
0.25
x
-10
-6.99
-5.01
-2.98
3.98
5
7.99
8.01
y
-9
-7
-5
-3
4.01
4.99
7
8
周数(x)
1
2
3
4
5
治愈人数(y)
2
17
36
93
142
喜爱程度
性别
合计
男(Y=0)
女(Y=1)
爱好(X=0)
10
40
50
不爱好(X=1)
20
30
50
合计
30
70
100
P(χ2≥xα)
0.10
0.05
0.01
xα
2.706
3.841
6.635
X
Y
合计
Y=0
Y=1
X=0
a
20-a
20
X=1
15-a
30+a
45
合计
15
50
65
吸烟量
年龄
合计
不超过40岁
(Y=0)
超过40岁
(Y=1)
不多于20支/天
(X=0)
50
15
65
多于20支/天
(X=1)
10
25
35
合计
60
40
100
性别
专业
非统计专业
(Y=0)
统计专业
(Y=1)
男(X=0)
13
10
女(X=1)
7
20
x
3
4
5
6
y
2.5
m
4
4.5
性别
是否愿意做志愿者
合计
愿意(Y=0)
不愿意(Y=1)
男(X=0)
610
女(X=1)
90
合计
800
P(χ2≥xα)
0.10
0.05
0.01
xα
2.706
3.841
6.635
性别
是否愿意做志愿者
合计
愿意(Y=0)
不愿意(Y=1)
男(X=0)
500
110
610
女(X=1)
300
90
390
合计
800
200
1 000
学生序号
1
2
3
4
5
6
7
8
数学偏差
x(分)
20
15
13
3
2
-5
-10
-18
物理偏差
y(分)
6.5
3.5
3.5
1.5
0.5
-0.5
-2.5
-3.5
年份
2014
2015
2016
2017
2018
销量(万台)
8
10
13
25
24
车主性别
购车种类
合计
购置传统燃油车
(Y=0)
购置新能源车
(Y=1)
男(X=0)
6
24
女(X=1)
2
合计
30
P(χ2≥xα)
0.10
0.05
0.010
0.001
xα
2.706
3.841
6.635
10.828
车主性别
购车种类
合计
购置传统燃油车
(Y=0)
购置新能源车
(Y=1)
男(X=0)
18
6
24
女(X=1)
2
4
6
合计
20
10
30
城市高中家长
是否关注
合计
关注(Y=0)
不关注(Y=1)
A城高中家长
(X=0)
20
50
B城高中家长
(X=1)
20
合计
100
P(χ2≥xα)
0.10
0.05
0.010
xα
2.706
3.841
6.635
城市高中家长
是否关注
合计
关注(Y=0)
不关注(Y=1)
A城高中家长
(X=0)
20
30
50
B城高中家长
(X=1)
30
20
50
合计
50
50
100
x
14
15
17
18
y
161
168
191
200
物理成绩
数学成绩
合计
85~100分
(Y=0)
85分以下
(Y=1)
85~100分(X=0)
37
85
122
85分以下(X=1)
35
143
178
合计
72
228
300
x
3
4
5
6
7
8
y
4
2.5
-0.5
0.5
-2
-3
性别
文理科
合计
理科(Y=0)
文科(Y=1)
男(X=0)
10
15
25
女(X=1)
30
15
45
合计
40
30
70
x
1
3
6
7
8
y
1
2
3
4
5
学生
A
B
C
D
E
数学成绩x/分
88
76
73
66
63
物理成绩y/分
78
65
71
64
61
使用微信
年龄
合计
青年人(Y=0)
中年人(Y=1)
经常使用微信
(X=0)
不经常使用微信
(X=1)
合 计
使用微信
年龄
合计
青年人(Y=0)
中年人(Y=1)
经常使用微信
(X=0)
80
40
120
不经常使用微信
(X=1)
55
5
60
合 计
135
45
180
年龄(x)
2
3
4
5
6
患病人数(y)
22
22
17
14
10
评分等级
[0,1]
(1,2]
(2,3]
(3,4]
(4,5]
女/人
2
7
9
20
12
男/人
3
9
18
12
8
性别
评分等级
合计
满意该商品
(Y=0)
不满意该商品(Y=1)
女(X=0)
男(X=1)
合计
性别
评分等级
合计
满意该商品
(Y=0)
不满意该商品(Y=1)
女(X=0)
32
18
50
男(X=1)
20
30
50
合计
52
48
100
x
2
4
6
8
10
y
3
6
7
10
12
ξ
1
2
3
P
eq \f(3,10)
eq \f(3,5)
eq \f(1,10)
相关试卷
这是一份新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析),共23页。试卷主要包含了了解样本相关系数的统计含义,样本相关系数,一元线性回归模型,列联表与独立性检验,1% B,069>6,616,8,1等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课后作业题,文件包含第八章成对数据的统计分析综合检测卷-高二数学知识详解+模拟测试人教A版选择性必修第三册解析版docx、第八章成对数据的统计分析综合检测卷-高二数学知识详解+模拟测试人教A版选择性必修第三册原卷版docx等2份试卷配套教学资源,其中试卷共33页, 欢迎下载使用。
这是一份习题课(三) 成对数据的统计分析,共6页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。