2020版高考数学一轮复习课后限时集训55《变量间的相关关系统计案例》文数(含解析)北师大版 试卷
展开课后限时集训(五十五)
(建议用时:60分钟)
A组 基础达标
一、选择题
1.在下列各图中,两个变量具有相关关系的图是( )
(1) (2) (3) (4)
A.(1)(2) B.(1)(3)
C.(2)(4) D.(2)(3)
D [(1)为函数关系;(2)显然成正相关;(3)显然成负相关;(4)没有明显相关性.]
2.(2019·成都模拟)已知x,y的取值如下表所示:
x | 0 | 1 | 3 | 4 |
y | 2.2 | 4.3 | 4.8 | 6.7 |
由表格分析y与x的线性关系,且y关于x的线性回归方程为y=0.95x+a,则a=( )
A.2.2 B.2.6
C.3.36 D.1.95
B [由表格数据计算得=2,=4.5,又
由公式a=-b,得a=2.6,故选B.]
3.(2019·开封模拟)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn),(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则这组样本数据的样本相关系数为( )
A.-3 B.0
C.-1 D.1
C [在一组样本数据的散点图中,所有样本点(xi,yi)(i=1,2,…,n)都在一条直线y=-3x+1上,那么这组样本数据完全负相关,且相关系数为-1,故选C.]
4.(2019·南阳联考)对具有线性相关关系的变量x,y,测得一组数据如下:
x | 2 | 4 | 5 | 6 | 8 |
y | 20 | 40 | 60 | 70 | 80 |
根据上表,利用最小二乘法得它们的回归直线方程为y=10.5x+a,据此模型预测当x=10时,y的估计值为( )
A.105.5 B.106
C.106.5 D.107
C [因为==5,
==54.
故将=5,=54代入y=10.5x+a可得a=54-52.5=1.5,则y=10.5x+1.5,当x=10时,y=10.5×10+1.5=106.5.]
5.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:
| 男 | 女 | 合计 |
爱好 | 40 | 20 | 60 |
不爱好 | 20 | 30 | 50 |
合计 | 60 | 50 | 110 |
由χ2=算得,
χ2=≈7.8.
附表:
P(χ2≥x0) | 0.050 | 0.010 | 0.001 |
x0 | 3.841 | 6.635 | 10.828 |
参照附表,得到的正确结论是 ( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
A [根据独立性检验的定义,由χ2的观测值为7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”.]
二、填空题
6.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.
零件数x(个) | 10 | 20 | 30 | 40 | 50 |
加工时间y(min) | 62 | 75 | 81 | 89 |
现发现表中有一个数据看不清,请你推断出该数据的值为________.
68 [由=30,得=0.67×30+54.9=75.
设表中的“模糊数字”为a,
则62+a+75+81+89=75×5,∴a=68.]
7.某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:
专业 性别 | 非统计专业 | 统计专业 |
男 | 13 | 10 |
女 | 7 | 20 |
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=≈4.844,因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
5% [∵χ2≈4.844>3.841,∴有95%的把握认为主修统计专业与性别有关系,即作出“主修统计专业与性别有关系”的判断出错的可能性不超过5%.]
8.(2019·长沙模拟)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃) | 18 | 13 | 10 | -1 |
用电量(度) | 24 | 34 | 38 | 64 |
由表中数据得回归直线方程y=bx+a中的b=-2,预测当气温为-4 ℃时,用电量约为________度.
68 [根据题意知==10,==40,所以a=40-(-2)×10=60,y=-2x+60,所以当x=-4时,y=(-2)×(-4)+60=68,所以用电量约为68度.]
三、解答题
9.(2019·重庆调研)某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:
| 满意 | 不满意 |
男用户 | 30 | 10 |
女用户 | 20 | 20 |
(1)根据上表,现用分层抽样的方法抽取对产品满意的用户5人,在这5人中任选2人,求被选中的恰好是男、女用户各1人的概率;
(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由.
P(χ2≥x0) | 0.100 | 0.050 | 0.025 | 0.010 |
x0 | 2.706 | 3.841 | 5.024 | 6.635 |
注:χ2=,n=a+b+c+d.
[解] (1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为=.
所以在满意产品的用户中应抽取女用户20×=2(人),男用户30×=3(人).
抽取的5人中,三名男用户记为a,b,c,两名女用户记为r,s则从这5人中任选2人,共有10种情况:ab,ac,ar,as,bc,br,bs,cr,cs,rs.
其中恰好是男、女用户各1人的有6种情况:ar,as,br,bs,cr,cs.
故所求的概率为P==0.6.
(2)由题意,得
χ2=
=≈5.333>5.024.
又P(χ2≥5.024)=0.025.
故有97.5%的把握认为“产品用户是否满意与性别有关”.
10.某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.
表1:无酒状态
停车距离d(米) | (10,20] | (20,30] | (30,40] | (40,50] | (50,60] |
频数 | 26 | m | n | 8 | 2 |
表2:酒后状态
平均每毫升血液酒精含量x(毫克) | 10 | 30 | 50 | 70 | 90 |
平均停车距离y(米) | 30 | 50 | 60 | 70 | 90 |
已知表1数据的中位数估计值为26,回答以下问题.
(1)求m,n的值,并估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算y关于x的回归方程y=bx+a;
(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”y大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?
(附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为b==,a=-b)
[解] (1)依题意,得m=50-26,
解得m=40,
又m+n+36=100,解得n=24.
故停车距离的平均数为
15×+25×+35×+45×+55×=27.
(2)依题意,可知=50,=60,
xiyi=10×30+30×50+50×60+70×70+90×90=17 800,
x=102+302+502+702+902=16 500,
所以b==0.7,
a=60-0.7×50=25,
所以回归直线方程为y=0.7x+25.
(3)由(1)知当y>81时认定驾驶员是“醉驾”.令y>81,得0.7x+25>81,解得x>80,当每毫升血液酒精含量大于80毫克时认定为“醉驾”.
B组 能力提升
1.(2019·张掖模拟)如表是我国某城市在2018年1月份至10月份各月最低温与最高温(℃)的数据一览表.
月份 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
最高温 | 5 | 9 | 9 | 11 | 17 | 24 | 27 | 30 | 31 | 21 |
最低温 | -12 | -3 | 1 | -2 | 7 | 17 | 19 | 23 | 25 | 10 |
已知该城市的各月最低温与最高温具有相关关系,根据该一览表,则下列结论错误的是( )
A.最低温与最高温为正相关
B.每月最高温与最低温的平均值在前8个月逐月增加
C.月温差(最高温减最低温)的最大值出现在1月
D.1月至4月的月温差(最高温减最低温)相对于7月至10月,波动性更大
B [根据题意,依次分析选项:
对于A,知该城市的各月最低温与最高温具有相关关系,
由数据分析可得最低温与最高温为正相关,则A正确;
对于B,由表中数据,每月最高温与最低温的平均值依次为: -3.5,3,5,4.5,12,20.5,23,26.5,28,15.5,在前8个月不是逐月增加,则B错误;
对于C,由表中数据,月温差依次为:17,12,8,13,10,7,8,7,6,11;月温差的最大值出现在1月,C正确;
对于D,有C的结论,分析可得1月至4月的月温差相对于7月至10月,波动性更大,D正确,故选B.]
2.(2019·贵阳模拟)随着资本市场的强势进入,互联网共享单车“忽如一夜春风来”,遍布了一二线城市的大街小巷.为了解共享单车在A市的使用情况,某调查机构借助网络进行了问卷调查,并从参与调查的网友中抽取了200人进行抽样分析,得到下表(单位:人):
| 经常使用 | 偶尔或不用 | 合计 |
30岁及以下 | 70 | 30 | 100 |
30岁以上 | 60 | 40 | 100 |
合计 | 130 | 70 | 200 |
根据以上数据,________(填“能”“不能”)在犯错误的概率不超过0.15的前提下认为A市使用共享单车情况与年龄有关.
附:
P(χ2≥x0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 |
x0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 |
χ2=,其中n=a+b+c+d.
能 [由列联表可知,χ2=≈2.198.因为2.198>2.072,
所以能在犯错误的概率不超过0.15的前提下认为A市使用共享单车情况与年龄有关.]