还剩15页未读,
继续阅读
成套系列资料,整套一键下载
第九章复习提升-2022版数学选择性必修第一册 苏教版(2019) 同步练习 (Word含解析)
展开
这是一份第九章复习提升-2022版数学选择性必修第一册 苏教版(2019) 同步练习 (Word含解析),共18页。
第9章 统计
本章复习提升
易混易错练
易错点1 选错回归模型致误
1.(2021江苏南京江宁高二期中,)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
x
y
w
∑i=18(xi-x)2
∑i=18(wi-w)2
∑i=18(xi-x)
·(yi-y)
∑i=18(wi-w)
·(yi-y)
46.6
563
6.8
289.8
1.6
1.469
108.8
表中wi=xi,w=18∑i=18wi.
(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x、y的关系为z=0.2y-x,根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:β^=∑i=1n(ui-u)(vi-v)∑i=1n(ui-u)2,α^=v-β^u.
2.()某农科所发现,一种作物的年收获量s(单位:kg)与它“相近”作物的株数n具有相关关系(所谓两株作物“相近”是指它们的直线距离不超过1 m),并分别记录了相近作物的株数为1,2,3,5,6,7时,该作物的年收获量的相关数据如下:
n
1
2
3
5
6
7
s
60
55
53
46
45
41
(1)根据研究发现,该作物的年收获量s可能和它“相近”作物的株数n有以下两种回归方程:①s^=b^n+a^;②s^=b^n2+a^,利用统计知识,结合相关系数r比较使用哪种回归方程更合适;
(2)农科所在如图所示的正方形地块的每个格点(指纵、横直线的交叉点)处都种了一株该作物,其中每个小正方形的面积为1 m2,若在所种作物中随机选取一株,求它的年收获量的分布列与数学期望.(注:年收获量以(1)中选择的回归方程计算所得数据为依据)
参考公式:线性回归方程为y^=b^x+a^,其中b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x,
相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2.
参考数值:7≈2.65,∑i=16(wi-w)(si-s)=-664,∑i=16(wi-w)2≈43,其中wi=ni2.
易错点2 求χ2用错公式致错
3.()在中学生综合素质评价某个维度的测评中,分“优秀、合格、尚待改进”三个等级进行学生互评.某校高二年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响,采用分层随机抽样方法从高二年级抽取了45名学生的测评结果,并作出频数统计表如下:
表1:男生
等级
优秀
合格
尚待改进
频数
15
x
5
表2:女生
等级
优秀
合格
尚待改进
频数
15
3
y
(1)由表中统计数据填写下面2×2列联表:
男生
女生
合计
优秀
非优秀
合计
(2)试采用独立性检验进行分析,能否在犯错误的概率不超过0.1的前提下认为“测评结果优秀与性别有关”?
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
临界值表:
P(χ2>x0)
0.1
0.05
0.01
x0
2.706
3.841
6.635
4.(2021江苏盐城中学高三月考,)某共享单车经营企业欲向甲市投放单车,为制订适宜的经营策略,该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷、整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不同区域发放问卷并及时收回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表:
年龄
A组统计结果
B组统计结果
经常使
用单车
偶尔使
用单车
经常使
用单车
偶尔使
用单车
[15,25)
27
13
40
20
[25,35)
23
17
35
25
[35,45]
20
20
35
25
(1)先用分层随机抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60的样本,再用分层随机抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.
①求这60人中“年龄达到35岁且偶尔使用单车”的人数;
②为听取对发展共享单车的建议,调查组专门组织所抽取的“年龄达到35岁且偶尔使用单车”的人员召开座谈会.会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的概率分布和数学期望;
(2)从统计数据可直观得出“是否经常使用共享单车与年龄(记作m岁)有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,年龄m应取25还是35?请通过比较χ2的观测值的大小加以说明.
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
思想方法练
一、函数与方程思想在独立性检验中的应用
1.()2020年春季,新冠肺炎疫情在全球范围内相继暴发.由于政治制度、文化背景的不同,各个国家疫情防控的效果具有明显差异.下图是西方某国家在60天内感染新冠肺炎的累计病例人数y(万)与时间t(天)的散点图,则下列最适宜作为y关于t的回归方程类型的是 ( )
A.y=a+bx B.y=a+bx
C.y=a+bex D.y=a+bln x
2.()根据如下样本数据得到的线性回归方程为y^=b^x+a^,则 ( )
x
3
4
5
6
7
y
4.0
2.5
-0.5
0.5
-2.0
A.a^>0,5b^+a^=0.9
B.b^>0,5b^+a^=0.9
C.a^<0,0.9b^+a^=5
D.b^<0,0.9b^+a^=5
3.()某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120份问卷.
对收回的100份有效问卷进行统计,得到如下2×2列联表:
做不到科学用眼
能做到科学用眼
合计
男
45
x
45+x
女
3x
15
3x+15
合计
45+3x
15+x
100
(1)求表中x的值;
(2)若在犯错误的概率不超过P的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P的值应为多少?
附: χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
独立性检验临界值表:
P(χ2≥x0)
0.25
0.15
0.10
0.05
0.025
x0
1.323
2.072
2.706
3.841
5.024
二、数形结合思想在回归分析中的应用
4.(多选)()某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,学校面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制如下等高条形图,则 ( )
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
附表:
P(χ2≥x0)
0.05
0.01
x0
3.841
6.635
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男、女生人数均为100,则有99%的把握认为喜欢攀岩和性别有关
D.无论参与调查的男、女生人数为多少,都有99%的把握认为喜欢攀岩和性别有关
三、转化与化归思想在回归分析中的应用
5.()随着经济的发展,某地居民的收入逐年增长,统计该地一建设银行连续五年的储蓄存款(年底余额),如表1所示:
年份x
2011
2012
2013
2014
2015
储蓄存款y(千亿元)
5
6
7
8
10
表1
为了得到y关于x的回归方程,工作人员将上表的数据进行了处理,令t=x-2 010,z=y-5,得到如表2所示的数据:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
表2
(1)求z关于t的线性回归方程z^=b^t+a^;
(2)根据(1)中得到的方程,求y关于x的回归方程;
(3)用所求回归方程估计到2019年年底,该地此建设银行的储蓄存款.
附:对于线性回归方程y^=b^x+a^,其中b^=∑i=1nxiyi-nxy∑i=1nxi2-nx 2=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x
6.(2021江苏如皋中学高二月考,)为提高某作物产量,种植基地对单位面积播种数x与每棵作物的产量y之间的关系进行了研究,收集了10块试验田的数据,得到下表:
试验田编号n
1
2
3
4
5
6
7
8
9
10
播种数x
(棵/m2)
3.5
4
5.1
5.7
6.1
6.9
7.5
8
9.1
11.2
产量y
(斤/棵)
0.33
0.32
0.3
0.28
0.27
0.25
0.25
0.24
0.22
0.15
技术人员选择模型y=1a+bx2作为y关于x的回归方程类型,令ui=xi2,vi=1yi.
(1)由最小二乘法得到线性回归方程v^=β^u+α^,求y关于x的回归方程;
(2)利用(1)中得出的结果,计算当x为何值时,单位面积的总产量w=xy的估计值最大.(计算结果精确到0.01)
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=β^u+α^的斜率和截距的最小二乘估计分别为β^=∑i=1nuivi-nu·v∑i=1nui2-nu 2,α^=v-β^u.
参考数据:∑i=110ui≈500,∑i=110vi≈40,∑i=110uivi≈2 322,∑i=110ui2≈35 642,30≈5.48.
第9章 统计
本章复习提升
易混易错练
1.解析 (1)由图中散点的大致形状,可以判断y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=x,建立y关于w的线性回归方程,
由于d^=∑i=18(wi-w)(yi-y)∑i=18(wi-w)2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,
所以y关于w的线性回归方程为y^=100.6+68w,
因此y关于x的回归方程为y^=100.6+68x.
(3)①由(2)知,当x=49时,年销售量y的预报值 y^=100.6+6849=576.6,
年利润z的预报值z^=576.6×0.2-49=66.32.
②根据(2)的结果可知,年利润z的预报值
z^=0.2(100.6+68x)-x=-x+13.6x+20.12,
当x=13.62=6.8,即x=46.24时,z^取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
2.解析 (1)n=16×(1+2+3+5+6+7)=4,s=16×(60+55+53+46+45+41)=50,
∑i=16(ni-n)(si-s)=(-3)×10+(-2)×5+(-1)×3+1×(-4)+2×(-5)+3×(-9)=-84,
∑i=16(ni-n)2=(-3)2+(-2)2+(-1)2+12+22+32=28,
∑i=16(si-s)2=102+52+32+(-4)2+(-5)2+(-9)2=256.
∴r1=-8428×256≈-0.992,
令w=n2,则r2≈-66443×256≈-0.965,
∴|r1|>|r2|,故回归方程①更合适.
(2)由(1)知b^=-8428=-3,则a^=s-b^n=50+3×4=62,
故所求的线性回归方程为s^=-3n+62,
结合图形可知当n为2,3,4时,与之相对应的s的预测值分别为56,53,50,
P(s=56)=P(n=2)=416=14,
P(s=53)=P(n=3)=816=12,
P(s=50)=P(n=4)=416=14.
∴年收获量的分布列为
s
56
53
50
P
14
12
14
∴E(s)=56×14+53×12+50×14=53.
易错警示
本题易出错的地方有两点:(1)对相关系数的含义理解不准确,选错回归方程致错;(2)对线性回归方程的含义理解不准确,在解决第(2)问时没有利用第(1)问中的线性回归方程进行预报,而是利用了表格中的数据.
3.解析 (1)设采用分层随机抽样方法从高二年级抽取的45名学生中男、女生人数分别为a,b,则有500500+400=a45,400500+400=b45,
解得a=25,b=20,所以2×2列联表如下:
男生
女生
合计
优秀
15
15
30
非优秀
10
5
15
合计
25
20
45
(2)根据列联表得χ2=45×(15×5-15×10)230×15×25×20=1.125<2.706,
所以不能在犯错的概率不超过0.1的前提下认为“测评结果优秀与性别有关”.
易错警示
先根据题意准确写出2×2列联表,然后利用公式求出χ2的值,最后根据犯错误的概率不超过的数值选择临界值表中的对应数据进行比较,注意χ2的值大于或小于所选数值得出的结论是不同的.
4.解析 (1)①从300人中抽取60人,其中“年龄达到35岁”的人数为100×60300=20,再将这20人用分层随机抽样的方法按“是否经常使用单车”进行名额划分,其中“年龄达到35岁且偶尔使用单车”的人数为20×20+25100=9.
②A组这4人中得到礼品的人数X的可能取值为0,1,2,3,则
P(X=0)=C53C93=542,P(X=1)=C41C52C93=1021,
P(X=2)=C42C51C93=514,P(X=3)=C43C93=121.
故其概率分布为
X
0
1
2
3
P
542
1021
514
121
∴E(X)=0×542+1×1021+2×514+3×121=43.
(2)当m=35时,按“年龄是否达到35岁”对数据进行整理,得到如下2×2列联表:
经常使
用单车
偶尔使
用单车
合计
未达到35岁
125
75
200
达到35岁
55
45
100
合计
180
120
300
由2×2列联表,可得
χ12=300×(125×45-75×55)2200×100×180×120=2516.
当m=25时,按“年龄是否达到25岁”对数据进行整理,得到如下2×2列联表:
经常使
用单车
偶尔使
用单车
合计
未达到25岁
67
33
100
达到25岁
113
87
200
合计
180
120
300
由2×2列联表可得
χ22=300×(67×87-33×113)2100×200×180×120=4916.
∵χ12< χ22,∴欲使犯错误的概率尽可能小,年龄m应取25.
思想方法练
1.C 根据散点图可以看出,散点的分布与“指数函数”图象大致相同.
通过对题目中散点图的形状的观察与函数图象的对比,体现了数形结合的思想.
选项A对应的是“直线型”的拟合函数;选项B对应的是“幂函数型”的拟合函数;选项D对应的是“对数型”的拟合函数,故选C.
2.A 根据题意画出散点图,然后通过观察散点图得到回归系数的正负,体现了数形结合的思想.
根据表中的数据画出散点图如图所示,由图可得,回归直线y^=b^x+a^的斜率b^<0.又当x=0时,y^=a^>0,∴a^>0,b^<0.由题表中数据得x=15×(3+4+5+6+7)=5,y=15×(4.0+2.5-0.5+0.5-2.0)=0.9,∴回归直线y^=b^x+a^过点(x,y),即过点(5,0.9),∴5b^+a^=0.9,故选A.
思想方法
数形结合思想在回归分析中的应用:(1)根据散点图中散点的分布寻找合适的拟合函数;(2)将以表格等形式呈现的数据转化为散点图,然后根据散点图观察回归直线的回归系数和回归截距的正负问题等.
3.解析 (1)由题表可得45+3x+15+x=100,解得x=10.
利用2×2联表中a,b,c,d的意义列出方程求解.
(2)χ2=100×(45×15-10×30)255×45×75×25≈3.030,
因为2.706<3.030<3.841,所以能在犯错误的概率不超过0.10的前提下认为良好“用眼习惯”与性别有关,
即最精确的P的值应为0.1.
思想方法
函数与方程思想在独立性检验中的应用主要有:(1)当2×2列联表中的有关数据没有明确给定时,可根据已知条件列出关于a,b,c,d的方程或方程组求出相关的量,然后再求出χ2的值;(2)根据a,b,c,d的比例关系,设出a,b,c,d,然后根据“在犯错误的概率不超过P的前提下认为两个变量有关”列出χ2满足的方程或不等式,从而求出所设变量的值或取值范围.
4.AC 由题意,设参加调查的男、女生人数均为m,则可得如下2×2列联表:
喜欢攀岩
不喜欢攀岩
合计
男生
0.8m
0.2m
m
女生
0.3m
0.7m
m
合计
1.1m
0.9m
2m
题目中没有给出具体的男、女生人数,则可通过设出未知数m,列出χ2关于m的表达式,体现了函数的思想.
所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的女生中不喜欢攀岩的人数比喜欢攀岩的人数多,故A正确,B错误;
χ2=2m(0.56m2-0.06m2)2m·m·1.1m·0.9m=50m99,
当m=100时,χ2=50m99=50×10099≈50.505>6.635,
所以当参与调查的男、女生人数均为100时,有99%的把握认为喜欢攀岩和性别有关,故C正确;由于χ2的值与m的大小有关,因此认为喜欢攀岩和性别有关的把握大小与男、女生人数有关,故D错误.故选AC.
5.解析 (1)由题表2中数据知t=15×(1+2+3+4+5)=3,
z=15×(0+1+2+3+5)=2.2,
则∑i=15tizi=1×0+2×1+3×2+4×3+5×5=45,
∑i=15ti2=12+22+32+42+52=55,
所以b^=∑i=15tizi-ntz∑i=15ti2-nt 2=45-5×3×2.255-5×32=1.2,
a^=z-b^t=2.2-1.2×3=-1.4,
所以z关于t的线性回归方程为z^=1.2t-1.4.
(2)把t=x-2 010,z=y-5代入(1)中得到的方程z^=1.2t-1.4中,
得y^-5=1.2(x-2 010)-1.4,
整理,得y关于x的回归方程为y^=1.2x-2 408.4.
本题通过换元,令t=x-2 010,z=y-5,将求y关于x的回归方程转化为求z关于t的回归方程,体现了转化与化归的思想.
(3)由(2)知,x=2 019时,y=1.2×2 019-2 408.4=14.4,
所以估计到2019年年底,该地此建设银行的储蓄存款为14.4千亿元.
6.解析 (1)由题意得u=110∑i=110ui≈50,v=110∑i=110vi≈4,
∴β^=∑i=110uivi-10u·v∑i=110ui2-10u 2≈2322-10×50×435642-10×502≈0.03,α^=v-β^u≈4-0.03×50=2.5.
∴v关于u的线性回归方程为v^=0.03u+2.5.
本题通过对函数模型y=1a+bx2的观察,将其
变形并进行合理换元,然后将求y关于x的回归方程转化为求v关于u的线性回归方程,体现了转化与化归的思想.
则y关于x的回归方程为y^=12.5+0.03x2.
(2)根据(1)中得出的结果并结合条件,可得单位面积的总产量的估计值
w=x2.5+0.03x2=12.5x+0.03x≤122.5×0.03=303≈1.83,
当且仅当2.5x=0.03x时,等号成立,此时x=5303≈9.13.
即当x=9.13时,单位面积的总产量w的估计值最大,最大约为1.83斤.
思想方法
转化与化归思想在回归分析中的应用主要有:(1)在求线性回归方程y^=b^x+a^时,如果x,y的值很大,直接求解a^,b^较为烦琐,此时可以将数据xi,yi(i=1,2,…,n)分别减去m,k得xi-m,yi-k(i=1,2,…,n),利用处理后的新数据,按照求线性回归方程的步骤求出y-k=b^(x-m)+a^;(2)将非线性回归问题转化为线性回归问题进行分析,使之得到解决.
第9章 统计
本章复习提升
易混易错练
易错点1 选错回归模型致误
1.(2021江苏南京江宁高二期中,)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
x
y
w
∑i=18(xi-x)2
∑i=18(wi-w)2
∑i=18(xi-x)
·(yi-y)
∑i=18(wi-w)
·(yi-y)
46.6
563
6.8
289.8
1.6
1.469
108.8
表中wi=xi,w=18∑i=18wi.
(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x、y的关系为z=0.2y-x,根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:β^=∑i=1n(ui-u)(vi-v)∑i=1n(ui-u)2,α^=v-β^u.
2.()某农科所发现,一种作物的年收获量s(单位:kg)与它“相近”作物的株数n具有相关关系(所谓两株作物“相近”是指它们的直线距离不超过1 m),并分别记录了相近作物的株数为1,2,3,5,6,7时,该作物的年收获量的相关数据如下:
n
1
2
3
5
6
7
s
60
55
53
46
45
41
(1)根据研究发现,该作物的年收获量s可能和它“相近”作物的株数n有以下两种回归方程:①s^=b^n+a^;②s^=b^n2+a^,利用统计知识,结合相关系数r比较使用哪种回归方程更合适;
(2)农科所在如图所示的正方形地块的每个格点(指纵、横直线的交叉点)处都种了一株该作物,其中每个小正方形的面积为1 m2,若在所种作物中随机选取一株,求它的年收获量的分布列与数学期望.(注:年收获量以(1)中选择的回归方程计算所得数据为依据)
参考公式:线性回归方程为y^=b^x+a^,其中b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x,
相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2.
参考数值:7≈2.65,∑i=16(wi-w)(si-s)=-664,∑i=16(wi-w)2≈43,其中wi=ni2.
易错点2 求χ2用错公式致错
3.()在中学生综合素质评价某个维度的测评中,分“优秀、合格、尚待改进”三个等级进行学生互评.某校高二年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响,采用分层随机抽样方法从高二年级抽取了45名学生的测评结果,并作出频数统计表如下:
表1:男生
等级
优秀
合格
尚待改进
频数
15
x
5
表2:女生
等级
优秀
合格
尚待改进
频数
15
3
y
(1)由表中统计数据填写下面2×2列联表:
男生
女生
合计
优秀
非优秀
合计
(2)试采用独立性检验进行分析,能否在犯错误的概率不超过0.1的前提下认为“测评结果优秀与性别有关”?
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
临界值表:
P(χ2>x0)
0.1
0.05
0.01
x0
2.706
3.841
6.635
4.(2021江苏盐城中学高三月考,)某共享单车经营企业欲向甲市投放单车,为制订适宜的经营策略,该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷、整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不同区域发放问卷并及时收回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表:
年龄
A组统计结果
B组统计结果
经常使
用单车
偶尔使
用单车
经常使
用单车
偶尔使
用单车
[15,25)
27
13
40
20
[25,35)
23
17
35
25
[35,45]
20
20
35
25
(1)先用分层随机抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60的样本,再用分层随机抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.
①求这60人中“年龄达到35岁且偶尔使用单车”的人数;
②为听取对发展共享单车的建议,调查组专门组织所抽取的“年龄达到35岁且偶尔使用单车”的人员召开座谈会.会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的概率分布和数学期望;
(2)从统计数据可直观得出“是否经常使用共享单车与年龄(记作m岁)有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,年龄m应取25还是35?请通过比较χ2的观测值的大小加以说明.
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
思想方法练
一、函数与方程思想在独立性检验中的应用
1.()2020年春季,新冠肺炎疫情在全球范围内相继暴发.由于政治制度、文化背景的不同,各个国家疫情防控的效果具有明显差异.下图是西方某国家在60天内感染新冠肺炎的累计病例人数y(万)与时间t(天)的散点图,则下列最适宜作为y关于t的回归方程类型的是 ( )
A.y=a+bx B.y=a+bx
C.y=a+bex D.y=a+bln x
2.()根据如下样本数据得到的线性回归方程为y^=b^x+a^,则 ( )
x
3
4
5
6
7
y
4.0
2.5
-0.5
0.5
-2.0
A.a^>0,5b^+a^=0.9
B.b^>0,5b^+a^=0.9
C.a^<0,0.9b^+a^=5
D.b^<0,0.9b^+a^=5
3.()某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120份问卷.
对收回的100份有效问卷进行统计,得到如下2×2列联表:
做不到科学用眼
能做到科学用眼
合计
男
45
x
45+x
女
3x
15
3x+15
合计
45+3x
15+x
100
(1)求表中x的值;
(2)若在犯错误的概率不超过P的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P的值应为多少?
附: χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
独立性检验临界值表:
P(χ2≥x0)
0.25
0.15
0.10
0.05
0.025
x0
1.323
2.072
2.706
3.841
5.024
二、数形结合思想在回归分析中的应用
4.(多选)()某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,学校面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制如下等高条形图,则 ( )
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
附表:
P(χ2≥x0)
0.05
0.01
x0
3.841
6.635
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男、女生人数均为100,则有99%的把握认为喜欢攀岩和性别有关
D.无论参与调查的男、女生人数为多少,都有99%的把握认为喜欢攀岩和性别有关
三、转化与化归思想在回归分析中的应用
5.()随着经济的发展,某地居民的收入逐年增长,统计该地一建设银行连续五年的储蓄存款(年底余额),如表1所示:
年份x
2011
2012
2013
2014
2015
储蓄存款y(千亿元)
5
6
7
8
10
表1
为了得到y关于x的回归方程,工作人员将上表的数据进行了处理,令t=x-2 010,z=y-5,得到如表2所示的数据:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
表2
(1)求z关于t的线性回归方程z^=b^t+a^;
(2)根据(1)中得到的方程,求y关于x的回归方程;
(3)用所求回归方程估计到2019年年底,该地此建设银行的储蓄存款.
附:对于线性回归方程y^=b^x+a^,其中b^=∑i=1nxiyi-nxy∑i=1nxi2-nx 2=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x
6.(2021江苏如皋中学高二月考,)为提高某作物产量,种植基地对单位面积播种数x与每棵作物的产量y之间的关系进行了研究,收集了10块试验田的数据,得到下表:
试验田编号n
1
2
3
4
5
6
7
8
9
10
播种数x
(棵/m2)
3.5
4
5.1
5.7
6.1
6.9
7.5
8
9.1
11.2
产量y
(斤/棵)
0.33
0.32
0.3
0.28
0.27
0.25
0.25
0.24
0.22
0.15
技术人员选择模型y=1a+bx2作为y关于x的回归方程类型,令ui=xi2,vi=1yi.
(1)由最小二乘法得到线性回归方程v^=β^u+α^,求y关于x的回归方程;
(2)利用(1)中得出的结果,计算当x为何值时,单位面积的总产量w=xy的估计值最大.(计算结果精确到0.01)
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=β^u+α^的斜率和截距的最小二乘估计分别为β^=∑i=1nuivi-nu·v∑i=1nui2-nu 2,α^=v-β^u.
参考数据:∑i=110ui≈500,∑i=110vi≈40,∑i=110uivi≈2 322,∑i=110ui2≈35 642,30≈5.48.
第9章 统计
本章复习提升
易混易错练
1.解析 (1)由图中散点的大致形状,可以判断y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=x,建立y关于w的线性回归方程,
由于d^=∑i=18(wi-w)(yi-y)∑i=18(wi-w)2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,
所以y关于w的线性回归方程为y^=100.6+68w,
因此y关于x的回归方程为y^=100.6+68x.
(3)①由(2)知,当x=49时,年销售量y的预报值 y^=100.6+6849=576.6,
年利润z的预报值z^=576.6×0.2-49=66.32.
②根据(2)的结果可知,年利润z的预报值
z^=0.2(100.6+68x)-x=-x+13.6x+20.12,
当x=13.62=6.8,即x=46.24时,z^取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
2.解析 (1)n=16×(1+2+3+5+6+7)=4,s=16×(60+55+53+46+45+41)=50,
∑i=16(ni-n)(si-s)=(-3)×10+(-2)×5+(-1)×3+1×(-4)+2×(-5)+3×(-9)=-84,
∑i=16(ni-n)2=(-3)2+(-2)2+(-1)2+12+22+32=28,
∑i=16(si-s)2=102+52+32+(-4)2+(-5)2+(-9)2=256.
∴r1=-8428×256≈-0.992,
令w=n2,则r2≈-66443×256≈-0.965,
∴|r1|>|r2|,故回归方程①更合适.
(2)由(1)知b^=-8428=-3,则a^=s-b^n=50+3×4=62,
故所求的线性回归方程为s^=-3n+62,
结合图形可知当n为2,3,4时,与之相对应的s的预测值分别为56,53,50,
P(s=56)=P(n=2)=416=14,
P(s=53)=P(n=3)=816=12,
P(s=50)=P(n=4)=416=14.
∴年收获量的分布列为
s
56
53
50
P
14
12
14
∴E(s)=56×14+53×12+50×14=53.
易错警示
本题易出错的地方有两点:(1)对相关系数的含义理解不准确,选错回归方程致错;(2)对线性回归方程的含义理解不准确,在解决第(2)问时没有利用第(1)问中的线性回归方程进行预报,而是利用了表格中的数据.
3.解析 (1)设采用分层随机抽样方法从高二年级抽取的45名学生中男、女生人数分别为a,b,则有500500+400=a45,400500+400=b45,
解得a=25,b=20,所以2×2列联表如下:
男生
女生
合计
优秀
15
15
30
非优秀
10
5
15
合计
25
20
45
(2)根据列联表得χ2=45×(15×5-15×10)230×15×25×20=1.125<2.706,
所以不能在犯错的概率不超过0.1的前提下认为“测评结果优秀与性别有关”.
易错警示
先根据题意准确写出2×2列联表,然后利用公式求出χ2的值,最后根据犯错误的概率不超过的数值选择临界值表中的对应数据进行比较,注意χ2的值大于或小于所选数值得出的结论是不同的.
4.解析 (1)①从300人中抽取60人,其中“年龄达到35岁”的人数为100×60300=20,再将这20人用分层随机抽样的方法按“是否经常使用单车”进行名额划分,其中“年龄达到35岁且偶尔使用单车”的人数为20×20+25100=9.
②A组这4人中得到礼品的人数X的可能取值为0,1,2,3,则
P(X=0)=C53C93=542,P(X=1)=C41C52C93=1021,
P(X=2)=C42C51C93=514,P(X=3)=C43C93=121.
故其概率分布为
X
0
1
2
3
P
542
1021
514
121
∴E(X)=0×542+1×1021+2×514+3×121=43.
(2)当m=35时,按“年龄是否达到35岁”对数据进行整理,得到如下2×2列联表:
经常使
用单车
偶尔使
用单车
合计
未达到35岁
125
75
200
达到35岁
55
45
100
合计
180
120
300
由2×2列联表,可得
χ12=300×(125×45-75×55)2200×100×180×120=2516.
当m=25时,按“年龄是否达到25岁”对数据进行整理,得到如下2×2列联表:
经常使
用单车
偶尔使
用单车
合计
未达到25岁
67
33
100
达到25岁
113
87
200
合计
180
120
300
由2×2列联表可得
χ22=300×(67×87-33×113)2100×200×180×120=4916.
∵χ12< χ22,∴欲使犯错误的概率尽可能小,年龄m应取25.
思想方法练
1.C 根据散点图可以看出,散点的分布与“指数函数”图象大致相同.
通过对题目中散点图的形状的观察与函数图象的对比,体现了数形结合的思想.
选项A对应的是“直线型”的拟合函数;选项B对应的是“幂函数型”的拟合函数;选项D对应的是“对数型”的拟合函数,故选C.
2.A 根据题意画出散点图,然后通过观察散点图得到回归系数的正负,体现了数形结合的思想.
根据表中的数据画出散点图如图所示,由图可得,回归直线y^=b^x+a^的斜率b^<0.又当x=0时,y^=a^>0,∴a^>0,b^<0.由题表中数据得x=15×(3+4+5+6+7)=5,y=15×(4.0+2.5-0.5+0.5-2.0)=0.9,∴回归直线y^=b^x+a^过点(x,y),即过点(5,0.9),∴5b^+a^=0.9,故选A.
思想方法
数形结合思想在回归分析中的应用:(1)根据散点图中散点的分布寻找合适的拟合函数;(2)将以表格等形式呈现的数据转化为散点图,然后根据散点图观察回归直线的回归系数和回归截距的正负问题等.
3.解析 (1)由题表可得45+3x+15+x=100,解得x=10.
利用2×2联表中a,b,c,d的意义列出方程求解.
(2)χ2=100×(45×15-10×30)255×45×75×25≈3.030,
因为2.706<3.030<3.841,所以能在犯错误的概率不超过0.10的前提下认为良好“用眼习惯”与性别有关,
即最精确的P的值应为0.1.
思想方法
函数与方程思想在独立性检验中的应用主要有:(1)当2×2列联表中的有关数据没有明确给定时,可根据已知条件列出关于a,b,c,d的方程或方程组求出相关的量,然后再求出χ2的值;(2)根据a,b,c,d的比例关系,设出a,b,c,d,然后根据“在犯错误的概率不超过P的前提下认为两个变量有关”列出χ2满足的方程或不等式,从而求出所设变量的值或取值范围.
4.AC 由题意,设参加调查的男、女生人数均为m,则可得如下2×2列联表:
喜欢攀岩
不喜欢攀岩
合计
男生
0.8m
0.2m
m
女生
0.3m
0.7m
m
合计
1.1m
0.9m
2m
题目中没有给出具体的男、女生人数,则可通过设出未知数m,列出χ2关于m的表达式,体现了函数的思想.
所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的女生中不喜欢攀岩的人数比喜欢攀岩的人数多,故A正确,B错误;
χ2=2m(0.56m2-0.06m2)2m·m·1.1m·0.9m=50m99,
当m=100时,χ2=50m99=50×10099≈50.505>6.635,
所以当参与调查的男、女生人数均为100时,有99%的把握认为喜欢攀岩和性别有关,故C正确;由于χ2的值与m的大小有关,因此认为喜欢攀岩和性别有关的把握大小与男、女生人数有关,故D错误.故选AC.
5.解析 (1)由题表2中数据知t=15×(1+2+3+4+5)=3,
z=15×(0+1+2+3+5)=2.2,
则∑i=15tizi=1×0+2×1+3×2+4×3+5×5=45,
∑i=15ti2=12+22+32+42+52=55,
所以b^=∑i=15tizi-ntz∑i=15ti2-nt 2=45-5×3×2.255-5×32=1.2,
a^=z-b^t=2.2-1.2×3=-1.4,
所以z关于t的线性回归方程为z^=1.2t-1.4.
(2)把t=x-2 010,z=y-5代入(1)中得到的方程z^=1.2t-1.4中,
得y^-5=1.2(x-2 010)-1.4,
整理,得y关于x的回归方程为y^=1.2x-2 408.4.
本题通过换元,令t=x-2 010,z=y-5,将求y关于x的回归方程转化为求z关于t的回归方程,体现了转化与化归的思想.
(3)由(2)知,x=2 019时,y=1.2×2 019-2 408.4=14.4,
所以估计到2019年年底,该地此建设银行的储蓄存款为14.4千亿元.
6.解析 (1)由题意得u=110∑i=110ui≈50,v=110∑i=110vi≈4,
∴β^=∑i=110uivi-10u·v∑i=110ui2-10u 2≈2322-10×50×435642-10×502≈0.03,α^=v-β^u≈4-0.03×50=2.5.
∴v关于u的线性回归方程为v^=0.03u+2.5.
本题通过对函数模型y=1a+bx2的观察,将其
变形并进行合理换元,然后将求y关于x的回归方程转化为求v关于u的线性回归方程,体现了转化与化归的思想.
则y关于x的回归方程为y^=12.5+0.03x2.
(2)根据(1)中得出的结果并结合条件,可得单位面积的总产量的估计值
w=x2.5+0.03x2=12.5x+0.03x≤122.5×0.03=303≈1.83,
当且仅当2.5x=0.03x时,等号成立,此时x=5303≈9.13.
即当x=9.13时,单位面积的总产量w的估计值最大,最大约为1.83斤.
思想方法
转化与化归思想在回归分析中的应用主要有:(1)在求线性回归方程y^=b^x+a^时,如果x,y的值很大,直接求解a^,b^较为烦琐,此时可以将数据xi,yi(i=1,2,…,n)分别减去m,k得xi-m,yi-k(i=1,2,…,n),利用处理后的新数据,按照求线性回归方程的步骤求出y-k=b^(x-m)+a^;(2)将非线性回归问题转化为线性回归问题进行分析,使之得到解决.
相关资料
更多