还剩38页未读,
继续阅读
成套系列资料,整套一键下载
- 2024春高中数学第七章随机变量及其分布章末检测(人教A版选择性必修第三册) 试卷 0 次下载
- 2024春高中数学第八章成对数据的统计分析8.1成对数据的统计相关性8.1.1变量的相关关系课件(人教A版选择性必修第三册) 课件 0 次下载
- 2024春高中数学第八章成对数据的统计分析8.3列联表与独立性检验8.3.2独立性检验课件(人教A版选择性必修第三册) 课件 0 次下载
- 2024春高中数学第八章成对数据的统计分析8.1成对数据的统计相关性8.1.2样本相关系数课件(人教A版选择性必修第三册) 课件 0 次下载
- 2024春高中数学第八章8.2一元线性回归模型及其应用8.2.2一元线性回归模型参数的最玄乘估计第2课时对模型刻画数据效果的分析及非线性回归模型课后提能训练新人教A版 试卷 0 次下载
2024春高中数学第八章成对数据的统计分析章末素养提升课件(人教A版选择性必修第三册)
展开
这是一份2024春高中数学第八章成对数据的统计分析章末素养提升课件(人教A版选择性必修第三册),共46页。
第八章 成对数据的统计分析章末素养提升体系构建核心归纳1.回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此回归分析的思想主要是指线性回归分析的思想.注意理解以下几点:(1)确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系.判断是否线性相关的依据是观察样本点的散点图或计算样本相关系数.(2)回归方程的预报精度简单来说,线性回归分析就是通过建立经验回归方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.2.独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算统计量χ2的值,最后由χ2的值很大在一定程度上说明两个分类变量有关系.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:根据2×2列联表计算|ad-bc|,值越大关系越强,或用等高堆积条形图直观展示.(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.思想方法(一)回归分析思想的应用【方法解读】回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.(2023年保山模拟)某印刷企业为了研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步整理,得到了如图表所示的散点图及一些统计量的值.(2)根据(1)的判断结果及表中数据求出y关于x的经验回归方程.(3)若该图书每册的售价为9元(假设能够全部售出),则预测至少应该印刷多少册,才能使销售利润不低于80 000元.【点评】建立回归模型的一般步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量;(2)画出确定好的解释变量和响应变量的散点图,判断它们是否存在线性关系;(3)由经验确定回归方程的类型;(4)按一定规则估计回归方程中的参数;(5)得出结果后分析残差图是否有异常,若残差存在异常,则应检查数据是否有误,或模型是否合适等;(6)依据回归方程作出预报.1.习近平总书记指出,要在“幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶”上不断取得新进展,保证全体人民在共建共享发展中有更多获得感.现S市政府针对全市10所由市财政投资建设的敬老院进行了满意度测评,得到数据如下表所示:(1)求投资额y关于满意度x的样本相关系数r.(2)我们约定:投资额y关于满意度x的样本相关系数r的绝对值在0.75以上(含0.75)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则采取“末位淘汰”制(即满意度最低的敬老院市财政不再继续投资,改为区财政投资).求在剔除“末位淘汰”的敬老院后投资额y关于满意度x的经验回归方程(系数精确到0.1).(二)独立性检验思想的应用【方法解读】独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果由观测数据计算得到的χ2的值很大,那么在一定程度上说明假设不合理.为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果(疱疹面积单位:mm2).表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,根据小概率值α=0.001的独立性检验,判断注射药物A后的疱疹面积与注射药物B后的疱疹面积是否有差异.表3:解:列出2×2列联表如下:2.某调查组利用网站进行民意调查,数据调查显示,民生问题是百姓最关心的热点,参与调查者中关注此问题的约占80%,现从参与调查者中随机选出200人,并将这200人按年龄分组,第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.(1)求a的值;(2)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中不关注民生问题的中老年人有10人,能否依据小概率值α=0.01的独立性检验,认为是否关注民生与年龄有关?解:(1)由0.010×10+0.015×10+a×10+0.030×10+0.010×10=1,解得a=0.035.(2)选出的200人中,第1组有200×0.010×10=20(人),第2组有200×0.015×10=30(人),第3组有200×0.035×10=70(人),第4组有200×0.030×10=60(人),第5组有200×0.010×10=20(人),∴青少年组有20+30+70=120(人),中老年组有200-120=80(人).∵参与调查者中关注此问题的约占80%,∴有不关心民生问题有200×(1-80%)=40(人).∴选出的200人中不关注民生问题的青少年有30人.2×2列联表如下:链接高考1.(2023年天津)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中样本相关系数r=0.824 5,下列说法正确的是 ( )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的样本相关系数一定是0.824 5【答案】C【解析】根据花萼长度和花瓣长度的散点图可知,花瓣长度和花萼长度正相关,A,B错误,C正确;r=0.824 5为全部数据的样本相关系数,取出一部分数据,相关性可能变强,可能变弱,即取出的数据的样本相关系数不一定是0.824 5,D错误.2.(2020年新课标Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个经验回归方程类型中最适宜作为发芽率y和温度x的经验回归方程类型的是 ( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+b ln x【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y和温度x的经验回归方程类型的是y=a+b ln x.3.(2023年甲卷改编)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).(1)设其中两只小鼠中对照组小鼠数目为X,求X的分布列和数学期望;(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0(ⅰ)求40只小鼠体重的中位数m,并完成下面2×2列联表:(ⅱ)根据2×2列联表,能否依据小概率值α=0.05的独立性检验,认为药物对小鼠生长有抑制作用.参考数据:4.(2022年乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:样本相关系数
第八章 成对数据的统计分析章末素养提升体系构建核心归纳1.回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此回归分析的思想主要是指线性回归分析的思想.注意理解以下几点:(1)确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系.判断是否线性相关的依据是观察样本点的散点图或计算样本相关系数.(2)回归方程的预报精度简单来说,线性回归分析就是通过建立经验回归方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.2.独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算统计量χ2的值,最后由χ2的值很大在一定程度上说明两个分类变量有关系.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:根据2×2列联表计算|ad-bc|,值越大关系越强,或用等高堆积条形图直观展示.(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.思想方法(一)回归分析思想的应用【方法解读】回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.(2023年保山模拟)某印刷企业为了研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步整理,得到了如图表所示的散点图及一些统计量的值.(2)根据(1)的判断结果及表中数据求出y关于x的经验回归方程.(3)若该图书每册的售价为9元(假设能够全部售出),则预测至少应该印刷多少册,才能使销售利润不低于80 000元.【点评】建立回归模型的一般步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量;(2)画出确定好的解释变量和响应变量的散点图,判断它们是否存在线性关系;(3)由经验确定回归方程的类型;(4)按一定规则估计回归方程中的参数;(5)得出结果后分析残差图是否有异常,若残差存在异常,则应检查数据是否有误,或模型是否合适等;(6)依据回归方程作出预报.1.习近平总书记指出,要在“幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶”上不断取得新进展,保证全体人民在共建共享发展中有更多获得感.现S市政府针对全市10所由市财政投资建设的敬老院进行了满意度测评,得到数据如下表所示:(1)求投资额y关于满意度x的样本相关系数r.(2)我们约定:投资额y关于满意度x的样本相关系数r的绝对值在0.75以上(含0.75)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则采取“末位淘汰”制(即满意度最低的敬老院市财政不再继续投资,改为区财政投资).求在剔除“末位淘汰”的敬老院后投资额y关于满意度x的经验回归方程(系数精确到0.1).(二)独立性检验思想的应用【方法解读】独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果由观测数据计算得到的χ2的值很大,那么在一定程度上说明假设不合理.为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果(疱疹面积单位:mm2).表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,根据小概率值α=0.001的独立性检验,判断注射药物A后的疱疹面积与注射药物B后的疱疹面积是否有差异.表3:解:列出2×2列联表如下:2.某调查组利用网站进行民意调查,数据调查显示,民生问题是百姓最关心的热点,参与调查者中关注此问题的约占80%,现从参与调查者中随机选出200人,并将这200人按年龄分组,第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.(1)求a的值;(2)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中不关注民生问题的中老年人有10人,能否依据小概率值α=0.01的独立性检验,认为是否关注民生与年龄有关?解:(1)由0.010×10+0.015×10+a×10+0.030×10+0.010×10=1,解得a=0.035.(2)选出的200人中,第1组有200×0.010×10=20(人),第2组有200×0.015×10=30(人),第3组有200×0.035×10=70(人),第4组有200×0.030×10=60(人),第5组有200×0.010×10=20(人),∴青少年组有20+30+70=120(人),中老年组有200-120=80(人).∵参与调查者中关注此问题的约占80%,∴有不关心民生问题有200×(1-80%)=40(人).∴选出的200人中不关注民生问题的青少年有30人.2×2列联表如下:链接高考1.(2023年天津)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中样本相关系数r=0.824 5,下列说法正确的是 ( )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的样本相关系数一定是0.824 5【答案】C【解析】根据花萼长度和花瓣长度的散点图可知,花瓣长度和花萼长度正相关,A,B错误,C正确;r=0.824 5为全部数据的样本相关系数,取出一部分数据,相关性可能变强,可能变弱,即取出的数据的样本相关系数不一定是0.824 5,D错误.2.(2020年新课标Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个经验回归方程类型中最适宜作为发芽率y和温度x的经验回归方程类型的是 ( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+b ln x【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y和温度x的经验回归方程类型的是y=a+b ln x.3.(2023年甲卷改编)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).(1)设其中两只小鼠中对照组小鼠数目为X,求X的分布列和数学期望;(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0(ⅰ)求40只小鼠体重的中位数m,并完成下面2×2列联表:(ⅱ)根据2×2列联表,能否依据小概率值α=0.05的独立性检验,认为药物对小鼠生长有抑制作用.参考数据:4.(2022年乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:样本相关系数
相关资料
更多