2025版红对勾高考数学一轮复习金卷第九章 统计与成对数据的统计分析
展开一、单项选择题
1.下列抽样试验中,适合用抽签法的是( B )
A.从某工厂生产的3 000件产品中抽取600件进行质量检验
B.从某工厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
解析:选项B中总体量和样本量都不大,适合采用抽签法.
2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用比例分配的分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( A )
A.100 B.150 C.200 D.250
解析:方法一:由题意可得 eq \f(70,n-70) = eq \f(3 500,1 500) ,解得n=100.
方法二:由题意,得抽样比为 eq \f(70,3 500) = eq \f(1,50) ,总体容量为3 500+1 500=5 000,故n=5 000× eq \f(1,50) =100.
3.某校为了让学生度过一个充实的假期,要求每名学生都制定一份假期学习计划.已知该校高一年级有400人,占全校人数的 eq \f(1,3) ,高三年级占 eq \f(1,6) ,为调查学生计划完成情况,用按比例分配的分层随机抽样的方法从全校的学生中抽取10%作为样本,将结果绘制成如图所示统计图,则样本中高三年级完成计划的人数为( D )
A.80 B.90
C.9 D.8
解析: eq \f(400,\f(1,3)) =1 200,1 200×10%=120,故样本容量为120,其中高三年级有120× eq \f(1,6) =20(人),由题图可知,样本中高三年级假期学习计划的完成率为40%,故样本中高三年级完成计划的人数为20×40%=8.故选D.
4.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁及以上的有95人,为了调查员工的身体健康状况,用比例分配的分层随机抽样的方法从中抽取100名员工,则应在这三个年龄段抽取人数分别为( B )
A.33,34,33 B.25,56,19
C.20,40,30 D.30,50,20
解析:设在不到35岁的员工中抽取x人,则 eq \f(100,500) = eq \f(x,125) ,所以x=25,同理可得35~49岁、50岁及以上两个年龄段分别抽取人数为56,19,故这三个年龄段抽取人数分别为25,56,19.
5.采用简单随机抽样抽到一个容量为20的样本数据,分组后,各组的频数如下表:
已知样本数据在区间[20,40)内的频率为0.35,则样本数据在区间[50,60)内的频率为( D )
B.0.50
D.0.20
解析:由题意得, eq \f(3+x,20) =0.35,解得x=4,则y=20-2-3-4-5-2=4,故所求频率为 eq \f(4,20) =0.20.故选D.
6.已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为( B )
A.100,20 B.200,20
C.200,10 D.100,10
解析:由题图甲可知学生总数是10 000人,样本量为10 000×2%=200,高中生为2 000×2%=40(人),由题图乙可知高中生近视率为50%,所以人数为40×50%=20.故选B.
7.在连续六次数学考试中,甲、乙两名同学的考试成绩情况如图,则( C )
A.甲同学最高分与最低分的差距低于30分
B.乙同学的成绩一直在上升
C.乙同学六次考试成绩的平均分高于120分
D.甲同学六次考试成绩的方差低于乙同学
解析:对于A,由题图可知,甲同学的最高分大约为130,最低分大约为100,其差值大约为30,则其差值不能确定是否低于30,故A错误;对于B,由题图可知,乙同学第3,4次的考试成绩均下降了,故B错误;对于C,由题图可知,乙同学在6次考试中有4次成绩在120分以上,且其中有1次在130分以上,另两次成绩,1次约为120分,1次约为110分,所以乙同学的这六次考试成绩的平均分高于120分,故C正确;对于D,由于甲同学成绩波动较大,则甲同学六次成绩方差大,故D错误.故选C.
二、多项选择题
8.在以下调查中,适合用抽样调查的有( ACD )
A.调查某品牌的冰箱的使用寿命
B.调查某个班级10名学生每周的体育锻炼时间
C.调查一批炮弹的杀伤半径
D.调查一个水库所有鱼中草鱼所占的比例
解析:对于A,C,D中的对象,由于调查的范围较广,经济成本会较高,不适宜全面调查,适宜抽样调查,对于B,由于一个班里10名学生样本量较小,适宜全面调查,故选ACD.
9.下表是某电器销售公司2023年度各类电器营业收入占比和净利润占比统计表:
则下列判断中正确的是( ACD )
A.该公司2023年度冰箱类电器销售亏损
B.该公司2023年度小家电类电器营业收入和净利润相同
C.该公司2023年度净利润主要由空调类电器销售提供
D.剔除冰箱类电器销售数据后,该公司2023年度空调类电器销售净利润占比将会降低
解析:根据题表中数据知,该公司2023年度冰箱类电器销售净利润占比为-0.48%,是亏损的,故A正确;小家电类电器营业收入占比和净利润占比是相同的,但收入与净利润不一定相同,故B错误;该公司2023年度空调类电器净利润占比为95.80%,是主要利润来源,故C正确;剔除冰箱类电器销售数据后,该公司2023年度空调类电器销售净利润占比将会降低,故D正确.故选ACD.
10.下列抽样方法不是简单随机抽样的是( ABC )
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某班级从50名同学中,挑选出5名最优秀的同学参加数学竞赛
D.从8台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)
解析:对于A,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故A中的抽样方法不是简单随机抽样;对于B,是一次性抽取20箱,不符合逐个抽取的特点,故不是简单随机抽样;对于C,挑选的5名同学是最优秀的,不符合简单随机抽样的等可能性,故C中的抽样方法不是简单随机抽样;对于D,易知D中的抽样方法是简单随机抽样.故选ABC.
三、填空题
11.(教材改编)某校高一年级有900名学生,其中女生400名.按男女比例用分层随机抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为25.
解析:设应抽取的男生人数为x,则 eq \f(x,900-400) = eq \f(45,900) ,解得x=25.
12.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n的值为800.
解析:根据频率分布直方图,知组距为25,所以活动时间在[10,35)内的频率为0.1,因为活动时间在[10,35)内的频数为80,所以n= eq \f(80,0.1) =800.
13.某班的数学老师要对该班一模考试的数学成绩进行分析,利用随机数表法抽取样本时,先将该班70名同学按00,01,02,…,69进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的10个样本中第8个样本的编号是38.
(注:以下是随机数表的第8行和第9行)
第8行:63 01 63 78 59 16 95 55 67 19 98 10
50 71 75 12 86 73 58 07 44 39 52 38 79
第9行:33 21 12 34 29 78 64 56 07 82 52 42
07 44 38 15 51 00 13 42 99 66 02 79 54
解析:由随机数表知选出的10个样本依次是29,64,56,07,52,42,44,38,15,51,第8个样本编号是38.
14.如图是某市5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是5月5日.
解析:由题图知5月1日至5月7日的温差分别为12 ℃,12 ℃,11 ℃,10.5 ℃,12.5 ℃,10 ℃,10 ℃,故5月5日温差最大.
一、单项选择题
1.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用比例分配的分层随机抽样的方法从3个分厂生产的电子产品中共抽取100件进行使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的平均使用寿命分别为980 h,1 020 h,1 032 h,则抽取的100件产品的平均使用寿命为( A )
A.1 013 h B.1 014 h
C.1 016 h D.1 022 h
解析:方法一:由比例分配的分层随机抽样的知识可知,从第一、二、三分厂抽取的电子产品数量分别为25件,50件,25件,则抽取的100件产品的平均使用寿命为 eq \f(1,100) ×(980×25+1 020×50+1 032×25)=1 013(h).
方法二:因为第一、二、三分厂的产量之比为1∶2∶1,所以可以根据各层抽取数量所占的比例计算抽取的100件产品的平均使用寿命为 eq \f(1,4) ×980+ eq \f(2,4) ×1 020+ eq \f(1,4) ×1 032=1 013(h).
2.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( D )
A.各月的平均最低气温都在0 ℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20 ℃的月份有5个
解析:由题意知,平均最高气温高于20 ℃的有六月、七月、八月.故选D.
3.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下扇形图:
则下列结论中不正确的是( A )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析:设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
故选A.
4.(2024·福建福州高三期末)甲、乙两所学校的男、女生比例如图所示,已知甲校学生总数为1 000,乙校学生总数为900,下列结论错误的是( A )
A.甲校男生比乙校男生多
B.乙校女生比甲校女生少
C.甲校男生比乙校女生少
D.乙校男生比甲校女生少
解析:甲校男生的人数为1 000×40%=400,甲校女生的人数为1 000×60%=600,乙校男生的人数为900×50%=450,乙校女生的人数为900×50%=450.所以甲校男生比乙校男生少,故A错误;乙校女生比甲校女生少,故B正确;甲校男生比乙校女生少,故C正确;乙校男生比甲校女生少,故D正确.故选A.
5.(2023·云南大理模拟)某调查机构对某地区互联网行业进行了调查统计,得到如下该地区的互联网行业从业者年龄分布扇形图和“90后”从事互联网行业岗位分布条形图,且据统计知该地区互联网行业从业人员中从事运营岗位的人员比例为0.28,现从该地区互联网行业从业人员中选出1人,若此人从事运营岗位,则此人是“90后”的概率为( B )
(注:“90后”指1990年及以后出生的人,“80后”指1980—1989年之间出生的人,“80前”指1979年及以前出生的人)
B.0.34
D.0.61
解析:记从该地区互联网行业从业人员中选出1人,此人从事运营岗位为事件A,记从该地区互联网行业从业人员中选出1人,此人是“90后”为事件B,由统计图可知P(A)=0.28,P(AB)=0.56×0.17,所以P(B|A)= eq \f(P(AB),P(A)) = eq \f(0.56×0.17,0.28) =0.34,所以若此人从事运营岗位,则此人是“90后”的概率为0.34.故选B.
6.(2024·贵州遵义高三统考期末)2023年4月,国内鲜菜、食用油、粮食、禽肉、鲜果、鸡蛋、猪肉价格同比(与去年同期相比)的变化情况如图所示,则下列说法正确的是( C )
A.食用油、粮食、禽肉、鲜果、鸡蛋、猪肉这6种食品中,食用油价格同比涨幅最小
B.猪肉价格同比涨幅超过禽肉价格同比涨幅的5倍
C.2022年4月鲜菜价格要比2023年4月高
D.这7种食品价格同比涨幅的平均值超过10%
解析:由题图可知,粮食价格同比涨幅比食用油价格同比涨幅小,故A错误;猪肉价格同比涨幅为34.4%,禽肉价格同比涨幅为8.5%,34.4%-5×8.5%<0,故B错误;因为鲜菜价格同比涨幅为-21.2%,说明2022年4月鲜菜价格要比2023年4月高,故C正确;这7种食品价格同比涨幅的平均值为
eq \f(34.4%+10.4%+9.6%+8.5%+3%+7.6%-21.2%,7) ≈7.47%<10%,故D错误.故选C.
二、多项选择题
7.(2023·宁夏六盘山高级中学高三校考阶段练习)为了解某企业员工对习近平新时代中国特色社会主义思想的学习情况,对该企业员工进行问卷调查,已知他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占 eq \f(3,5) ,则下列结论中,错误的是( BCD )
A.男、女员工得分在A区间的占比相同
B.在各得分区间男员工的人数都多于女员工的人数
C.得分在C区间的员工最多
D.得分在D区间的员工占总人数的20%
解析:根据题意,设员工总人数为n,因为女员工人数为20+60+70+50=200,所以 eq \f(200,n) =1- eq \f(3,5) = eq \f(2,5) ,解得n=500,所以男员工人数为500-200=300,对于A,女员工得分在A区间的占比为 eq \f(20,200) =10%,男员工得分在A区间的占比为1-40%-35%-15%=10%,故A正确;对于B,女员工在A区间有20人,B区间有60人,C区间有70人,D区间有50人,男员工在A区间有300×10%=30(人),B区间有300×40%=120(人),C区间有300×35%=105(人),D区间有300×15%=45(人),所以D区间男员工少于女员工,故B错误;对于C,B区间有60+120=180(人),C区间有70+105=175(人),所以B区间人数比C区间多,故C错误;对于D,D区间有50+45=95(人),所以得分在D区间的员工占总人数的 eq \f(95,500) =19%,故D错误.故选BCD.
三、填空题
8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小长方形的高为0.04;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为440.
解析:设[25,30)年龄组对应小长方形的高为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)的人数约为0.55×800=440.
9.为调查某学校高三年级男生、女生是否喜欢徒步运动得到如图所示的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级有男生800人,女生600人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按比例分配的分层随机抽样的方法抽取33人,则抽取的男生人数为22.
解析:由等高堆积条形图知男生中喜欢徒步人数为800×(1-0.4)=480,女生中喜欢徒步人数为600×(1-0.6)=240,喜欢徒步总人数为480+240=720,因此所抽取的男生人数为33× eq \f(480,720) =22.
考点练56 用样本估计总体 对应学生用书121页
一、单项选择题
1.某鞋店试销一款新女鞋,销售情况如下表:
如果你是鞋店经理,那么下列统计量中对你来说最重要的是( B )
A.平均数 B.众数
C.中位数 D.方差
解析:鞋店经理最关心的是哪种鞋号的鞋销量最大,即数据的众数.
2.某样本中共有5个数据,其中四个值分别为0,1,2,3,第五个值丢失,已知该样本的平均数为1,则样本方差为( A )
A.2 B. eq \f(6,5)
C. eq \r(2) D. eq \f(\r(30),5)
解析:设丢失的数据为a,则这组数据的平均数是 eq \f(1,5) ×(a+0+1+2+3)=1,解得a=-1.根据方差计算公式得s2= eq \f(1,5) ×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
3.一组数据由n个数组成,其中这n个数的平均数为a,若在该组数据中再插入一个数字a,则这组数据( D )
A.平均数变大 B.方差变大
C.平均数变小 D.方差变小
解析:设n个数为x1,x2,…,xn,方差为s2,由题意可得, eq \f(1,n) eq \i\su(i=1,n , x i) =a, eq \f(1,n) eq \i\su(i=1,n , ) (xi-a)2=s2,则 eq \i\su(i=1,n , x i) =na,
eq \i\su(i=1,n, ) (xi-a)2=ns2,若在该组数据中再插入一个数字a,则这组数据的平均数为 eq \f(1,n+1) eq \b\lc\(\rc\)(\a\vs4\al\c1(\i\su(i=1,n,x)i+a)) = eq \f(1,n+1) (na+a)=a,方差为 eq \f(1,n+1) [ eq \i\su(i=1,n, ) (xi-a)2+(a-a)2]= eq \f(1,n+1) (ns2+0)= eq \f(n,n+1) ·s2
A. eq \x\t(x1) > eq \x\t(x2) ,s1
解析:由题意可得, eq \x\t(x1) = eq \f(1,8) ×(78+79+83+84+86+87+91+92)=85, eq \x\t(x2) = eq \f(1,8) ×(77+78+84+85+85+86+92+93)=85,s eq \\al(2,1) = eq \f(1,8) ×[(78-85)2+(79-85)2+(83-85)2+(84-85)2+(86-85)2+(87-85)2+(91-85)2+(92-85)2]= eq \f(45,2) ,s1= eq \f(3\r(10),2) ,s eq \\al(2,2) = eq \f(1,8) ×[(77-85)2+(78-85)2+(84-85)2+(85-85)2+(85-85)2+(86-85)2+(92-85)2+(93-85)2]= eq \f(57,2) ,s2= eq \f(\r(114),2) ,所以 eq \x\t(x1) = eq \x\t(x2) ,s1
A.47 B.42
C.24 D.35.5
解析:由题意,样本容量n=10,则令i=n×75%=7.5,所以第75百分位数为第8个数据.故选A.
6.某学校数学教研组举办了数学知识竞赛(满分100分),其中高一、高二、高三年级参赛选手的人数分别为1 000,800,600.现用比例分配的分层随机抽样的方法从三个年级中抽取样本,经计算可得高二、高三年级参赛选手成绩的样本平均数分别为76,82,全校参赛选手成绩的样本平均数为75,则高一年级参赛选手成绩的样本平均数为( B )
A.69 B.70
C.73 D.79
解析:高一、高二、高三年级参赛选手的人数分别为1 000,800,600.现用比例分配的分层随机抽样的方法从三个年级中抽取样本,则样本中高一、高二、高三年级参赛选手的人数比为5∶4∶3,因为高二、高三年级参赛选手成绩的样本平均数分别为76,82,全校参赛选手成绩的样本平均数为75,设高一年级参赛选手成绩的样本平均数为a,则 eq \f(5k×a+4k×76+3k×82,5k+4k+3k) =75,解得a=70.所以高一年级参赛选手成绩的样本平均数为70.故选B.
二、多项选择题
7.下表为2023年某煤炭公司1—10月份的煤炭生产量:
则下列结论正确的是( ABD )
A.极差为12.5万吨 B.平均数为24万吨
C.中位数为24万吨 D.众数为17.5万吨
解析:将题表中的数据由小到大排列依次为17.5,17.5,21,23,24,25,26,27,29,30.极差为30-17.5=12.5(万吨),故A正确;平均数为 eq \f(17.5×2+21+23+24+25+26+27+29+30,10) =24(万吨),故B正确;中位数为 eq \f(25+24,2) =24.5(万吨),故C错误;众数为17.5万吨,故D正确.
8.近年来,加强青少年体育锻炼,重视体质健康已经在社会形成高度共识,某校为了了解学生的身体素质状况,举行了一场身体素质体能测试,以便对体能不达标的学生进行有效训练,促进他们体能的提升,现从全部测试成绩中随机抽取200名学生的测试成绩,进行适当分组后,画出如图所示频率分布直方图,则( AD )
A.a=0.020
B.在被抽取的学生中,成绩在区间[80,100]内的学生有70人
C.估计全校学生体能测试成绩的平均数为77
D.估计全校学生体能测试成绩的69%分位数为84
解析:对于A,根据频率和等于1得10a=1-10×(0.005+0.030+0.035+0.010)=0.20,解得a=0.020,故A正确;对于B,成绩在区间[80,100]内的学生人数约为200×10×(0.035+0.010)=90,故B错误;对于C,学生体能测试成绩的平均数约为(55×0.005+65×0.020+75×0.030+85×0.035+95×0.010)×10=77.5,故C错误;对于D,0.005×10+0.020×10+0.030×10=0.55<0.69,0.005×10+0.020×10+0.030×10+0.035×10=0.9>0.69,所以这组数据的69%分位数的估计值落在区间[80,90)内,又因为80+ eq \f(0.69-0.55,0.9-0.55) ×10=84,故学生体能测试成绩的69%分位数为84,故D正确.故选AD.
三、填空题
9.(教材改编)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为14.5,第86百分位数为17.
解析:因为75%×20=15,所以第75百分位数为 eq \f(14+15,2) =14.5.因为86%×20=17.2,所以第86百分位数为第18个数据17.
10.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:g)绘制的频率分布直方图,样本数据分为8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第四组.
解析:根据频率分布直方图可知,前三组的频率之和为(0.037 5+0.062 5+0.075)×2=0.35<0.5,前四组的频率之和为(0.037 5+0.062 5+0.075+0.1)×2=0.55>0.5,则可以判断中位数在第四组.
11.(开放性问题)军训中某人对目标靶进行8次射击,已知前7次射击分别命中7环、9环、7环、10环、8环、9环、6环.若第8次射击结果不低于这8次射击环数的平均数且不高于这8次射击环数的75%分位数,则此人第8次射击的结果可能是8(答案不唯一)环.(写出一个即可)
解析:设第8次射击的结果是x环,依题意,x≥ eq \f(7+9+7+10+8+x+9+6,8) ,解得x≥8,当8≤x≤9时,8次射击的结果由小到大排列为6,7,7,8,x,9,9,10,由8×75%=6,得8次射击环数的75%分位数为9,显然符合题意,即8≤x≤9,当9
解析:由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,因此,80%分位数一定位于[120,130)内.因为120+ eq \f(0.80-0.70,0.925-0.70) ×10≈124.44,所以此班的模拟考试成绩的80%分位数约为124.44.
四、解答题
13.(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为 eq \x\t(z) ,样本方差为s2.
(1)求 eq \x\t(z) ,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果 eq \x\t(z) ≥2 eq \r(\f(s2,10)) ,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
解:(1)zi=xi-yi的值分别为9,6,8,-8,15,11,19,18,20,12,
故 eq \x\t(z) = eq \f(1,10) ×(9+6+8-8+15+11+19+18+20+12)=11,s2= eq \f(1,10) ×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)由(1)知, eq \x\t(z) =11,2 eq \r(\f(s2,10)) =2 eq \r(6.1) = eq \r(24.4) ,故有 eq \x\t(z) >2 eq \r(\f(s2,10)) ,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
一、单项选择题
1.(2023·四川泸州高三统考期末)下列叙述中,错误的是( B )
A.数据的极差反映了数据的集中程度
B.数据的标准差比较小时,数据比较分散
C.样本数据的中位数不受少数几个极端值的影响
D.任何一个样本数据的改变都会引起平均数的改变
解析:数据的极差反映了数据的集中程度,故A正确;数据的标准差比较小时,数据比较集中,故B错误;样本数据的中位数不受少数几个极端值的影响,故C正确;任何一个样本数据的改变都会引起平均数的改变,故D正确.故选B.
2.有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲:7 8 10 9 8 8 6
乙:9 10 7 8 7 7 8
则下列判断正确的是( D )
A.甲射击的平均成绩比乙好
B.乙射击的平均成绩比甲好
C.甲射击的成绩的众数小于乙射击的成绩的众数
D.甲射击的成绩的中位数等于乙射击的成绩的中位数
解析:由题意得,甲射击的平均成绩为 eq \x\t(x) 甲= eq \f(7+8+10+9+8+8+6,7) =8,众数为8,中位数为8;乙射击的平均成绩为 eq \x\t(x) 乙= eq \f(9+10+7+8+7+7+8,7) =8,众数为7,中位数为8;故甲射击的平均成绩等于乙射击的平均成绩,甲射击的成绩的众数大于乙射击的成绩的众数,甲射击的成绩的中位数等于乙射击的成绩的中位数.故选D.
3.记样本x1,x2,…,xm的平均数为 eq \x\t(x) ,样本y1,y2,…,yn的平均数为 eq \x\t(y) ( eq \x\t(x) ≠ eq \x\t(y) ).若样本x1,x2,…,xm,y1,y2,…,yn的平均数为 eq \x\t(z) = eq \f(1,4) eq \x\t(x) + eq \f(3,4) eq \x\t(y) ,则 eq \f(m,n) 的值为( D )
A.3 B.4
C. eq \f(1,4) D. eq \f(1,3)
解析:由题意知x1+x2+…+xm=m eq \x\t(x) ,y1+y2+…+yn=n eq \x\t(y) , eq \x\t(z) =
eq \f((x1+x2+…+xm)+(y1+y2+…+yn),m+n) = eq \f(m\x\t(x)+n\x\t(y),m+n) = eq \f(m\x\t(x),m+n) + eq \f(n\x\t(y),m+n) = eq \f(1,4) eq \x\t(x) + eq \f(3,4) eq \x\t(y) ,所以 eq \f(m,m+n) = eq \f(1,4) , eq \f(n,m+n) = eq \f(3,4) ,可得3m=n,所以 eq \f(m,n) = eq \f(1,3) .故选D.
4.(2023·上海普陀曹杨二中模拟)上海入夏的标准为:立夏之后,连续五天日平均气温不低于22 ℃.立夏之后,测得连续五天的平均气温数据满足如下条件,其中能断定上海入夏的是( D )
A.总体均值为25 ℃,中位数为23 ℃
B.总体均值为25 ℃,总体方差大于0
C.总体中位数为23 ℃,众数为25 ℃
D.总体均值为25 ℃,总体方差为1
解析:对于A,如连续五天的平均气温为21 ℃,22 ℃,23 ℃,29 ℃,30 ℃,满足总体均值为25 ℃,中位数为23 ℃,故A不正确;对于B,如连续五天的平均气温为21 ℃,22 ℃,23 ℃,29 ℃,30 ℃,满足总体均值为25 ℃,总体方差大于0,故B不正确;对于C,如连续五天的平均气温为21 ℃,22 ℃,23 ℃,25 ℃,25 ℃,满足总体中位数为23 ℃,众数为25 ℃,故C不正确;对于D,当总体均值为25 ℃,总体方差为1,若存在有一天气温低于22 ℃,不妨令x1<22 ℃,根据方差公式s2= eq \f(1,5) [(x1- eq \x\t(x) )2+(x2- eq \x\t(x) )2+(x3- eq \x\t(x) )2+(x4- eq \x\t(x) )2+(x5- eq \x\t(x) )2],可得s2> eq \f(1,5) ×(22-25)2= eq \f(9,5) >1,因为方差为1,所以不可能存在有一天气温低于22 ℃,故D正确.故选D.
5.(2023·江苏连云港高三统考期末)四名同学各掷骰子5次,分别记录每次骰子出现的点数,根据四名同学的统计结果,可以判断出一定没有出现点数5的是( D )
A.平均数为3,中位数为2
B.中位数为3,众数为2
C.中位数为3,方差为1.2
D.平均数为2,方差为1.6
解析:对于A,若试验结果为1,2,2,5,5,则满足题意,故A项可以出现点数5;对于B,若试验结果为2,2,3,4,5,则满足题意,故B项可以出现点数5;对于C,若试验结果为2,2,3,3,5,则中位数为3,平均数为 eq \f(2+2+3+3+5,5) =3,方差为 eq \f(1,5) ×[(2-3)2+(2-3)2+(3-3)2+(3-3)2+(5-3)2]=1.2满足题意,故C项可以出现点数5;对于D,若试验结果中有5,则方差大于 eq \f(1,5) ×(5-2)2=1.8>1.6,故D项不可以出现点数5.故选D.
二、多项选择题
6.(2023·山东济宁高三统考期末)某学校高一年级学生有900人,其中男生500人,女生400人,为了获得该校高一全体学生的身高信息,现采用样本量比例分配的分层随机抽样方法抽取了容量为180的样本,经计算得男生样本的均值为170,方差为19,女生样本的均值为161,方差为28,则下列说法中正确的是( ACD )
A.男生样本容量为100
B.抽取的样本的均值为165.5
C.抽取的样本的均值为166
D.抽取的样本的方差为43
解析:根据题意可知抽取的男生有500× eq \f(180,900) =100(人),女生有400× eq \f(180,900) =80(人),故A正确;样本均值为 eq \f(500,900) ×170+ eq \f(400,900) ×161=166,故B错误,C正确;样本方差为 eq \f(500,900) ×[19+(170-166)2]+ eq \f(400,900) ×[28+(161-166)2]=43,故D正确.故选ACD.
三、填空题
7.某示范农场的鱼塘放养鱼苗10万条,根据这几年的经验,鱼苗的成活率为90%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.3 kg;第二网捞出30条,称得平均每条鱼2.5 kg;第三网捞出30条,称得平均每条鱼2.4 kg,则估计鱼塘中鱼的总质量为215 100 kg.
解析:平均每条鱼的质量为 eq \x\t(x) = eq \f(40×2.3+30×2.5+30×2.4,40+30+30) =2.39(kg),所以估计鱼塘中鱼的总质量为100 000×0.90×2.39=215 100(kg).
8.气象意义上从春季进入夏季的标志为:连续5天每天日平均温度不低于22 ℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃).
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,平均数为24;
③丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.
则肯定进入夏季的地区有2个.
解析:甲地肯定进入夏季,因为众数为22,所以22 ℃至少出现两次,若有一天低于22 ℃,则中位数不可能为24;丙地肯定进入,10.2×5-(32-26)2≥(26-x)2,所以15≥(26-x)2,所以x≤22不成立;乙地不一定进入,如13,23,27,28,29.
9.为了调查某厂工人生产某种产品的能力,随机抽查了20名工人某天生产该产品的数量,得到频率分布直方图如图所示,则:
(1)这20名工人中一天生产该产品数量在[55,75)的人数是13;
(2)这20名工人中一天生产该产品数量的中位数为62.5;
(3)这20名工人中一天生产该产品数量的平均数为64.
解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.(2)设中位数为x,则0.2+(x-55)×0.04=0.5,解得x=62.5.(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
10.(2024·宁夏六盘山高级中学期末)某电池厂有A,B两条生产线,现从A生产线中取出产品8件,测得它们的可充电次数的平均值为210,方差为4;从B生产线中取出产品12件,测得它们的可充电次数的平均值为200,方差为4.则20件产品组成的总样本的方差为28.
解析:总样本的平均数 eq \x\t(x) = eq \f(8,8+12) ×210+ eq \f(12,8+12) ×200=204,则其方差s2= eq \f(8,8+12) ×[4+(204-210)2]+ eq \f(12,8+12) ×[4+(200-204)2]=28.
四、解答题
11.(2024·福建福州高三期末)为了促进五一假期期间全区餐饮服务质量的提升,平潭某旅游管理部门需了解游客对餐饮服务工作的认可程度.为此该部门随机调查了500名游客,根据这500名游客对餐饮服务工作认可程度给出的评分分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示的频率分布直方图.
(1)求直方图中x的值和第80百分位数;
(2)为了解部分游客给餐饮服务工作评分较低的原因,该部门从评分低于80分的游客中用比例分配的分层随机抽样的方法选取36人作进一步调查,求应选取评分在[60,70)的游客人数;
(3)若游客的“认可系数”(认可系数= eq \f(认可程度平均分,100) )不低于0.85.餐饮服务工作按原方案继续实施,否则需进一步整改,根据你所学的统计知识,结合“认可系数”,判断餐饮服务工作是否需要进一步整改,并说明理由.
解:(1)由题图可知,10×(x+0.015+0.020+0.030+0.025)=1,解得x=0.010.
因为[50,90)内的频率为0.1+0.15+0.2+0.3=0.75<0.8,
所以第80百分位数位于区间[90,100]内,设为m,
所以0.75+(m-90)×0.025=0.8,解得m=92,
所以第80百分位数为92.
(2)低于80分的学生中三组学生的人数比为0.1∶0.15∶0.2=2∶3∶4,
则应选取评分在[60,70)的学生人数为36× eq \f(3,2+3+4) =12.
(3)由题图可知,认可程度平均分为
eq \x\t(x) =55×0.1+65×0.15+75×0.2+85×0.3+95×0.25=79.5<0.85×100=85,
所以餐饮服务工作需要进一步整改.
考点练57 成对数据的统计分析 对应学生用书123页
一、单项选择题
1.(教材改编)两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是( D )
A.①②③ B.②③①
C.②①③ D.①③②
解析:第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,是负相关;第二个散点图中,散点图中的点的分布没有什么规律,是不相关,所以应该是①③②.
2.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r与残差平方和m,如下表:
则哪位同学的试验结果体现A,B两个变量有更强的线性相关性?( D )
A.甲 B.乙
C.丙 D.丁
解析:r越大,m越小,线性相关性越强,故选D.
3.根据如下样本数据:
得到经验回归方程为 eq \(y,\s\up1(^))= eq \(b,\s\up1(^))x+ eq \(a,\s\up1(^)),则( B )
A. eq \(a,\s\up1(^)) >0, eq \(b,\s\up1(^)) >0
B. eq \(a,\s\up1(^)) >0, eq \(b,\s\up1(^)) <0
C. eq \(a,\s\up1(^)) <0, eq \(b,\s\up1(^)) >0
D. eq \(a,\s\up1(^)) <0, eq \(b,\s\up1(^)) <0
解析:根据给出的数据可发现,整体上y与x呈现负相关,所以 eq \(b,\s\up1(^))<0,由样本点(3,4.0)及(4,2.5)可知 eq \(a,\s\up1(^))>0.
4.根据分类变量x与y的成对样本数据,计算得到χ2=7.505,依据α=0.01的独立性检验(x0.01=6.635),结论为( A )
A.变量x与y不独立
B.变量x与y不独立,这个结论犯错误的概率超过0.01
C.变量x与y独立
D.变量x与y独立,这个结论犯错误的概率不超过0.01
解析:按照独立性检验的知识及比对参数值,当χ2=7.505时,我们可以得到变量x与y不独立,故排除C,D;依据α=0.01的独立性检验(x0.01=6.635),χ2=7.505>6.635=x0.01,所以变量x与y不独立,这个结论犯错误的概率不超过0.01,故A正确,B错误.故选A.
5.(2024·四川宜宾高三统考期末)数据y与x有较强的线性相关关系,通过计算得到y关于x的线性回归方程为eq \(y,\s\up5(^))=10.5x+eq \(a,\s\up5(^)),经过分析、计算得 eq \x\t(x) =5, eq \x\t(y) =54,则样本点(6,55)的残差为( A )
A.-9.5 B.9.5
C.9.6 D.64.5
解析:由题意可得54=10.5×5+eq \(a,\s\up5(^)),解得eq \(a,\s\up5(^))=1.5,所以eq \(y,\s\up5(^))=10.5x+1.5,当x=6时,eq \(y,\s\up5(^))=64.5,所以样本点(6,55)的残差为55-64.5=-9.5.故选A.
6.根据分类变量X和Y的样本观察数据的计算结果,有不少于99.5%的把握认为X和Y有关,则χ2的一个可能取值为( D )
B.5.872
D.9.698
解析:因为有不少于99.5%的把握认为X和Y有关,所以χ2≥7.879,9.698≥7.879,满足题意.故选D.
二、多项选择题
7.已知变量x,y之间的经验回归方程为y^=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是( ABD )
A.变量x,y之间成负相关关系
B.可以预测,当x=20时,eq \(y,\s\up5(^))=-3.7
C.m=4
D.该经验回归直线必过点(9,4)
解析:由-0.7<0,得变量x,y之间成负相关关系,故A正确;当x=20时,eq \(y,\s\up5(^))=-0.7×20+10.3=-3.7,故B正确;由表格数据可知 eq \x\t(x) = eq \f(1,4) ×(6+8+10+12)=9, eq \x\t(y) = eq \f(1,4) ×(6+m+3+2)= eq \f(11+m,4) ,则 eq \f(11+m,4) =-0.7×9+10.3,解得m=5,故C错误;由m=5,得 eq \x\t(y) = eq \f(6+5+3+2,4) =4,所以该经验回归直线必过点(9,4),故D正确.
三、填空题
8.某市居民2019—2023年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:
根据统计资料,居民家庭年平均收入的中位数是13,家庭年平均收入与年平均支出有正相关关系.(填“正”或“负”)
解析:由表格可知居民家庭年平均收入的中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.
9.某公司一种型号的产品近期销售情况如下表:
根据上表数据可得到经验回归方程为eq \(y,\s\up5(^))=0.75x+eq \(a,\s\up5(^)),据此估计,该公司7月份这种型号产品的销售额为19.05万元.
解析:由题意, eq \x\t(x) = eq \f(2+3+4+5+6,5) =4, eq \x\t(y) = eq \f(15.1+16.3+17.0+17.2+18.4,5) =16.8,经验回归直线eq \(y,\s\up5(^))=0.75x+eq \(a,\s\up5(^))过点( eq \x\t(x) , eq \x\t(y) ),代入可得eq \(a,\s\up5(^))=13.8,当x=7时,eq \(y,\s\up5(^))=0.75×7+13.8=19.05.
10.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得经验回归方程为y^=0.67x+54.9.
现发现表中有一个数据看不清,请你推断出该数据的值为68.
解析:由 eq \x\t(x) =30,得 eq \x\t(y) =0.67×30+54.9=75.设题表中的“模糊数字”为a,则62+a+75+81+89=75×5,∴a=68.
四、解答题
11.某城市地铁将于2023年12月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:
(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);
(2)由以上统计数据填下面2×2列联表,依据小概率值α=0.01的独立性检验,可否认为“月收入以55百元为分界点对地铁定价的态度有差异”.
附:χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) .
参考数据:
解:(1)“赞成定价者”的月平均收入为x1=
eq \f(20×1+30×2+40×3+50×5+60×3+70×4,1+2+3+5+3+4) ≈50.556.
“认为价格偏高者”的月平均收入为x2=
eq \f(20×4+30×8+40×12+50×5+60×2+70×1,4+8+12+5+2+1) =38.75,
∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1-x2≈50.556-38.75=11.806≈11.81(百元).
(2)根据条件可得2×2列联表如下:
零假设为H0:月收入以55百元为分界点对地铁定价的态度无差异.
χ2= eq \f(50×(3×11-29×7)2,32×18×10×40) ≈6.27<6.635=x0.01,依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为“月收入以55百元为分界点对地铁定价的态度没有差异”.
一、单项选择题
1.(2023·天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是( C )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
解析:根据散点的集中程度可知,花瓣长度和花萼长度有相关性,故A错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,故B错误,C正确;由于r=0.824 5是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.824 5,故D错误.故选C.
2.已知一组样本数据(x1,y1),(x2,y2),…,(xn,yn),根据这组数据的散点图分析x与y之间的线性相关关系,若求得其线性回归方程为 eq \(y,\s\up1(^))=-30.4+13.5x,则在样本点(9,53)处的残差为( C )
A.38.1 B.22.6
C.-38.1 D.91.1
解析:因为观测值减去预测值称为残差,所以当x=9时, eq \(y,\s\up1(^))=-30.4+13.5×9=91.1,所以残差为53-91.1=
-38.1.故选C.
3.已知某地的财政收入x与支出y满足经验回归方程 eq \(y,\s\up1(^))= eq \(b,\s\up1(^))x+ eq \(a,\s\up1(^))+e(单位:亿元),其中 eq \(b,\s\up1(^))=0.8, eq \(a,\s\up1(^))=2,|e|≤0.5,如果今年该地区的财政收入为10亿元,那么支出预计不会超过( D )
A.9亿元 B.10亿元
C.9.5亿元 D.10.5亿元
解析: eq \(y,\s\up1(^))=0.8×10+2+e=10+e≤10.5.
4.(2023·河北张家口高三统考期末)某校团委对“学生喜欢体育和性别是否有关”做了一次调查,其中被调查的男、女生人数相同,男生喜欢体育的人数占男生人数的 eq \f(4,5) ,女生喜欢体育的人数占女生人数的 eq \f(3,5) ,若有95%以上的把握认为是否喜欢体育和性别有关,则调查人数中男生人数可能是( D )
附:χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) ,其中n=a+b+c+d.
A.35 B.39
C.40 D.50
解析:设男生、女生人数均为x,则在2×2列联表中a= eq \f(4,5) x,b= eq \f(1,5) x,c= eq \f(3,5) x,d= eq \f(2,5) x,χ2= eq \f(2x\b\lc\(\rc\)(\a\vs4\al\c1(\f(8,25)x2-\f(3,25)x2))\s\up12(2),\f(21,25)x4) = eq \f(2x,21) ,若有95%以上的把握认为学生是否喜欢体育和性别有关,可知 eq \f(2x,21) >3.841,解得x>40.330 5,又x是5的整数倍,可得男生人数可取50.故选D.
5.(2023·天津滨海新区高三统考期末)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”等,一位同学为了验证“日落云里走,雨在半夜后”,观察了某地区的100天日落和夜晚天气,得到2×2列联表如下,并计算得到χ2≈19.05>10.828=x0.001,下列中该同学对某地区天气的判断不正确的是( D )
A.夜晚下雨的概率约为 eq \f(1,2)
B.未出现“日落云里走”,夜晚下雨的概率约为 eq \f(5,14)
C.有99.9%的把握认为“日落云里走”是否出现与夜晚天气有关
D.在犯错误的概率不超过0.1%的前提下,认为“日落云里走”是否出现与夜晚天气无关
解析:由列联表知,100天中有50天下雨,50天未下雨,所以夜晚下雨的概率为 eq \f(50,100) = eq \f(1,2) ,故A正确;又由未出现“日落云里走”,夜晚下雨的概率约为 eq \f(25,25+45) = eq \f(5,14) ,故B正确;因为χ2≈19.05>10.828=x0.001,所以有99.9%的把握认为“日落云里走”是否出现与夜晚天气有关,故C正确;在犯错误的概率不超过0.1%的前提下,认为“日落云里走”是否出现与夜晚天气有关,故D不正确.故选D.
二、多项选择题
6.(2024·黑龙江哈尔滨三中高三校考期末)某学校一同学研究温差x(℃)与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:
经过拟合,发现基本符合经验回归方程 eq \(y,\s\up1(^))=2.6x+ eq \(a,\s\up1(^)),则( ABC )
A.经验回归直线经过(8,25)
B. eq \(a,\s\up1(^))=4.2
C.x=5时,残差为-0.2
D.若去掉样本点(8,25),则样本的相关系数r增大
解析: eq \x\t(x) = eq \f(5+6+8+9+12,5) =8, eq \x\t(y) = eq \f(17+20+25+28+35,5) =25,所以经验回归直线经过(8,25),故A正确;由 eq \x\t(y) =2.6 eq \x\t(x) + eq \(a,\s\up1(^)),得 eq \(a,\s\up1(^))= eq \x\t(y) -2.6 eq \x\t(x) =25-2.6×8=4.2,故B正确;由B知, eq \(y,\s\up1(^))=2.6x+4.2,当x=5时, eq \(y,\s\up1(^))=2.6×5+4.2=17.2,则残差为17-17.2=-0.2,故C正确;由相关系数公式可知,去掉样本点(8,25)后,相关系数r的公式中的分子、分母的大小都不变,故相关系数r的大小不变,故D不正确.故选ABC.
三、填空题
7.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2- eq \f(1,2) 附近波动.经计算 eq \i\su(i=1,6,xi)=12, eq \i\su(i=1,6, yi) =14, eq \i\su(i=1,6,x) eq \\al(2,i) =23,则实数b的值为 eq \f(17,23) .
解析:令t=x2,则非线性经验回归方程变为线性经验回归方程,即y=bt- eq \f(1,2) ,此时 eq \x\t(t) = eq \f(\i\su(i=1,6,x) eq \\al(2,i) ,6) = eq \f(23,6) , eq \x\t(y) = eq \f(\i\su(i=1,6,y)i,6) = eq \f(14,6) ,代入y=bt- eq \f(1,2) ,得 eq \f(14,6) =b× eq \f(23,6) - eq \f(1,2) ,解得b= eq \f(17,23) .
8.利用独立性检验来考虑两个分类变量X,Y是否有关系时,如果我们有95%的把握认为“X和Y有关系”,则χ2≥3.841.
解析:当χ2≥3.841时,我们有95%的把握认为“X和Y有关系”.
四、解答题
9.(2023·河南洛阳高三校考期中)某大型房地产公司对该公司140名一线销售员工每月进行一次目标考核,对该月内签单总数达到10单及以上的员工授予该月“金牌销售”称号,其余员工称为“普通销售”,下表是该房地产公司140名员工2023年1月至5月获得“金牌销售”称号的统计数据:
(1)由表中看出,可用线性回归模型拟合“金牌销售”员工数y与月份x之间的关系,求y关于x的回归直线方程 eq \(y,\s\up1(^))= eq \(b,\s\up1(^))x+ eq \(a,\s\up1(^)),并预测该房地产公司6月份获得“金牌销售”称号的员工人数;
(2)为了进一步了解员工们的销售情况,选取了员工们在3月份的销售数据进行分析,统计结果如下:
请补充上表中的数据(m,n的值),并根据上表数据判断是否有95%的把握认为获得“金牌销售”称号与性别有关?
解:(1)因为 eq \x\t(x) = eq \f(1+2+3+4+5,5) =3, eq \x\t(y) = eq \f(120+105+100+95+80,5) =100,
eq \i\su(i=1,5, xi) yi=1×120+2×105+3×100+4×95+5×80=1 410, eq \i\su(i=1,5,x) eq \\al(2,i) =1+4+9+16+25=55,∴ eq \(b,\s\up1(^))= eq \f(\i\su(i=1,5,x)iyi-5\x\t(x)·\x\t(y),\i\su(i=1,5,x) eq \\al(2,i) -5\x\t(x)2) = eq \f(1 410-1 500,55-45) =-9,由 eq \(y,\s\up1(^))= eq \(b,\s\up1(^))x+ eq \(a,\s\up1(^))过(3,100),故 eq \(a,\s\up1(^))=100+27=127,∴ eq \(y,\s\up1(^))=-9x+127,
当x=6时, eq \(y,\s\up1(^))=-9×6+127=73,所以该房地产公司6月份获得“金牌销售”称号的员工大约有73人.
(2)依题意可得2×2列联表如下所示:
∴m=60,n=20,∴χ2= eq \f(140×(60×20-20×40)2,80×60×100×40) ≈1.167<3.841,∴没有95%的把握认为获得“金牌销售”称号与性别有关.分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
2
3
x
5
y
2
空调类
冰箱类
小家电类
其他类
营业收入占比
90.10%
4.98%
3.82%
1.10%
净利润占比
95.80%
-0.48%
3.82%
0.86%
新农村建设前
新农村建设后
新农村建设后变化情况
结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
B对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入+第三产业收入
(30%+6%)a=36%a
(30%+28%)×2a=116%a
超过经济收入2a的一半
D对
鞋号
34
35
36
37
38
39
40
41
数量/双
2
5
9
16
9
5
3
2
甲
78
79
83
84
86
87
91
92
乙
77
78
84
85
85
86
92
93
月份
1
2
3
4
5
6
7
8
9
10
产量/万吨
23
25
24
17.5
17.5
21
26
29
30
27
试验序号i
1
2
3
4
5
6
7
8
9
10
伸缩率xi
545
533
551
522
575
544
541
568
596
548
伸缩率yi
536
527
543
530
560
533
522
550
576
536
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
x
3
4
5
6
7
8
y
4.0
2.5
0.5
0.5
0.4
0.1
α
0.10
0.05
0.025
0.010
0.005
xα
2.706
3.841
5.024
6.635
7.879
x
6
8
10
12
y
6
m
3
2
年份
2019
2020
2021
2022
2023
年平均收入x
11.5
12.1
13
13.3
15
年平均支出y
6.8
8.8
9.8
10
12
月份x
2
3
4
5
6
销售额y/万元
15.1
16.3
17.0
17.2
18.4
零件数x/个
10
20
30
40
50
加工时间y/min
62
75
81
89
月收入/百元
[15,25)
[25,35)
[35,45)
[45,55)
[55,65)
[65,75]
赞成定价者人数
1
2
3
5
3
4
认为价格偏高者人数
4
8
12
5
2
1
月收入不低于55百元的人数
月收入低于55百元的人数
合计
认为价格偏高者
赞成定价者
合计
α
0.1
0.05
0.01
0.005
xα
2.706
3.841
6.635
7.879
月收入不低于55百元的人数
月收入低于55百元的人数
合计
认为价格偏高者
3
29
32
赞成定价者
7
11
18
合计
10
40
50
α
0.050
0.010
xα
3.841
6.635
日落云里走
夜晚天气
下雨
未下雨
出现
25天
5天
未出现
25天
45天
x
5
6
8
9
12
y
17
20
25
28
35
月份
1
2
3
4
5
“金牌销售”员工数
120
105
100
95
80
“金牌销售”
“普通销售”
合计
女员工
m
20
80
男员工
40
n
60
合计
100
40
140
“金牌销售”
“普通销售”
合计
女员工
60
20
80
男员工
40
20
60
合计
100
40
140
2025版红对勾高考数学一轮复习金卷: 这是一份2025版红对勾高考数学一轮复习金卷,共363页。
2025版高考数学一轮总复习知识梳理训练题第9章统计成对数据的统计分析第2讲成对数据的统计分析: 这是一份2025版高考数学一轮总复习知识梳理训练题第9章统计成对数据的统计分析第2讲成对数据的统计分析,共6页。试卷主要包含了相关关系,散点图,正相关、负相关,变量的线性相关,样本相关系数等内容,欢迎下载使用。
2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析提能训练: 这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析提能训练,共14页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。