所属成套资源:2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第一册+第二册+第三册)
- 8.2一元线性回归模型及其应用-2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第三册) 试卷 1 次下载
- 8.3列联表与独立性检验-2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第三册) 试卷 1 次下载
- 第八章 成对数据的统计分析(基础检测卷)-2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第三册) 试卷 1 次下载
- 选择性必修第三册全册检测卷(一)-2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第三册) 试卷 3 次下载
- 选择性必修第三册全册检测卷(二)-2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第三册) 试卷 2 次下载
第八章 成对数据的统计分析(综合检测卷)-2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第三册)
展开
这是一份第八章 成对数据的统计分析(综合检测卷)-2023-2024学年高二数学考点讲解练(人教A版2019选择性必修第三册),文件包含第八章成对数据的统计分析综合检测卷-2023-2024学年高二数学考点讲解练人教A版2019选择性必修第三册解析版docx、第八章成对数据的统计分析综合检测卷-2023-2024学年高二数学考点讲解练人教A版2019选择性必修第三册原卷版docx等2份试卷配套教学资源,其中试卷共37页, 欢迎下载使用。
第八章成对数据的统计分析综合检测卷
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.已知一组数据,且的线性回归方程为,若,则( )
A.50 B.250 C.490 D.500
【答案】D
【分析】根据线性回归方程经过样本中心,即可求解.
【详解】因为,所以,所以,所以.
故选:D.
2.若由一个列联表中的数据计算得,则有( )把握认为两个变量有关系.
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.95% B.97.5% C.99% D.99.9%
【答案】C
【分析】利用独立性检验的观测值对应临界表可得答案.
【详解】解:由于,
因为,
则,
那么有的把握认为两个变量有关系.
故选:C.
3.小亮的爸爸记录了小亮从4岁到10岁的身高,建立了小亮身高与年龄的回归模型,他用的这个模型预测小亮11岁时的身高,则下面的叙述正确的是( )
A.小亮11岁时的身高在149.75cm左右 B.小亮11岁时的身高在149.75cm以下
C.小亮11岁时的身高一定是149.75cm D.小亮11岁时的身高在149.75cm以上
【答案】A
【分析】根据回归直线的实际意义判断即可
【详解】代入可得,又利用回归直线方程我们可以对身高进行预测、估计,只能说身高在某一预测值附近的可能性比较大,故小亮11岁时的身高在149.75cm左右
故选:A
4.某单位为了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日用电量与当天平均气温,如下表:
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
由表中数据得到线性回归方程为,当气温为-4℃时,预测用电量为( )
A.69度 B.68度 C.66度 D.52度
【答案】B
【分析】根据满足线性回归方程可求得,得出回归方程,从而得出答案.
【详解】由表中数据可知,,
根据满足线性回归方程,得,∴,
则回归方程为,
当时,,
故选:B.
5.已知变量X和变量Y的线性相关系数为,变量U和变量V的线性相关系数为,且,则( )
A.X和Y之间呈正线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
B.X和Y之间呈负线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
C.U和V之间呈负线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
D.U和V之间呈正线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
【答案】C
【分析】根据相关系数的概念判断即可.
【详解】解:,,
和之间呈正线性相关关系,和之间呈负线性相关关系,
,
和的线性相关程度弱于和的线性相关程度,
故选:C.
6.下列说法正确的是( )
A.将一组数据中的每一个数据都加上同一个常数后,平均数和方差都不变
B.设具有线性相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强
C.在一个2×2列联表中,由计算得K²的值,则K²的值越小,判断两个变量有关的把握越大
D.若 ,则
【答案】D
【分析】对A根据方差与平均数定义即可判断,对B利用线性相关定义则可判断,对C根据的含义即可判断,对D对于正态分布的特点,即可求出区间概率.
【详解】对于A,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,但平均数变化,故A错误,
对于B,具有线性相关关系的两个变量,的相关系数为,则越接近于,和之间的线性相关程度越强,故B错误,
对于C,在一个列联表中,由计算得的值,则的值越大,判断两个变量有关的把握越大,故C错误,
对于D,,
故D正确.
故选:D.
7.某企业推出了一款新食品,为了解每单位该食品中所含某种营养成分x(单位:克)与顾客的满意率y的关系,通过调查研究发现可选择函数模型来拟合y与x的关系,根据以下数据:
营养成分含量x/克
1
2
3
4
5
4.34
4.36
4.44
4.45
4.51
可求得y关于x的回归方程为( )
A. B.
C. D.
【答案】A
【分析】根据题意可将函数模型化简后两边同时取对数可得,从而可计算出的平均数,根据线性回归方程经过样本中心的性质进行逐项检验即可.
【详解】解析:由得,两边同时取对数,得;
由表中数据可知,的平均数=.
对于A,化简变形可得,两边同时取对数可得,将代入可得,,与题中数据吻合;故选项A正确;
对于B,化简变形可得,两边同时取对数可得,,将代入可得,所以选项B错误;
对于C,,两边同时取对数可得,而表中所给数据为的相关量,所以C错误;
对于D,,两边同时取对数可得,而表中所给数据为的相关量,所以D错误.
故选:A.
8.某微生物科研团队为了研究某种细菌的繁殖情况,工作人员配制了一种适合该细菌繁殖的营养基质用以培养该细菌,通过相关设备以及分析计算后得到:该细菌在前3个小时的细菌数与时间(单位:小时,且)满足回归方程(其中为常数),若,且前3个小时与的部分数据如下表:
1
2
3
3个小时后,向该营养基质中加入某种细菌抑制剂,分析计算后得到细菌数与时间(单位:小时,且)满足关系式:,在时刻,该细菌数达到最大,随后细菌个数逐渐减少,则的值为( )
A.4 B. C.5 D.
【答案】A
【分析】根据给定条件,求出样本中心点求出b值,再分段讨论y的最大值情况作答.
【详解】依题意,,,由,,得,且经过点,
于是得,当时,单调递增,则当时,,
当时,,令,,
求导得:,当时,,当时,,
即函数在上单调递增,在上单调递减,当时,,
而,因此当时,细菌数取最大值,
所以的值为4.
故选:A
二、选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0分。
9.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )
A.B.C.D.
【答案】AC
【分析】根据线性回归模型的特点进行求解即可.
【详解】四个选项中只有选项AC中的点分布在一条直线附近,适合线性回归模型,
故选:AC
10.某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”的号召,建立了农业科技图书馆,供农民免费借阅,收集的自2017年至2021年共5年的年借阅数据如下表:
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
年借阅量(万册)
2
17
36
93
142
根据上表,可得关于的二次回归方程为,则下列说法正确的是( )
A.
B.2,17,36,93,142的第三四分位数为93
C.此回归模型2020年的残差(实际值与预报值之差)为5
D.估计2022年借阅数为220
【答案】BC
【分析】根据样本中心点求得,结合分位数、残差以及利用回归直线方程进行估计等知识确定正确答案.
【详解】,,
所以,A选项错误.
,所以2,17,36,93,142的第三四分位数为93,B选项正确.
由上述分析可知,
所以年的预测值为,则残差为,C选项正确.
估计年借阅数为万册,D选项错误.
故选:BC
11.针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的女生人数是男生人数的2倍,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若根据小概率0.01的独立性检验认为喜欢抖音和性别有关,则调查人数中男生可能有( )人.
附:,,
0.15
0.10
0.05
0.025
0.01
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.40 B.45 C.50 D.60
【答案】CD
【分析】设男生人数为,列出列联表,求出的观测值且不小于,建立的不等量关系,即可求解.
【详解】设男生人数为,女生人数为,列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
则
,又因为人数为整数,所以男生至少为49人.
故选:CD
12.下列说法正确的是( )
A.的第75百分位数为95.5
B.在残差的散点图中,残差分布的水平带状区域的宽度越窄,模型的拟合效果越好
C.已知随机变量,且,则
D.若将一组样本数据中的每个数据都加上同一个正数,则样本的方差变大
【答案】BC
【分析】根据百分位数的概念可求得数据的第75百分位数,判断A;根据残差的意义可判断B;根据正态分布曲线的对称性可判断C;根据方差的性质可判断D.
【详解】对于A,由于,故取第7个数96,A错误;
对于B,在残差的散点图中,残差分布的水平带状区域的宽度越窄,模型的拟合效果越好,B正确;
对于C, 随机变量,且,则,
故,则,C正确;
对于D,若将一组样本数据中的每个数据都加上同一个正数,则样本的平均数会增加,
但是样本数据的离散程度没变,故方差不变,D错误;
故选:BC
三.填空题:本题共4小题,每小题5分,共20分
13.如表中给出五组数据,从中选出四组使其线性相关最大,且保留第一组,那么应去掉第___________组.
1
2
3
4
5
-5
-4
-3
-2
4
-3
-2
4
-1
6
【答案】3
【分析】画出散点图,根据线性相关及点偏离程度判断应去掉的点.
【详解】根据表格数据,散点图如下图示:
显然偏离程度最高,故去掉第三组.
故答案为:3
14.功能性饮料是指通过调整饮料中天然营养素的成分和含量比例,以适应某些特殊人群营养需要的饮品数据显示,从年开始,中国功能性饮料市场年均复合增长率均不低于某同学若根据年年份代码分别为中国功能性饮料年市场规模(单位:百亿元)求得回归方程为,则年预测规模与年平均规模的差为______百亿元.
【答案】
【分析】根据年市场规模与年份代码的回归直线方程,确定的年平均规模,并求解年预测规模,即可求差值.
【详解】解:因为,又点在回归直线上,
故,年预测规模为,
所以年预测规模与年平均规模的差为(百亿元).
故答案为:5.4.
15.为了考察某种疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表.根据该表,在犯错的概率不超过5%的前提之下,________(填“可以”或“不可以”)确定“小动物是否感染与服用疫苗有关”.
感染
未感染
合计
服用
10
40
50
未服用
20
30
50
合计
30
70
100
附:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】可以
【分析】根据表中数据,算出的值,再与参考值比较即可.
【详解】由表可知:,
故在犯错的概率不超过5%的前提之下,可以确定“小动物是否感染与服用疫苗有关”.
故答案为:可以
16.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据:,,,)
【答案】0.99
【分析】分别求出,,,再利用参考公式和数据计算即可.
【详解】由题意,知,
,
.
所以.
所以y与x的相关系数近似为0.99.
故答案为:0.99.
四、解答题:本题共6小题,共70分,每题12分,解答应写出文字说明、证明过程或演算步骤。
17.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用.称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
2
4
5
6
8
失效费y(单位:万元)
3
4
5
6
7
根据上表数据,计算y与x的相关系数,并说明y与x是否高度相关.
(若,则认为y与x高度相关)
附:.
【答案】,y与x高度相关
【分析】根据公式计算可得,再根据判断即可.
【详解】由题表知,,,
,
,
,
所以,
因为,所以认为y与x高度相关.
18.为丰富学生的校园生活,提升学生的实践能力和综合素质能力,培养学生的兴趣爱好,某校计划借课后托管服务平台开设书法兴趣班,为了解学生对这个兴趣班的喜爱情况,该校随机抽取了该校名学生,调查他们对这个兴趣班的喜爱情况,得到下面的2×2列联表:
喜爱
不喜爱
合计
男
女
合计
以调查得到的男、女学生喜欢书法兴趣班的频率代替概率.
(1)完成题中的2×2列联表,并判断能否有的把握认为是否喜欢书法兴趣班与性别有关;
(2)从该校喜欢书法兴趣班的学生中,用分层抽样的方法抽取名学生,再从这名学生中随机抽取名学生,求这名学生中至少有名女学生的概率.
参考公式:,其中.
参考数据:
【答案】(1)见解析;
(2).
【分析】(1)根据题意完成列联表,并根据计算公式计算的值,比较判断可得结论;
(2)找到总的样本点个数,和事件对应的样本点个数,代入古典概型概率计算公式计算可得答案.
【详解】(1)完成列联表如下:
喜爱
不喜爱
合计
男
女
合计
,
所以有的把握认为是否喜欢书法兴趣班与性别有关;
(2)该校喜欢书法兴趣班的学生中,男女生的比例为,
用分层抽样的方法抽取名学生,所以男女生各有各学生,
从这名学生中随机抽取名学生,记为事件,
则总的样本点个数是,全是男生的样本点个数是,
所以这名学生中至少有名女学生的概率为.
19.已知某同学的物理成绩y(单位:分,满分100分)与数学成绩x(单位:分,满分150分)之间具有线性相关关系,在连续的五次月考中,该生的物理成绩与数学成绩统计如下表:
数学成绩x
120
110
125
130
115
物理成绩y
92
83
90
96
89
(1)根据该同学的数学与物理成绩,若都以100分值计算,判断哪一科更稳定;
(2)利用上表中的五组数据求回归直线方程.若在第六次月考中该生数学成绩为,利用该回归直线方程预测第六次月考的物理成绩.
参考公式:
【答案】(1)物理成绩更加稳定;
(2)分.
【分析】(1)根据方差的运算公式和性质进行求解判断即可;
(2)根据题中所给的公式,利用代入法进行求解即可.
【详解】(1)根据表中数据可得:
按100分值计算,数学学科的方差为:
,
物理学科的方差为,
,
所以均以100分值计算,该同学物理成绩更加稳定;
(2)
.
,
故所求回归直线的方程为
当,(分)
故第六次月考物理成绩预测值为分.
20.为适应高中新课程改革,某学校在通用技术课程中开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.
(1)赛前,小明进行了一段时间的强化训练,加工完成一个模具的平均速度(秒)与训练天数(天)有关,经统计得到如下表数据:
(天)
1
2
3
4
5
6
7
(秒)
990
990
450
320
300
240
210
经研究发现,可用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过天训练后,加工完成一个模具的平均速度约为多少秒?
(2)小明和小红拟先举行一次模拟赛,每局比赛各加工一个模具,先加工完成模具的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请计算小明最终赢得比赛的概率.参考数据:(其中)
1845
0.37
0.55
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)180
(2)
【分析】(1)令,则可利用最小二乘法估计,从而得到,代入即可预测小明经过20天训练后,加工完成一个模具的平均速度;
(2)设比赛再继续进行X局小明最终赢得比赛,最后一局一定是小明获胜,且最多再进行4局就结束比赛分出胜负,则小明赢得比赛得概率.
【详解】(1)由题意,,
令,设y关于t的线性回归方程为,
则,
则,
∴,
∴y关于x的回归方程为,
当时,,
∴预测小明经过20天训练后,加工完成一个模具的平均速度y约为180秒;
(2)设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,
由题意知,最多再进行4局就有胜负,X的可能取值为2、3、4.
当时,小明4∶1胜,∴;
当时,小明4∶2胜,∴;
当时,小明4∶3胜,∴.
∴小明最终赢得比赛的概率为.
21.2022年11月20日,卡塔尔足球世界杯正式开幕,世界杯上的中国元素随处可见.从体育场建设到电力保障,从赛场内的裁判到赛场外的吉祥物……中国制造为卡塔尔世界杯提供了强有力的支持.国内也再次掀起足球热潮.某地足球协会组建球队参加业余比赛.该足球队教练组对球员的使用是依据数据分析,为了考查球员甲对球队的贡献,作出如下数据统计(甲参加过的比赛均分出了胜负):
球队负
球队胜
总计
甲参加
3
29
32
甲未参加
7
11
18
总计
10
40
50
(1)据此能否有97.5%的把握认为球队胜利与甲球员参赛有关;
(2)根据以往的数据统计,乙球员能够胜任边锋、中锋、后腰以及后卫四个位置,且出场率分别为:0.2,0.4,0.3,0.1,当出任边锋、中锋、后腰以乃后卫时,球队输球的概率依次为:0.4、0.3、0.4、0.2.则:
①当乙球员参加比赛时,求球队某场比赛输球的概率;
②当乙球员参加比赛时,在球队输了某场比赛的条件下,求乙球员担任边锋的概率;
③如果你是教练员,应用概率统计有关知识,该如何使用乙球员?
附表及公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
.
【答案】(1)有97.5%的把握认为球队胜利与甲球员参赛有关
(2)① ;②;③应该多让乙球员担当后卫,来扩大赢球场次.
【分析】(1) 由联表数据应用公式计算与对应临界值表格数据比较后即可得出结论.
(2)①根据条件概率公式分别求出四种情况下输球的概率,相加即可
②利用乙球员担当边锋时输球的概率除以球队输球的概率即可得出答案.
③分别计算乙球员担当边锋, 乙球员担当中锋, 乙球员担当后腰, 乙球员担当后卫时输球的概率,以输球概率最小时,乙球员担任的角色,作为教练员使用乙队员的依据.
【详解】(1)由列联表中的数据可得:,
所以有97.5%的把握认为球队胜利与甲球员参赛有关;
(2)①设表示“乙球员担当边锋”;表示“乙球员担当中锋”;表示“乙球员担当后腰”;表示“乙球员担当后卫”;表示“球队输掉某场比赛”,
则
;
②;
③因为,
,
所以,,
所以应该多让乙球员担当后卫,来扩大赢球场次.
22.多年来,清华大学电子工程系黄翔东教授团队致力于光谱成像芯片的研究,2022年6月研制出国际首款实时超光谱成像芯片,相比已有光谱检测技术,实现了从单点光谱仪到超光谱成像芯片的跨越,为制定下一年的研发投入计划,该研发团队为需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量x,和年销售额,的数据(,2,,12),该团队建立了两个函数模型:①②,其中均为常数,e为自然对数的底数,经对历史数据的初步处理,得到散点图如图,令,计算得如下数据:
20
66
770
200
14
460
3125000
21500
(1)设和的相关系数为和的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型;
(2)(i)根据(1)的选择及表中数据,建立关于的回归方程(系数精确到0.01);
(ii)若下一年销售额需达到80亿元,预测下一年的研发资金投入量是多少亿元?
附:①相关系数,回归直线中斜率和截距的最小二乘估计公式分别为:,;
②参考数据:.
【答案】(1)模型的拟合程度更好
(2)(i)(ii)预测下一年的研发资金投入量是亿元
【分析】(1)由题意计算相关系数,比较它们的大小即可判断;(2)(i)先建立关于的的线性回归方程,再转化为y关于的回归方程;(2)利用回归方程计算时x的值即可.
【详解】(1)由题意进行数据分析:
则,因此从相关系数的角度,模型的拟合程度更好
(2)(i)先建立关于的线性回归方程.
由,得,即.
由于
所以关于的线性回归方程为,
所以,则.
(ii)下一年销售额需达到80亿元,即,代入得,,
又
所以,解得,
所以预测下一年的研发资金投入量是亿元

