所属成套资源:2022-2023学年高二 数学 同步练习 人教A版(2019)选择性必修第三册
专题38 成对数据的统计分析(单元测试卷)
展开
这是一份人教A版 (2019)选择性必修 第三册全册综合单元测试当堂达标检测题,文件包含专题38成对数据的统计分析单元测试卷解析版doc、专题38成对数据的统计分析单元测试卷原卷版doc等2份试卷配套教学资源,其中试卷共31页, 欢迎下载使用。
专题38 《成对数据的统计分析》单元测试卷
一、单选题
1.(2020·甘肃省会宁县第二中学期中(文))某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A. B.
C. D.
【答案】A
【解析】
因为商品销售量与销售价格负相关,所以排除B,D选项,
将代入可得,不符合实际.故A正确.
点睛:线性回归方程当时负相关;当时正相关.
2.(2020·福建湖里·厦门双十中学高二期中)在一组样本数据,,,,,,,,,不全相等)的散点图中,若所有样本点,,2,,都在直线上,则这组样本数据的样本相关系数为( )
A. B.0 C. D.1
【答案】A
【解析】
因为回归直线方程是,
所以这两个变量是负相关,故这组样本数据的样本相关系数为负值,
又所有样本点,,2,,都在直线上,
所以,
所以相关系数.
故选:A.
3.(2020·福建湖里·厦门双十中学高二期中)已知四个命题:
①在回归分析中,可以用来刻画回归效果,的值越大,模型的拟合效果越好;
②在独立性检验中,随机变量的值越大,说明两个分类变量有关系的可能性越大;
③在回归方程中,当解释变量每增加1个单位时,预报变量平均增加1个单位;
④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;
其中真命题是:
A.①④ B.②④ C.①② D.②③
【答案】C
【解析】
对于①,在回归分析中,可以用来刻画回归效果,的值越大,模型的拟合效果越好,正确;对于②;在独立性检验中,随机变量的值越大,说明两个分类变量有关系的可能性越大,正确;对于③,在回归方程中,当解释变量每增加1个单位时,预报变量平均增加个单位,错误;对于④,两个随机变量相关性越强,则相关系数的绝对值越接近于1,错误;故选C.
4.(2020·河南南阳·期末(理))利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得K2≈7.245,参照下表:得到的正确结论是( )
0.01
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”、
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
【答案】B
【解析】
由,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B
5.(2020·四川邻水实验学校开学考试(理))在一次独立性检验中得到如下列联表:
A1
A2
总计
B1
200
800
1000
B2
180
a
180+a
总计
380
800+a
1180+a
若这两个分类变量A和B没有关系,则a的可能值是( )
A.200 B.720
C.100 D.180
【答案】B
【解析】
当a=720时,k==0,易知此时两个分类变量没有关系.
故答案为B
6.(2020·赣州市赣县第三中学月考(文))某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算发现的观测值,根据这一数据查阅表,市政府断言“市民收入增减与旅游愿望有关系”这一断言犯错误的概率不超过( )
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.0.005 B.0.025 C.0.05 D.0.1
【答案】B
【解析】
∵,6.023>5.024,
∴市政府断言市民收入增减与旅游愿望有关系,这一断言犯错误的概率不超过0.025,
故选:B.
7.(2020·福建期末)红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观侧数据.用4种模型分别进行拟合.由此得到相应的回归方程并进行残差分析,进一步得到如图4幅残差图,根据残差图,拟合效果最好的模型是( )
A.模型一 B.模型二 C.模型三 D.模型四
【答案】D
【解析】
当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,
这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,
对比4个残差图,可知模型四的图对应的带状区域的宽度最窄.
故选:D.
8.(2020·辽宁期末)相关变量的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程,相关系数为;方案二:剔除点,根据剩下数据得到线性回归直线方程:,相关系数为.则( )
A.
B.
C.
D.
【答案】D
【解析】
由散点图得负相关,所以,因为剔除点后,剩下点数据更具有线性相关性,更接近,所以.选D.
二、多选题
9.(2020·山东省招远第一中学高二月考)某课外兴趣小组通过随机调查,利用残联表和统计量研究数学成绩优秀是否与性别有关.计算得,经查阅临界值表知,则下列判断正确的是( )
A.每个数学成绩优秀的人当中就会有名是女生
B.若某人数学成绩优秀,那么他为男生的概率是
C.有的把握认为“数学成绩优秀与性别有关”
D.在犯错误的概率不超过的前提下认为“数学成绩优秀与性别有关”
【答案】CD
【解析】
因为,所以有的把握认为“数学成绩优秀与性别有关”即在犯错误的概率不超过的前提下认为“数学成绩优秀与性别有关”.
故选:CD
10.(2020·南京市秦淮中学开学考试)为了对变量与的线性相关性进行检验,由样本点、、、求得两个变量的样本相关系数为,那么下面说法中错误的有( )
A.若所有样本点都在直线上,则
B.若所有样本点都在直线上,则
C.若越大,则变量与的线性相关性越强
D.若越小,则变量与的线性相关性越强
【答案】ABD
【解析】
若所有样本点都在直线上,且直线斜率为负数,则,A、B选项均错误;
若越大,则变量与的线性相关性越强,C选项正确,D选项错误.
故选:ABD.
11.(2020·广东梅州·高二期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关“作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人
附表:
附:
A.25 B.35 C.45 D.60
【答案】CD
【解析】
设男生可能有x人,依题意得女生有x人,可得列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
合计
若有95%的把握认为是否喜欢抖音和性别有关,则,
即,解得,
由题意知,且x是5的整数倍,所以45和60都满足题意.
故选:CD.
12.(2020·广东南海·期末)某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示:
广告支出费用x
2.2
2.6
4.0
5.3
5.9
销售量y
3.8
5.4
7.0
11.6
12.2
根据表中的数据可得回归直线方程,,以下说法正确的是( )
A.第三个样本点对应的残差
B.在该回归模型对应的残差图中,残差点比较均匀地分布在倾斜的带状区域中
C.销售量的多少有是由广告支出费用引起的
D.用该回归方程可以比较准确地预测广告费用为20万元时的销售量
【答案】AC
【解析】
由题意得,将之代入回归方程中得,得,故回归直线方程为,所以,A正确;
由于,所以该回归模型拟合的效果比较好,故对应的残差图中残差点应该比较均匀地分布在水平的带状区域中,B错误;
在线性回归模型中表示解释变量对于预报变量的贡献率,R2≈0.96,则销售量的多少有96%是由广告支出费用引起的,C正确;
由于样本的取值范围会影响回归方程的使用范围,而广告费用20万元远大于表格中广告费用值,故用该回归方程不能准确地预测广告费用为20万元时的销售量,故D错误.
故选:AC.
三、填空题
13.(2020·吉林高二期末(文))某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的列联表中,___________.
会外语
不会外语
总计
男
20
女
6
总计
18
50
【答案】44
【解析】
由题意有:
所以,,,.
故答案为:44.
14.(2020·湖南期末)某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图,______(填“有”或“没有”)以上的把握认为持乐观态度和国内外差异有关.
(参考公式与数据:,其中)
【答案】有
【解析】
依题意,可得出如下列联表:
国内代表
国外代表
合计
不乐观
乐观
合计
,
所以有以上的把握认为持乐观态度和国内外差异有关.
故答案为:有.
15.(2019·湖北期中(理))由样本数据得到,女大学生的身高预报体重的回归方程是(其中x,的单位分别是,),则此方程在样本处残差的绝对值是______.
【答案】2.2
【解析】
由样本数据得到,女大学生的身高预报体重的回归方程是,
当时,;
此方程在样本处残差的绝对值:.
故答案为:2.2.
16.(2017·北京石景山·高三一模(文))在环境保护部公布的2016年74城市PM2.5月均浓度排名情况中,某14座城市在74城的排名情况如下图所示,甲、乙、丙为某三座城市.
从排名情况看,
① 在甲、乙两城中,2月份名次比1月份名次靠前的城市是_________;
②在第1季度的三个月中,丙城市的名次最靠前的月份是_________.
【答案】乙 二月份
【解析】
结合题设中提供的散点图可知:城市乙更靠近回归直线,答案应填乙;结合第二个散点图可以看出丙城市的名次更靠近二月份,答案应填二月份.
四、解答题
17.(2020·沙坪坝·重庆一中高三其他(文))截止2020年5月15日,新冠肺炎全球确诊数已经超过440万,新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医疗研究机构收集了1000名患者的病毒潜伏期的信息,将数据统计如下表所示:
潜伏期
0-2天
2-4天
4-6天
6-8天
8-10天
10-12天
12-14天
人数
40
160
300
360
60
60
20
(1)求1000名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表);
(2)潜伏期不高于平均数的患者,称为“短潜伏者”;潜伏期高于平均数的患者,称为“长潜伏者”.为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述1000名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有99.9%的把握认为潜伏期长短与患者年龄有关.
短潜伏者
长潜伏者
合计
60岁及以上
100
60岁以下
140
合计
300
附表及公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)6;(2)填表见解析;有99.9%的把握认为潜伏期长短与患者年龄有关
【解析】
(1).
(2)抽取的短潜伏者的总人数为,长潜伏者的总人数为.
列联表如下:
短潜伏者
长潜伏者
合计
60岁及以上
100
60
160
60岁以下
50
90
140
合计
150
150
300
.
故有99.9%的把握认为潜伏期长短与患者年龄有关.
18.(2020·甘肃省会宁县第二中学期中(文))年中央电视台在周日晚上推出的一档新的综艺节目,为了解节目效果,一次节目结束后,现随机抽取了名观众(含名女性)的评分(百分制)进行分析,分别得到如图所示的两个频率分布直方图.
(1)计算女性观众评分的中位数与男性观众评分的平均分;
(2)若把评分低于分定为“不满意”,评分不低于分定为“满意”.
(i)试比较男观众与女观众不满意的概率大小,并说明理由;
(ii)完成下列列联表,并回答是否有的把握认为性别和对该综艺节目是否满意有关.
女性观众
男性观众
合计
“满意”
“不满意”
合计
参考数据:
【答案】(1)女性观众评分的中位数为,男性观众评分的平均数为(2)(i)男性观众不满意的概率大,详见解析(ii)填表见解析;有的把握认为性别和对该综艺节目是否满意有关
【解析】
(1)根据题意,设女性观众评分的中位数为,
,
.
男性观众评分的平均数为.
(2)(i)男性观众不满意的概率大,
记表示事件:“女性观众不满意”;表示事件:“男性观众不满意”,由直方图得的估计值为,
的估计值为,
所以男性观众不满意的概率大.
(ii)列联表如下图:
女性观众
男性观众
合计
“满意”
“不满意”
合计
所以
故有的把握认为性别和对该综艺节目是否满意有关.
19.(2019·扶风县法门高中月考(文))下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据
3
4
5
6
2.5
3.5
4
5
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
【答案】(1)(2)9.85
【解析】
(1)由系数公式可知,
4.5,3.75,
所以y关于x的线性回归方程为.
(2)当x=100时,
,90-80.15=9.85,
所以技术改造后预测生产100吨甲产品的生产能耗80.15吨标准煤,比技术改造前降低9.85吨标准煤.
20.(2020·江苏广陵·扬州中学开学考试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每批产品的非原料总成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制如图所示的散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断,与(,均为大于零的常数)哪一个适宜作为非原料总成本关于生产该产品的数量的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表1中的数据,建立关于的回归方程;
(3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多能生产多少千件产品.
参考数据:
62.14
1.54
2535
50.12
3.47
其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)适宜;(2);(3)12千件产品.
【解析】
(1)根据散点图判断,适宜作为非原料总成本y关于生产该产品的数量x的回归方程类型.
(2)由,两边同时取常用对数得.
设,∴,
∵,
∴.
把代入,得,
∴,∴,
∴,
即y关于x的回归方程为.
(3)设生产了x千件该产品.则生产总成本为.
又在其定义域内单调递增,且,
故最多能生产12千件产品.
21.(2020·四川武侯·成都七中高三开学考试(理))某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间近似满足关系式(b,c为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间内时为优等品.现随机抽取6件合格产品,测得数据如下:
尺寸
38
48
58
68
78
88
质量
16.8
18.8
20.7
22.4
24
25.5
质量与尺寸的比
0.442
0.392
0.357
0.329
0.308
0.290
(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率;
(2)根据测得数据作了初步处理,得相关统计量的值如下表:
75.3
24.6
18.3
101.4
根据所给统计量,求y关于x的回归方程.
附:对于样本,其回归直线的斜率和截距的最小二乘法估计公式分别为:,,.
【答案】(1);(2).
【解析】
(1)由已知,优等品的质量与尺寸的比,
则随机抽取的6件合格产品中,有3件为优等品,记为,
有3件为非优等品,记为,
现从抽取的6件合格产品中再任选2件,基本事件为:
,
选中的两件均为优等品的事件为,
所以所求概率为.
(2)对两边取自然对数得
令,则,且
由所给统计量及最小二乘估计公式有:
,
由得,
所以关于的回归方程为.
22.(2020·梅河口市第五中学其他(理))2019年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.如图是该地某小区2018年11月至2019年1月间,当月在售二手房均价(单位:万元平方米)的散点图.(图中月份代码1~13分别对应2018年11月~2019年11月)
根据散点图选择和两个模型进行拟合,经过数据处理得到两个回归方程分别为和,并得到以下一些统计量的值:
0.000591
0.000164
0.006050
(1)请利用相关指数判断哪个模型的拟合效果更好;
(2)某位购房者拟于2020年4月购买这个小区平方米的二手房(欲购房为其家庭首套房).
若购房时该小区所有住房的房产证均已满2但未满5年,请你利用(1)中拟合效果更好的模型解决以下问题:
(i)估算该购房者应支付的购房金额;(购房金额房款税费,房屋均价精确到0.001万元平方米)
(ii)若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精确到1平方米)
附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格房款)进行征收的.
房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为;首套面积90平方米以上且140平方米以内(含140平方米);首套面积140平方米以上或非首套为.
参考数据:,,,,,,,.
参考公式:相关指数.
【答案】(1)模型二拟合效果好;(2)(i)2020年4月份二手房均价的预测值为1.044(万元平方米);(ii)最大面积为94平方米;
【解析】
解:(1)模型一中,的残差平方和为0.000591,
相关指数为;
模型二中,的残差平方和为0.000164,
相关指数为;
相关指数较大的模型二拟合效果好些;
(2)通过散点图确定2020年4月对应的,
代入(1)中拟合效果更好的模型二,代入计算
(万元平方米);
则2020年4月份二手房均价的预测值为1.044(万元平方米);
设该购房者应支付的购房金额万元,因为税费中买方只需缴纳契税,
①当时,契税为计税价格的,
故;
②当时,契税为计税价格的,
故;
③当时,契税为计税价格的,
故;
;
当时购房金额为万元,
当时购房金额为万元,
当时购房金额为万元;
设该购房者可购买该小区二手房的最大面积为平方米,
由知,当时,应支付的购房金额为,
又;
又因为房屋均价约为1.044万元平方米,所以,所以,
由,解得,且,
所以该购房者可购买该小区二手房的最大面积为94平方米.
相关试卷
这是一份微专题18 统计与成对数据的统计分析,共12页。
这是一份微专题18 统计与成对数据的统计分析,共10页。试卷主要包含了基本技能练,创新拓展练等内容,欢迎下载使用。
这是一份新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析),共23页。试卷主要包含了了解样本相关系数的统计含义,样本相关系数,一元线性回归模型,列联表与独立性检验,1% B,069>6,616,8,1等内容,欢迎下载使用。

