










所属成套资源:人教A版(2019)高中数学选择性必修三课件+教案+单元复习提升类(易错点+知识点清单(含训练题)+单元测试 AB 卷
- 【教案+课件】第8章成对数据的统计分析 8.1.1 变量的相关关系 人教A版(2019)高中数学选择性必修第三册课件0 次下载
- 【 课后作业】第8章成对数据的统计分析 8.1.1 变量的相关关系(原卷版+解析版)人教A版(2019)高中数学选择性必修第三册试卷0 次下载
- 【 课后作业】第8章成对数据的统计分析 8.1.2 样本相关系数(原卷版+解析版)人教A版(2019)高中数学选择性必修第三册试卷0 次下载
- 【教案+课件】第8章成对数据的统计分析 8.2.1 一元线性回归模型 人教A版(2019)高中数学选择性必修第三册课件0 次下载
- 【 课后作业】第8章成对数据的统计分析 8.2.1 一元线性回归模型(原卷版+解析版)人教A版(2019)高中数学选择性必修第三册试卷0 次下载
数学成对数据的相关关系图文课件ppt
展开 这是一份数学成对数据的相关关系图文课件ppt,文件包含课件812样本相关系数pptx、教案812样本相关系数docx等2份课件配套教学资源,其中PPT共26页, 欢迎下载使用。
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势
两个变量呈正相关或负相关,且散点图落在一条直线附近
核心问题:散点图虽然直观,但只能大致描述,如何准确量化成对样本数据的相关程度?
问题1:三个散点图中两个变量的相关程度一样吗?
问题2:哪一组的线性相关性更强?
问题3:如何准确描述这种差异?
解决方案:散点图虽然直观,但只能大致描述,无法准确量化成对样本数据的相关程度。需要引入一个恰当的 "数字特征" ,对成对样本数据的相关程度进行定量分析。
数据预处理方法:中心化
数据预处理的常用方法:中心化(零均值化)
将每个数据减去其均值,使得新数据的均值为0。即:x'ᵢ = xᵢ - x̄,y'ᵢ = yᵢ - ȳ
数据平移后的散点图分布
中心化后,数据点分布在以原点为中心的区域,便于观察数据的正负特征和分布规律。
基于中心化后的数据,我们可以进一步分析不同相关类型的坐标特征。
不同相关类型的坐标特征
特征:数据点主要分布在第一、第三象限,(x', y') 基本同号
特征:数据点主要分布在第二、第四象限,(x', y') 基本异号
特征:数据点均匀分布在四个象限,(x', y') 正负无明显规律
特征:数据点呈现曲线趋势,线性相关系数 r ≈ 0
核心发现:通过观察中心化后数据的坐标符号特征,可以初步判断两个变量的相关类型!
正负相关的坐标特征详解
(x', y') 基本同号
第一象限:x'>0, y'>0
第三象限:x'0, y' 0 时
表明成对样本数据正相关
(同号的乘积之和占主导)
当 Lxy < 0 时
表明成对样本数据负相关
(异号的乘积之和占主导)
思考问题:Lxy 的大小与数据的度量单位有关吗?能否直接用它度量相关程度?
体重单位:kg(不变)
身高单位:cm(×100)
Lxy = 15000
关键发现:单位的改变不会改变体重与身高之间的相关程度,但 Lxy 的大小变为原来的 100倍 !
Lxy 的大小与数据的度量单位有关,不能直接用它度量成对样本数据相关程度的大小。
为了消除单位的影响,需要进一步做"标准化"处理!
消除单位影响的标准化方法
为了消除单位的影响,对数据进行标准化处理:
x"i = (xi - x̄) / sx
y"i = (yi - ȳ) / sy
其中 sx、sy 分别为 x、y 的标准差
标准化后的数据均值为 0,标准差为 1
仿照 Lxy 的构造,使用标准化后的数据
仿照 Lxy = Σ(x'i · y'i) 的形式,用标准化后的数据构造新的统计量...
我们称 r 为变量 x 和变量 y 的 样本线性相关系数 ,简称 样本相关系数 :
r = Σ(x"i · y"i) / n
= Σ(xi - x̄)(yi - ȳ) / √[Σ(xi - x̄)² · Σ(yi - ȳ)²]
r = Lxy / √(Lxx · Lyy)
其中:Lxx = Σ(xi - x̄)²Lyy = Σ(yi - ȳ)²Lxy = Σ(xi - x̄)(yi - ȳ)
消除了数据的度量单位影响
取值范围固定,便于比较
能够准确反映线性相关程度
接下来我们来考察样本相关系数 r 的合理性和性质
样本相关系数的正负意义
样本相关系数 r 的正负能反映出成对变量的什么关系?
当其中一个数据的值变小时,另一个数据的值通常也变小
当其中一个数据的值变大时,另一个数据的值通常也变大
当其中一个数据的值变小时,另一个数据的值通常变大
当其中一个数据的值变大时,另一个数据的值通常变小
r > 0 → 同向变化
r < 0 → 反向变化
样本相关系数的取值范围(一)
样本相关系数 r 的取值与成对样本数据的相关程度有什么内在联系?
首先我们来考察 r 的取值范围
从向量数量积得到的启发
观察 r 的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示:
二维向量: a·b = x₁x₂ + y₁y₂
三维向量: a·b = x₁x₂ + y₁y₂ + z₁z₂
a·b = |a||b|cs θ
其中 θ 为向量 a, b 的夹角
将向量的维数推广到 n 维,n 维向量的数量积仍然定义为:
利用 n 维向量的数量积,我们可以推导出样本相关系数 r 的取值范围
样本相关系数的向量表示
类似于平面或空间向量的坐标表示,对于向量:
a = (a₁, a₂, ..., aₙ)
b = (b₁, b₂, ..., bₙ)
a·b = Σaᵢbᵢ
设"标准化"处理后的成对数据:
第一分量构成 n 维向量:
x' = (x"₁, x"₂, ..., x"ₙ)
第二分量构成 n 维向量:
y' = (y"₁, y"₂, ..., y"ₙ)
样本相关系数与向量夹角的关系
x'·y' = |x'||y'|cs θ
样本相关系数与向量夹角
样本相关系数等于标准化后向量夹角的余弦值:
θ 是向量 x' 与 y' 的夹角
当 |r| = 1 时,即 |cs θ| = 1 时,成对样本数据之间有怎样的关系?
|r| = 1 时的特殊情况
当 |r| = 1 时,即 |cs θ| = 1,意味着:
向量 x' 与 y' 共线
y' = kx' (k 为常数)
(yᵢ - ȳ)/sᵧ = k(xᵢ - x̄)/sₓ
这表明成对样本数据 (xᵢ, yᵢ) 都落在直线上:
y = ȳ + k(sᵧ/sₓ)(x - x̄)
令 b = k(sᵧ/sₓ)
y = ȳ + b(x - x̄)
结论:成对样本数据的两个分量之间满足一种线性关系
所有数据点完全落在一条斜率为正的直线上
所有数据点完全落在一条斜率为负的直线上
样本相关系数的取值范围(二)
由此可见,样本相关系数 r 的取值范围为:
r ∈ [-1, 1]
样本相关系数 r 的绝对值大小可以反映成对数据之间线性相关的程度:
当 |r| 越接近 1 时,成对数据的线性相关程度越强
当 |r| 越接近 0 时,成对数据的线性相关程度越弱
样本相关系数的几何意义
不同 r 值对应的数据分布特征
关键提示:|r| 的大小反映的是线性相关的程度,r 接近 0 并不意味着变量间没有关系,可能只是不存在线性关系。
r = 0 时的特殊情况
样本相关系数 r = 0 时,样本一定是无相关关系吗?
r = 0 时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系。
例如:抛物线关系(r ≈ 0)
利用相关系数 r 来检验线性相关显著性水平时,通常与 0.75 作比较:
注意:这个标准不是绝对的,实际应用中需结合具体情况判断。
脂肪含量与年龄的相关性分析
根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度。
先画出散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关。
可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同。
|r| = 0.97 > 0.75,线性相关显著
年龄与脂肪含量之间存在显著的正线性相关关系,随着年龄增长,脂肪含量呈现上升趋势,相关系数 r ≈ 0.97。
年龄与脂肪含量的散点图
观察要点:散点图中的样本点明显呈现从左下角到右上角的趋势,且点与点之间较为集中,说明两个变量之间存在较强的正线性相关关系。
样本相关系数的计算步骤
x̄ = (23 + 27 + ... + 61) / 14 = 48.2
ȳ = (9.5 + 17.8 + ... + 34.6) / 14 = 27.0
第二步:计算离差乘积和
Lxy = Σ(xi - x̄)(yi - ȳ)
= (23-48.2)(9.5-27.0) + (27-48.2)(17.8-27.0) + ...
同理可计算 Lxx 和 Lyy
Lxy = 1548.6
Lxx = 2365.4
Lyy = 1028.3
= 1548.6 / √(2365.4 × 1028.3)
= 1548.6 / √2432426.82
= 1548.6 / 1559.6
成对样本数据的关系类型
r = Lxy/√(LxxLyy)
r > 0 正相关;r < 0 负相关
|r|→1 相关强;|r|→0 相关弱
|r| > 0.75 显著
相关课件
这是一份数学成对数据的相关关系图文课件ppt,文件包含课件812样本相关系数pptx、教案812样本相关系数docx等2份课件配套教学资源,其中PPT共26页, 欢迎下载使用。
这是一份数学8.1 成对数据的相关关系集体备课ppt课件,共35页。PPT课件主要包含了自学导引,样本相关系数r的计算,样本相关系数r的性质,-11,课堂互动,素养达成等内容,欢迎下载使用。
这是一份人教A版 (2019)选择性必修 第三册成对数据的相关关系教学ppt课件,文件包含课件811变量的相关关系pptx、教案811变量的相关关系docx等2份课件配套教学资源,其中PPT共36页, 欢迎下载使用。
相关课件 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利 






.png)
.png)



