相关分析
大数据系列课程
CONTENTS
01
论述
02
分类
03
相关系数的计算
目 录
论述
Part 01
相关关系是一种非确定性的关
系,它不等同于函数关系,也不等
同于因果关系。相关关系研究的对
象之间确实存在依存关系,但这种
关系不确定、不严格,而且不能仅
由相关关系作出因果判定。
主要包括:
•确定变量之间有无相关关系,以及
相      关关系的表现形式。
•确定相关关系的密切程度,在线性
相关关系中该密切程度由相关系数
表示。
•相关系数的显著性检验。
相关分析的论述
相关分析的分类
Part 02
变量间的相关关系近似地表现为直线,
即称为线性相关。其特点是当一个变量增
减一个单位时、另一个变量也按一个大致
固定的量变化
线性相关
1、相关关系
根据相关关系
相关分析的分类
若这种相关关系近似为曲线时,
即称为曲线相关
非线性相关
1、相关关系
根据相关关系
相关分析的分类
正相关
当自变量的数值增加,因变量的
数值也基本随之增加,即为正相关
2相关方向
相关分析的分类
负相关
因变量的值随着自变量值的增加
而降低,则是负相关
2相关方向
相关分析的分类
完全相关的变量之间,一个变量的
值完全由另一个或另几个变量决定,即存
在函数关系
完全相关
3、密切程度
密切程度
相关分析的分类
介于这二者之间的,称为不完全相关
不完全相关
3、密切程度
密切程度
相关分析的分类
如果变量之间各自相互独立,互不
影响,完全无关,则成为无相关
无相关
3、密切程度
密切程度
相关分析的分类
相关系数的计算
Part 03
在概率论和统计学中,相关(或称相关系数或关联系数)显示两个随机变量之间线性关系的强
度和方向,用来衡量两个变量相对于其相互独立的距离对于不同的测量尺度。其中最常用的为
皮尔森相关系数。
两个变量之间的皮尔森相关系数定义为两个变量之间的协方差和标准差的商,即:
相关系数的计算
        利用样本数据计算相关系数时,因为样本是随机抽取的,所以不能保证计算得
到的相关系数百分百可靠,可能存在数据计算得到的相关系数很大,但总体却不相关
的情况。因此,总体是否具有线性相关性,在给出结论前,就必须作假设检验。
相关系数的显著性检验
谢谢!