数据的集中趋
势和离散程度
课程目录
5.
数据的集中趋势和离散程度
5.1
数据的集中趋势
5
.2
数据的离散程度
5.3
偏态和峰度
数据的集中趋势
1
、常用代表
集中趋势在统计学中是指一组数
据向某一中心值靠拢的程度,它反映
了一组数据中心点的位置所在。
反映数据集中趋势的几个常用代
表值有均值、中位数和众数,分别描
述数据的数值平均和位置平均。
将数据按大小
顺序排列起来,形成
一个数列,居于数列
中间位置的那个数据
就是中位数。
中位数
众数是一组观测值
中出现频率最高的值。
众数
数据组中所有数值
的总和除以该组数值的个
数。指的就是数值的中间
点。
均值
数据的集中趋势
1
、常用代表
数据的集中趋势
2
、常用代表之间的关系
通过均值、中位数和众数
在图形中的位置
,
可以分析数据
的倾斜程度。
在大部分实际应用中,数据
都是不对称的。它们可能是正倾
斜的,其中众数岀现在小于中位
数的值上;或者是负倾斜的,其
中众数出现在大于中位数的值上。
课程目录
5.
数据的集中趋势和离散程度
5
.1
数据的集中趋势
5.2
数据的离散程度
5.3
偏态和峰度
数据的离散程度
1
、概述
仅仅用集中趋势来描述数据的分
布特征是不够的,只有把集中趋势和
离散程度结合起来,才能全面地认识
事物。我们经常会碰到平均数相同的
两组数据其离散程度可以是不同的。
一组数据的分布可能比较集中,差异
较小,则平均数的代表性较好。另一
组数据可能比较分散,差异较大,则
平均数的代表性就较差。
描述数据离散程度最简单的
测度值,是样本数据中两个极端
值之差,也称为全距。即取值范
围数据越分散,极差越大。
单击此处添加文本具体内容,简
明扼要的阐述您的观点
单击此处添加文本具体内容,简
明扼要的阐述您的观点
数据的离散程度
极差
添加标题
添加标题
2
、常用指标
单击此处添加文本具体内容,简
明扼要的阐述您的观点
单击此处添加文本具体内容,简
明扼要的阐述您的观点
利用了样本的全部信息去
描述数据取值分散性。
·
方差是一组数据的各数据
值与其均值的离差平方的算数平
均数,是测度离散程度的主要指
标,用σ
2
表示。
·
标准差:是方差的算数平
方根,又叫均方差,用σ表示。
数据的离散程度
添加标题
方差与标准差
添加标题
2
、常用指标
单击此处添加文本具体内容,简
明扼要的阐述您的观点
离散系数是测定总体中各单
位标志值变异的相对量指标,以
消除不同对象之间在计量单位、
平均水平等方面的不可比因素。
常用的离散系数主要是标准差离
散系数
CV
。
单击此处添加文本具体内容,简
明扼要的阐述您的观点
数据的离散程度
添加标题
添加标题
离散系数
2
、常用指标
课程目录
5.
数据的集中趋势和离散程度
5
.1
数据的集中趋势
5
.2
数据的离散程度
5.3
偏态和峰度
数据的偏态和峰度
1
、概述
集中趋势和离散程度是关于数据分布的基本测度,在给出数据的描述过
程中,往往还需要进一步描述数据分布的形态,例如是对称的还是向左向右
偏斜的,数据的分布是扁平的还是尖耸的。这就需要对数据分布的偏态和峰
度进行度量。
数据的偏态和峰度
2
、偏度
偏度衡量数据的不对称性。衡量偏度的指标
称为偏度系数。
·
当偏度系数为
0
时,表示数据相对均匀的分
布在平均值的两侧。
·
偏度系数为负(负偏态),则意味着数据分
左侧的尾部比右侧的长,绝大多数的值(包括中
位数)分布在平均值的右侧。
·
偏态系数为正(正偏态)就意味着局分在右
侧的尾部比左侧的长,绝大多数的值(但不一定
包括中位数)位于平均值的左侧。
数据的偏态和峰度
3
、峰度
峰度指数据分布平峰还是尖峰的程度,
是度量数据分布的平坦度的测度。
峰度系数的取值为
3
时,表示数据的峰
度与标准正态分布一致;峰度系数小于
3
时,
表示数据为平峰分布,峰度系数大于
3
时,
表示数据为尖峰分布。