数据的集中趋
势和离散程度
课程目录
5. 数据的集中趋势和离散程度
      5.1 数据的集中趋势
      5.2 数据的离散程度
      5.3 偏态和峰度
数据的集中趋势
1、常用代表
集中趋势在统计学中是指一组数
据向某一中心值靠拢的程度,它反映
了一组数据中心点的位置所在。
反映数据集中趋势的几个常用代
表值有均值、中位数和众数,分别描
述数据的数值平均和位置平均。
将数据按大小
顺序排列起来,形成
一个数列,居于数列
中间位置的那个数据
就是中位数。
中位数
众数是一组观测值
中出现频率最高的值。
众数
数据组中所有数值
的总和除以该组数值的个
数。指的就是数值的中间
点。
均值
数据的集中趋势
1、常用代表
数据的集中趋势
2、常用代表之间的关系
通过均值、中位数和众数
在图形中的位置,可以分析数据
的倾斜程度。
在大部分实际应用中,数据
都是不对称的。它们可能是正倾
斜的,其中众数岀现在小于中位
数的值上;或者是负倾斜的,其
中众数出现在大于中位数的值上。
课程目录
5. 数据的集中趋势和离散程度
      5.1 数据的集中趋势
      5.2 数据的离散程度
      5.3 偏态和峰度
数据的离散程度
1、概述
仅仅用集中趋势来描述数据的分
布特征是不够的,只有把集中趋势和
离散程度结合起来,才能全面地认识
事物。我们经常会碰到平均数相同的
两组数据其离散程度可以是不同的。
一组数据的分布可能比较集中,差异
较小,则平均数的代表性较好。另一
组数据可能比较分散,差异较大,则
平均数的代表性就较差。
描述数据离散程度最简单的
测度值,是样本数据中两个极端
值之差,也称为全距。即取值范
围数据越分散,极差越大。
单击此处添加文本具体内容,简
明扼要的阐述您的观点
单击此处添加文本具体内容,简
明扼要的阐述您的观点
数据的离散程度
极差
添加标题
添加标题
2、常用指标
单击此处添加文本具体内容,简
明扼要的阐述您的观点
单击此处添加文本具体内容,简
明扼要的阐述您的观点
利用了样本的全部信息去
描述数据取值分散性。
·方差是一组数据的各数据
值与其均值的离差平方的算数平
均数,是测度离散程度的主要指
标,用σ2表示。
·标准差:是方差的算数平
方根,又叫均方差,用σ表示。
数据的离散程度
添加标题
方差与标准差
添加标题
2、常用指标
单击此处添加文本具体内容,简
明扼要的阐述您的观点
离散系数是测定总体中各单
位标志值变异的相对量指标,以
消除不同对象之间在计量单位、
平均水平等方面的不可比因素。
常用的离散系数主要是标准差离
散系数CV
单击此处添加文本具体内容,简
明扼要的阐述您的观点
数据的离散程度
添加标题
添加标题
离散系数
2、常用指标
课程目录
5. 数据的集中趋势和离散程度
      5.1 数据的集中趋势
      5.2 数据的离散程度
      5.3 偏态和峰度
数据的偏态和峰度
1、概述
集中趋势和离散程度是关于数据分布的基本测度,在给出数据的描述过
程中,往往还需要进一步描述数据分布的形态,例如是对称的还是向左向右
偏斜的,数据的分布是扁平的还是尖耸的。这就需要对数据分布的偏态和峰
度进行度量。
数据的偏态和峰度
2、偏度
偏度衡量数据的不对称性。衡量偏度的指标
称为偏度系数。
·当偏度系数为0时,表示数据相对均匀的分
布在平均值的两侧。
·偏度系数为负(负偏态),则意味着数据分
左侧的尾部比右侧的长,绝大多数的值(包括中
位数)分布在平均值的右侧。
·偏态系数为正(正偏态)就意味着局分在右
侧的尾部比左侧的长,绝大多数的值(但不一定
包括中位数)位于平均值的左侧。
数据的偏态和峰度
3、峰度
峰度指数据分布平峰还是尖峰的程度,
是度量数据分布的平坦度的测度。
峰度系数的取值为3时,表示数据的峰
度与标准正态分布一致;峰度系数小于3时,
表示数据为平峰分布,峰度系数大于3时,
表示数据为尖峰分布。