从数据看总体
课
程目
录
6.
从数据看总体
6.1
总体和样本
6
.2
抽
样
总
体数据
总
体指所要
认识
的研究
对
象的全体
,
它是由所研究范
围
内具有某种共同性
质
的全体
单
位所
组
成的集合体
。
总
体分
为变
量
总
体和属性
总
体两大
类,
其中
变
量
总
体是用数
值
型数据
进
行
表示的
对
象
。
对
于
变
量
总
体
,
根据数
值
可取
值
的
数目分
为
无限
总
体和有限
总
体
。
1
、总
体
样本是从总体中随机抽取出来的
一部分所组成的集合体。一次抽样所
包含的样本个数称为样本的容量。样
本容量大,抽样误差会较小。
样本个数是指从一个总体中可能
抽取多少个样本。样本个数的多少与
抽样方法有关。
总
体数据
2
、样
本
总
体数据
根据
总
体各
单
位
标
志
值
或
标
志属性
计
算的
、
反映
总
体某种属性的
综
合指
标,
称
为
全及指
标,
也称
为
“
总
体参数
”
或
“
母体参数
”
。总
体参数是
总
体
变
量的
函数
,
由于
总
体是唯一确定的
,
根据
总
体
计
算的
总
体参数也是唯一确定的
。
常用的
总
体参数有
:总
体平均数
、
总
体
标
准差
、总
体方差和
总
体比率
(
比
例
)
。
3
、总
体参数
总
体数据
•
总
体平均数
:设总
量
X
有
N
个取
值,
X
1
,X
2
…X
n
,则总
体平均数
μ
=
(
X
1
+X
2
+…+X
n
)
/N
•
总
体
标
准差和方差
:
是
测
量
总
体数
值
离
散程度的指
标。
•
总
体比率
(
比例
)
:对
于属性
总
体
,
由于各
单
位
标
志不能用数量来表示
,
只
能用一
定的文字来加以描述
,
所以
,
就
应计
算
结
构相
对
指
标,
称
为总
体成数或
总
体比
率
。总
体比率常以大写英文字母
P
来表示
总
体中具有某种性
质
的
单
位数在
总
体全
部
单
位数中所占的比例
。
3
、总
体参数
课
程目
录
6.
从数据看总体
6
.1
总
体和
样
本
6.2
抽样
抽
样
根据
样
本
各
值计
算的
、
反映
样
本属
性的指
标
称
为
抽
样
指
标
。
和
总
体指
标
相
对应
的有抽
样
平均数
、样
本
标
准差
、样
本方差和抽
样
比率等
。
1
、
抽
样
指
标
总
体数据
抽
样调
査是建立在概率
论
大数定律和中心极限定
理基
础
上的
。
大数定律的一系列定理和中心极限定理
为
抽
样调查
提供了数学依据
。
·
大数定律
:
大数定律是
阐
明大量随机
现
象平均
结
果的
稳
定性的一系列定理的
总
成
。
人
们
在
观
察个
别
事
物
时,
是
连
同一切个
别
的特性来
观
察的
。
个
别现
象受
偶然因素的影响
,
各有各的表
现。
大数定律
论证
了
样
本平均数
趋
近于
总
体平均数的
趋势,这为
抽
样调查
提供了重要的理
论
依据
。
2
、
抽
样调查
的理
论
基
础
总
体数据
抽
样调
査是建立在概率
论
大数定律和中心极限定
理基
础
上的
。
大数定律的一系列定理和中心极限定理
为
抽
样调查
提供了数学依据
。
·
中心极限定理
:
随机
变
量
x
1
,x
2
,…,x
n
相互独立
,
且
服从同一分布
,
该
分布存在有限的期望和方差
:
E(x
i
)=μ,σ
2
(x
i
)=σ
2
,
i=1,2,…
。
当
n
趋
于无
穷
大
时,
算
术
平
均数近似服从正
态
分布
。
中心极限定理
为
抽
样误
差的概率估
计
提供了理
论
基
础。
2
、
抽
样调查
的理
论
基
础
总
体数据
抽
样误
差是指由于抽
样
的随机性而
带
来的偶然的代表性
误
差
,
包括抽
样实
际误
差和抽
样
平均
误
差两种
。
抽
样实际误
差是指某一
样
本指
标
与
被它估
计
的
总
体指
标
之
间
数
值
的差异
。
抽
样
平均
误
差就是反映抽
样误
差一
般水平的指
标,
是指所有可能出
现
的
样
本指
标
的
标
准差
,
也可以
说
是所有可能
出
现
的
样
本指
标
和
总
体指
标
的平均离差
。
3
、
抽
样误
差
总
体数据
3
、
抽
样误
差
·
抽
样
极限
误
差
在
进
行抽
样
估
计时,
通常需要事先
根据所
调查对
象的特点
、调查
的需要
,
确定可允
许
的
误
差范
围
,
并将估
计误
差
限制在
这
一范
围
之内
,这
个范
围
就是抽
样
极限
误
差
。
抽
样
极限
误
差是根据概率理
论,
以
一定的可靠程度来保
证
抽
样误
差不超
过
某一
给
定的范
围。统计
上把抽
样
极限
误
差又称
为
置信区
间。