概率的分布
主讲老师:
XXX
Contents
目录
概率密度和累积分布
1
.
二项分布
正态分布
3
.
2
.
概率密度和累积分布
PART 01
随机变量根据其取值特点分为离散型随机
变量和连续型随机变量。
如果随机变量
X
只可能取有限个或者是可
数无穷尽的值
X
=x
1
,x
2
,x
3
…
,则称
X
为离散型随
机变量。
概率密度和累积分布
1
、离散型随机变量
如果随机变量
X
由全部实数或者由一部分
区间组成,
X=
{
x
|
a≤x≤b
}
(
-∞
<
a<b<
+∞)
,
则称
X
为连续型随机变量。连续随
机变量的值是不可数及无穷尽的。
概率密度和累积分布
2
、连续型随机变量
在数学中,连续型随机变量的概率密度函
数是一个描述这个随机变量在某个确定的取值
点附近的可能性的函数。当概率密度函数存在
的时候,累积分布函数是随机变量的取值落在
某个区域之内的概率,是概率密度函数的积分
,一般以大写
“PDF”
标记。
如果概率密度函数
f
x
(
x
)在一点
x
上连续
,那么累积分布函数可导,并且它的导数
F
x
’(x)=f
x
(x)
。
四、
概率密度和累积分布
2
、连续型随机变量
二项分布
PART 02
1
、定义
二项分布又叫贝努里分布,是一种具有广泛用
途的离散型随机变量的概率分布。
二项分布是指统计变量中只有性质不同的两项
群体的概率分布。所谓两项群体,是按两种不同性
质划分的统计变量,即各个变量都可归为两个不同
性质中的一个,两个观测值是对立的。
二项分布
2
、计算
考虑只有两种可能结果的随机试验,当成功的
概率是恒定的,且各次试验相互独立,这种试验在
统计学上称为伯努利试验。二项分布即重复
n
次的伯
努利试验。
如果事件发生的概率是
P
,则不发生的概率
q
=1-
p
,
n
次独立重复试验中发生
k
次的概率是
二项分布
正态分布
PART 03
1
、定义
正态分布是一个在数学、物理、工程及金融等
领域都非常重要的概率分布。正态分布在自然界中
随处可见,比如说人的身高和智力都服从正态分布。
若随机变量
X
服从一个位置参数为
μ
、标准差
为
σ
的概率分布,记为
X~N
(
μ
,
σ
2
)
则其概率密度函数为
正态分布
正态分布有一个被称为
“
经验法
则
”
的
“68-95-99.7
法则
”
,即约
68.3%
的数值分布在距离平均值有
1
个
标准差之内的范围,约
95.4%
的数值
分布在距离平均值有
2
个标准差之内的
范围,以及约
99.7%
的数值分布在距
离平均值有
3
个标准差之内的范围。因
此也称正态分布的均值化是
“
位置参
数
”
,它决定了分布的中心位置,标
准差。是
“
尺度参数
”
,它决定了分
布的幅度。
根据经验法则,在给出正态分布
均值和标准差的条件下,可以快速作
出估计。
2
、经验法则
正态分布
正态分布有一个非常重要的性质:
在特定条件下
,
大量统计独立的随机变
量的平均值的分布趋于正态分布,这
就是中心极限定理。
中心极限定理的重要意义在于,
根据这一定理的结论,其他概率分布
可以用正态分布作为近似。
3
、
正态分布与其他分布之间的关系
正态分布
参数为
n
和
P
的二项分布,在
n
相当大而且
p
接近
0.5
时近似于正态分布。近似正态分布平均数为
μ=np
,且
方差为
σ
2
=np(1-p)
。
例如,样本数为
n=48,p=0.25
的二项分布,趋近于
均值为
12,
标准差为
3
的正态分布。
3
、
正态分布与其他分布之间的关系
正态分布
谢谢聆听