admin 管理员组文章数量: 1086019
AI 人工智能之常见概率分布(1)
二项分布
考察由n次随机试验组成的随机现象,它满足以下条件:
1)重复进行n次随机试验;
2)n次试验相互独立;
3)每次试验仅有两个可能结果;
4)每次试验成功的概率为p,失败的概率为1-p。
在上述四个条件下,设X表示n次独立重复试验中成功出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量,且它的概率函数为:
这个分布称为二项分布,记为b(n,p),其中)是从n个不同元素中取出x个组合数,它的计算公式为:
项分布的均值:E(X)=np
二项分布的方差:Var(X)=np(1-p)
二项分布的标准差:
泊松分布
泊松分布需要做以下假定:
- 一个事件在一段时间或空间内发生的平均次数或数学期望为λ。
- 将这段时间或空间分成n等份,在每一等份的时间或空间内,这个事件发生的概率为λ/n,当n很大时,λ/n很小,即在这段内,要发生两次或者更多次事件是不可能的。因此在这段时间内不发生该事件的概率表示为1-λ/n。
- 在n个等份中,每个等份是否发生该事件是独立的;
设随机变量 X 取值为0, 1, … ,分布律为 :
称X服从参数为 λ 的泊松( Possion)分布,记为X~P(λ)。
泊松分布的数学期望: λ
泊松分布的方差:λ
泊松分布的特征:
- 泊松分布是一种描述和分析稀有事件的概率分布。要观察到这类事件,样本含量n必须很大。
- λ是泊松分布所依赖的唯一参数。值愈小,分布愈偏倚,随着的λ增大,分布趋于对称。
- 当λ = 20时,分布泊松接近于正态分布,λ = 50时,可以认为泊松分布呈正态分布。在实际工作中,当时就可以用正态分布来近似地处理泊松分布的问题。
正态分布
正态分布,也称“常态分布”,又名高斯分布,最早由棣莫弗在求二项分布的渐近公式中得到。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为的正态分布,记为N(μ,)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
我们常说的正态分布是指的一维正态分布。
均数和标准差
概率密度函数
若随机变量X服从一个位置参数为μ,尺度参数为的概率分布. 且其概率密度函数为:
则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作X~N(μ, ),读作X服从N(μ, ),或X服从正态分布。
f(x)表示的概率密度,表示概率在该点的密集程度。
正态曲线与横轴一定区间内所围成的面积反映了变量值落在该区间的概率(概率分布),因此,概率密度函数的积分就是分布函数。
期望值μ决定了正态分布的位置,标准差σ决定了正态分布的幅度。
概率密度函数f(x):
当μ=0,σ=1时的正态分布是标准正态分布.
标准差σ反映了数据分布的密集程度,若σ较小,随机变量X分布相对较集中;若σ较大,随机变量X分布相对分散。
分布曲线的特征:
- 关于直线 x = μ 对称;
- 在x = μ 处达到最大值;
- 在x = μ±σ处有拐点(凹凸曲线的分界点);
- x → ∞ 时曲线以x轴为渐近线;
- 固定σ,改变μ,则图形沿x轴平移而不改变其形状;
- 固定μ,改变σ,则当σ很小时,曲线的形状与一尖塔相似;当σ值增大时,曲线将趋于平坦。
概率分布函数
上面这个 f(x) 这个中间高、两边低的“钟形曲线”就是正态分布的概率密度曲线。“密度曲线下面积“即为概率,也就是曲线的积分。随机变量X在某个区间比如(a,b)即a<X<b的概率,就是概率密度曲线在这个区间下的面积,数学上的表达就是密度函数在区间(a, b)上的积分。概率的大小就是“概率密度函数曲线下的面积”的大小。
概率分布函数是正态分布曲线的定积分,公式为:
本文标签: AI 人工智能之常见概率分布(1)
版权声明:本文标题:AI 人工智能之常见概率分布(1) 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1693405821a220052.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论