如何理解概率分布

概率分布(probability distribution)或简称分布(distribution),是概率论的基本概念之一,用以表述随机变量取值的概率规律。

使用概率分布时可以有以下两种含义:

广义地,概率分布是指称随机变量的概率性质:当我们说概率空间(\Omega,\mathcal{F},\mathbb{P})中的两个随机变量X和Y具有同样的分布(或同分布)时,我们是无法用概率来区别他们的。换言之:称X和Y为同分布的随机变量,当且仅当对任意事件(\Omega,\mathcal{F},\mathbb{P}),有\mathbb{P}(X\in A)=\mathbb{P}(Y\in A)成立。

但是,不能认为同分布的随机变量是相同的随机变量。事实上即使X与Y同分布,也可以没有任何点ω使得X(ω)=Y(ω)。在这个意义下,可以把随机变量分类,每一类称作一个分布,其中的所有随机变量都同分布。用更简要的语言来说,同分布是一种等价关係,每一个等价类就是一个分布。需注意的是,通常谈到的离散分布、均匀分布、伯努利分布、正态分布、泊松分布等,都是指各种类型的分布,而不能视作一个分布。

狭义地,它是指随机变量的概率分布函数。设X是样本空间(\Omega,\mathcal{F})上的随机变量,为概率测度,则称如下定义的函数是X的分布函数(distribution function),或称累积分布函数(cumulative distribution function,简称CDF):F_X(a)=\mathbb{P}(X\leq a),对任意实数a定义。

具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数(probability density function, pdf)。

通过对概率分布概念的了解我们可以得知,概率分布是指随机变量X小于任何已知实数x的事件可以表示成的函数,也是用以表述随机变量取值的概率规律。

从质量到卓越的第一步

下一步