常见的变量分布

随便记了,不是很想管格式。

主要记住一下常见的随机分布的函数和密度函数。

随机变量

随机变量可以分为两种类型:离散随机变量连续随机变量

  1. 离散随机变量:离散随机变量的取值是可数的,通常表示为整数。它们描述了在离散事件中可能发生的不同结果,例如掷硬币的结果(正面或反面),骰子的点数(1、2、3、4、5或6)等。离散随机变量的概率分布由概率质量函数(Probability Mass Function,PMF)描述。
  2. 连续随机变量:连续随机变量的取值是连续的,可以是实数范围内的任意值。它们描述了在连续事件中可能发生的结果,例如测量温度、身高、时间等。连续随机变量的概率分布由概率密度函数(Probability Density Function,PDF)描述。

概率分布函数

一般是这个函数是计算随机变量 < 某个值的概率。

不难看出,当变量趋于负无穷的时候,概率的极限为 0,概率趋于 1 的时候,概率的极限为 1。

对于连续的随机变量来说,变量取某个值的概率为 0。很经典的一个例子就是,在数轴 0 - 1 的位置上随机取一个实数,取得 0.5 的概率是多少,0-1上实数的个数应该有无穷多个,所以概率为0。但是如果我们算 <0.5 的概率是多少,那么我们不难看出来应该是 0.5。

上面这个例子中,因为一个数值的取值概率为它所占样本空间的大小,而一个点(取一个数值)是没有长度的,而我们换成了 <0.5,它的测度变成了一条线,那么它所占样本空间的大小就能算出来。

对于不连续的随机变量(概率分布函数不连续),取某一点的概率相当于在这个点上的跳变值

概率密度函数

相当于是分布函数求导的结果,它在负无穷到正无穷上的反常积分应当是收敛的,且值为 1。

几大特殊的分布

我们先来看看连续型的随机变量:

均匀分布

在定义域上,取得每个值的概率都相等。

概率分布函数:\(f(x) = \begin{cases} 0 & x<a \\ \frac{1}{b-a}(x-a), & a\le x\le b \\ 1, & x>b \end{cases}\)

概率密度函数:\(f(x) = \begin{cases} \frac{1}{b-a}, & a\le x\le b \\ 0, & 其它 \end{cases}\)

期望:\(E(X)=\frac{a+b}{2}\)

方差:\(D(X)=\frac{(b-a)^2}{12}\)

这个还是比较好理解的。

指数分布

如果随机变量X服从参数 \(\lambda\) 的指数分布,那么记为 \(X\sim Exp(\lambda)\)

概率分布函数:\(F(x) = \begin{cases} 1 - e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases}\)

概率密度函数:\(f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases}\)

期望:\(E(X)=\frac{1}{\lambda}\)

方差:\(D(X)=\frac{1}{\lambda^2}\)

正态分布

如果X服从期望为 \(\mu\),方差为 \(\sigma^2\) 的正态分布,那么记为 \(X\sim N(\mu,\sigma^2)\)

概率分布函数:没有准确的表达式

概率密度函数:\(P_X(\mu,\sigma^2)=\frac{1}{\sigma^2\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)

标准正太分布即是期望为 \(0\) 方差为 \(1\) 的正太分布。


下面介绍离散型随机变量的常见分布

两点分布

两点分布(也称为伯努利分布)是一种特殊的离散概率分布,描述了一个随机变量只能取两个可能取值的情况。它是离散情况下最简单的概率分布之一。

分布律:\(P(X=k)=p^k(1−p)^{1−k}\)

期望:\(p\)

方差:\(p(1-p)\)

几何分布

n 重伯努利实验,如果一个实验,在每次试验中只有两种可能的结果,而且是互相对立的,每次实验是独立的,与其它各次试验结果无关结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努力试验。

几何分布

进行若干次伯努利实验,令X为首次试验成功时的总试验数,我们称 X 服从参数为 \(p\) 的几何分布,在每一次实验中,结果服从参数为 \(p\) 的两点分布。

分布律:\(P\{X=k\}\) = \((1-p)^kp\)

期望:\(E(X)=\frac{1}{p}\)

方差:\(D(X)=\frac{1-p}{p^2}\)

超几何分布

理解为有放回的二项分布即可,超几何分布的参数包括总体大小(总体中的元素个数)N,成功的数量(总体中具有某个属性的元素个数)K,以及每次抽样的大小n。

超几何分布的期望(均值)和方差的计算公式如下:

期望: \(E(X) = n * (K/N)\)

方差: \(D(X) = n * \frac{K}{N} \frac{N-K}{N}\frac{N-n}{N-1}\)

二项分布

描述这样的一种实验:

  1. 每次试验都有两个可能的结果,成功和失败。
  2. 每次试验的结果相互独立,即一个试验的结果不会影响其他试验的结果。
  3. 每次试验成功的概率 p 保持不变。

此时我们做 k 次实验,令随机变量 X = k次实验中成功的次数,我们称 X 服从二项分布,记为 \(X\sim B(n,p)\)

由于二项分布的随机变量只能取值整数,因此它是没有概率分布和概率密度函数的,但是我们可以求它的分布律:

分布律:\(P(X=k) = C(n, k) * p^k * (1-p)^{n-k}\)

期望:\(E(X)=np\)

方差:\(D(X)=np(1-p)\)

泊松分布

如果X服从参数 \(\lambda\) 的泊松分布,那么记为 \(X\sim \pi(\lambda)\)

分布律:\(P_X(k)=\frac{\lambda^ke^{-\lambda}}{k!}\)

期望:\(\lambda\)

方差:\(\lambda\)

期望的计算

对于离散随机变量,期望的计算用以下公式:

\(E(X)=\sum_{k=1}^{\infty}x_k p_k\)

对于连续的随机变量,使用以下公式:

\(E(X)=\int_{-\infty}^{\infty}xf(x)\mathrm{d}x\)