昆明打铁之后,痛定思痛,来重修概率论了。

基础知识

样本空间、事件和概率

样本空间 S 是一个集合,它的元素称为基本事件。样本空间的一个子集被称为事件, 根据定义,所有基本事件互斥

互斥事件:若事件 A 发生一定能推导出 B 不发生,B 发生一定能推导出A不发生,则称 A,B 互斥,不难得出,两个事件同时发生的概率为 0,至少发生其中一个事件的概率为两者概率之和(概率公理3)。这个理论可以推导到 n 个事件,若有 n 个两两互斥事件 \(a_1,a_2...a_n\),则任意两个事件同时发生的概率为 0,任意发生一个事件的概率就为 \(\sum _{i=1}^n a_i\)

概率公理

  1. 对于任意事件 A,事件发生的概率满足 \(0\le P\{A\}\le1\)
  2. 对于样本空间 S,有\(P\{S\}=1\)
  3. 对于两个互斥事件 A,B,有 \(P\{A∪B\}=P\{A\}+P\{B\}\)

随机变量

如果对样本空间 S 中的任意事件 e,都有唯一的实数 X(e) 与之对应,则称 X=X(e) 为样 本空间 S 上的随机变量。这个随机变量怎么理解呢,首先看下面这张图:

还不能理解的话,就举个栗子,如果掷一个骰子,那么它的样本空间为 {1,2,3,4,5,6},把它一次掷骰子出的点数作为一个随机变量的话,那么很 容易得到映射 X 就是一个普通的 \(X(e)=e\),或者说,随机变量为样本点 e 的函数,以样本点为自变量,确定一个对应关系得到的应变量就是一个随机变量。

其中离散型随机变量连续型随机变量比较常见。

离散型随机变量及其概率分布

离散型随机变量取值范围为有限可数或者无限可数,或者说取值范围不在实数范围内连续。设离散型随机变量 X 的取值为 \(\text{x}_i\) 时的概率为 \(p_i(i=1,2...)\),则称 X 的所有取值及其概率为随机变量 X 的概率分布。离散型变量常见的分布有两点分布,二项分布,几何分布,超几何分布,泊松分布。

连续性随机变量及其概率分布

如果 X 是在实数域或区间上取连续值的随机变量,设 X 的概率分布函数为 \(F(x)=P\{X\le x\}\),若存在非负可积函数 \(f(x)\),使得对任意的 x,有 \(F(x)=\int _{-∞}^{x}f(t)dt\),则称 X 为连续随机变量,称 \(f(x)\) 为 X 的概率密度函数。常见的连续性随机变量分布有均匀分布,正态分布,指数分布。

概率密度函数的几何意义:随机变量的取值落在某个区域之内的概率为概率密度函数在这个区域上的积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分,对概率密度函数作傅里叶变换可得特征函数。

在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分。

连续型随机向量及其概率分布

待更新