概率统计是数学的一个分支,主要研究随机现象的规律性。在机器学习和数据科学中,概率统计是一个基础且重要的工具。以下是一些常见的概率统计分类:
1. 概率论基础
概率空间:定义随机现象的数学模型。
随机变量:描述随机现象的数学工具。
分布律和概率密度函数:描述随机变量的统计特性。
2. 随机过程
马尔可夫链:描述随机变量随时间变化的规律。
稳态分布:描述随机过程长期行为的分布。
过程的平稳性:描述随机过程在时间上的稳定性。
3. 数理统计
参数估计:根据样本数据估计总体参数。
假设检验:对总体参数进行假设检验。
估计量:用于估计总体参数的统计量。
假设检验的误差:第一类错误和第二类错误。
4. 推断统计
区间估计:给出总体参数的置信区间。
假设检验:对总体参数进行假设检验。
误差分析:分析推断统计的误差。
5. 贝叶斯统计
贝叶斯定理:描述先验概率和后验概率之间的关系。
贝叶斯估计:基于先验信息和样本数据估计总体参数。
贝叶斯假设检验:基于先验信息和样本数据对假设进行检验。
6. 非参数统计
非参数检验:不依赖于总体分布的检验方法。
非参数估计:不依赖于总体分布的估计方法。
7. 多元统计
多元分布:描述多个随机变量的联合分布。
相关性分析:研究变量之间的线性关系。
主成分分析:降维技术,用于提取数据中的主要特征。
这些分类涵盖了概率统计的主要领域,但还有许多其他子领域和专题。在实际应用中,根据具体问题和需求,可能需要选择合适的概率统计方法。