作为概率论的应用,统计学有不可估量的重要性.所以还是把我理解的统计学放上来.

首先,让我们把视线从数学的抽象转移到现实的具体吧.

误差

概率论只存在于数学概念中,如何将其结论应用于现实世界中呢?

  • 随机误差 如果我们认为某一个物理量(变量)是概率分布已知的随机变量,当我们观察它的时候,它就会像量子力学中所描述的塌缩一样产生随机误差(从随机成为确定).

  • 系统误差 观察系统所产生的误差,包括器件和方法产生的误差.

  • 毛误差 观察者个人原因产生的误差.

比较有意思的是,如果概率分布不是已知,比如说民调, 那又可以归纳出好多类型的误差.但可以总结为估计的概率分布严重偏离真实分布.

关于这个,有个比较好的视频节目.

统计学主要关注概率分布已知(不严重偏离)的随机误差.

统计学的因果论

你可能已经发现,我们要进行统计学研究,我们需要知道数据的概率分布.那么问题来了,我还没研究呢,我哪能得知其分布呢?

这里其实有一个假设: 先验的观察量和后验的观察量是由同一个随机变量产生的,那么我们就可以在后验观察时知道其概率分布.

如果数据不是由同一个随机变量产生的(影响因素很多,不可重复的话),那么统计结果无实际价值。

从上面可以看出,统计学分为『统计分析(Statistics Analysis)』和『统计推断(statistical inference)』,注意,这里可不是推理哦. 前者用于得出数据的先验统计量,后者用于检验前者是否可信.

好了,下一节讨论基本概念。