尝试用通俗的语言和例子来解释这两个统计学概念,它们在电路设计和信号处理中都非常有用,比如测量jitter。
OK,下面以橙子为例进行解释:
假设小明受雇于一家水果公司,刚入职的首个任务就是让小明估计果园中橙子的平均大小。不过如果估计错误,就要支付罚款。所以小明拿了N个橙子开始测量并取平均,最后得出一个80mm大小的结论,假如现在就去告诉公司说,“我这里的橙子大小是80mm”,如果出错,就必须支付罚款,而小明又不想支付这笔罚款,因此思考加入一些错误余量(error margin)。于是说,“好吧,我不太确定……应该是80mm±2mm”。这里的±2mm是就是小明估计的一个区间,统计学上称它为置信区间(CI,confidential interval),表示错误的余量。如果还有一些时间,小明可多次对N 个(不同的)橙子重复这些测量,发现实际上在90%的情况下,橙子大小的平均值确实在 80mm±2mm范围内。这里的90%就被称为置信水平(CL,confidential level)。因此,小明现在跑去回答公司应该就没问题了,说:“我有90%的把握,橙子的平均大小为80mm±2mm”。虽然这是一个非常复杂的答案,但它也可能是唯一让小明不支付罚款的答案。如果增加测量橙子的数量N,还可以收紧上述这个置信区间(显然,极端情况是全部测量,就没有区间概念一说);或者是,对于相同的置信区间,增加测量样本数N可提高置信水平。
上面给出了一个比较通俗的例子,应该很容易理解这两个概念了。在数学上,置信区间的表达式如下,
可以看到,其他因素不变的情况下,样本数n越大,置信区间长度越小,就越接近准确的平均值。在电子科学领域,我们可以把对橙子的测量换成对其他具有统计分布的物理量的测量,比如jitter,虽然对象不同,但讲的是同一件事啦。😀