Standard Deviation, SD
标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

上图:具有相同平均值和不同标准偏差的两个样本群体的示例。红色人口的平均数为100,标准差为10。蓝色人口的平均数为100,标准差为50。
报告的误差范围通常是标准偏差的两倍。科学家通常会在实验中报告数字与平均数的标准偏差。他们常常认为只有大于标准偏差两倍或三倍的差异才是重要的。
很多时候,只能测量一个样本或一组的一部分。然后,可以通过稍微不同的方程(称为样本标准差)来找到接近整个组的标准差的数字,如下所述。在这种情况下,整体标准差用希腊字母表示 σ,而样本标准差用s表示
SD=N1i=1∑N(xi−μ)2
μ 平均值(x)。
在真实世界中,找到一个总体的真实的标准差并不实际。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。
从一大组数值X1,⋯,XN当中取出一样本数值组合x1,⋯,xn:n<N,常定义其样本标准差:
s=n−11i=1∑n(xi−x)2
样本方差s2是对总体方差σ2的无偏估计。之所以s中的分母要用n−1而不是像总体样本差那样用n,是因为(xi−xˉ)的自由度为n−1,这是由于存在约束条件∑i=1n(xi−xˉ)=0。