从正态分布到 T 检验

1.说明

  接上次的 《几种常见的数学分布》。这次说说 T 分布和 T 检验,用词不够严谨,大家就领会精神为主吧~

2.什么是抽样

  如果整体样本可以一个一个判断叫普查,如果整体样本太多,没法一个一个判断,只能取一部分代表整体,叫抽样。

  比如说,一个班有 20 个人,我们可以把所有人的身高加一起,除以人数,计算均值,如果有 2000000 人,就无法把所有人身高都统计一遍再除以总数,一般情况下,就是取其中一部分,计算其均值,认为他们能代表全部。

3.正态分布

  先复习一下正态分布,比如说女人的身高一般在 160 左右,150, 170 的比较少,140,180 的更少,把身高当做横轴,人数作为纵轴画图,就可看到一个中间高两边低的钟形曲线,也就是正态分布。

  那什么不是正态分布呢?比如人的空腹血糖一般在 4-6 之间,而血糖高的 7,8,9 的很多,而低到 3,2,1 的就很少,不样一边多一边少的,就不是正态分布。

4.正态分布和 T 分布

如果只有 20 个人画一下算一下,就是正态分布;如果有 2000000 人,从中随机取出 20 个,画一图也就钟形,就叫 T 分布。

它俩的不同就在于,一个是抽样的,一个是全体的。规律都是中间高两边低对称的样子。当取样趋于无穷大时,T 分布就是正态分布,但一般都没法取太多。

5.假设检验

  如果有 2000000 个女的,你认为她们的身高是正态分布,均值 160(称理论值或标准值μ0),然后从中随机选了 20 个人,平均身高 161(μ),标准差为 5(上下浮动),那她们是否适合你所定义的正态分布均值 160 的规律呢?

  由样本信息对相应总体的特征进行推断称为统计推断。若对所估计的总体首先提出一个假设(平均身高 160),然后通过样本数据(20 个人)去推断是否拒绝这一假设,称为假设检验,如果符合这个假设就是 H0(无效假设 null hypothesis),如果不符合就是 H1(备择假设 alternative hypothesis)。

6.T 检验

  以 T 分布为基础的检验叫 T 检验。这里主要是判断一组样本是否符合我们设定的“统计推断”。将上例中的值代入公式,如果这 20 人的平均身高为 161,求 t 值。

  如果这 20 人的平均身高为 164

  可以看出 t 值的大小与抽样的均值 161,标准差 5,样本数 20,以及统计推断 160 相关。

7.如何查表

 H0 成立时 t 服从自由度 v=n-1=19 的 t 分布,查表如下:

  上面的 0.05 和 0.025 又是什么呢?是 p 值(p-value),p=0.05 意味着样本统计有 95% 的信心拒绝原假设,就是说 p 越小,原假设越可能被拒绝,一般 p 设成 0.05,自由度 19 时,它对应的 t 值为 2.093。

  当采样的 20 人平均身高为 161 时,t=0.894<2.093,即 H0 成立(抽样符合假设),当平均身高为 164 时,t=3.578>2.093,则 H1 成立(即这组抽样不符合假设)。

  就是说 t 差得越多,t 是因为误差造成的可能性 p 越小,既然不是因为误差,那就是因为本质不同,所以不符合假设。

8.单侧和双侧检验

  那上边为什么还有 0.05 和 0.1 的差别呢?它分别对应单侧和双侧检验。理论值μ0(160),抽样均值μ(161)。

双测检验值:

μ≠μ0(μ >μ0 或μ<μ0) 单测检验值:

μ>μ0(根据专业角度,μ不可能小于μ0) μ<μ0(根据专业角度,μ不可能大于μ0)

  通常我们用的都是双侧 t 检验,上例中用的也是双边的 p 值 0.05 对应的 t 值。

9.T 检验的应用条件

  要符合 t 检验的条件,才能计算 t 检验的统计值

(1) 必须是随机样本且相互独立

  比如抽得出自一个家庭,就只能统计这一家的,不能代表全国的。

(2) 来自正态分布的总体

  正态分布是一种特殊的 T 分布,判断正态分布的方法有很多,比如 Shapiro- Wilk (W 检验) 用于 3-50 个的小样本,Kolmogorov-Smirnov 检验 (D 检验) 用于小于 5000 的样本量,大于 2000 可做直方图,观察是否正态分布。

(3) 方差齐性

  均数比较时,要求两总体方差相等