1、T检验和F检验的由来
一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。
通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的几率很少,亦即是说,实在机会很少,很罕有的情况下才出现,那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的几率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。
F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的几率。
2、统计学意义(P值或sig值)
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联式总体中各变量关联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个试验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可以接受错误的边界水平。
3、T检验和F检验
至于具体要坚定地内容,须看你是在做哪一个统计程序。
举一个例子,比如,你要检验两样本均数差异是否能推论总体,而进行的t检验,两样本(如:某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在显著差异呢?
会不会总体中男女生根本没有差别,只不过是你那么巧抽到这两个样本的数值不同?
为此,我们进行t检验,算出一个t检验值。与统计学家建立的以“总体中没差别”作为基础的随机变量t分布进行比较,看看在多少百分比的机会(亦即显著性sig值)下会得到目前的结果。
若显著性sig值很少,比如《0.05小于5%几率》,亦即说是,“如果”总体“真的”没有差别,那么就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。虽然还是有5%机会出错,但我们还是可以“比较有信心”的说:目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,“总体中男女生不存差异”的虚无假设应予拒绝,简言之,总体应该存在显著差异。
每一种统计方法的检定的内容都不相同,同样是t检验,可能是上述的检定总体中是否存在差异,也同能是检定总体中的单一值是否等于0或者等于某一个数值。
至于F检验,方差分析(或变异系数分析,Analysis of Variance),它的原理大致也是上面说的,但他是透过检视变量的方差而进行的。它主要用于:均数拆别的显著性检验、分离各有关因素并估计期对总变异的作用,分析因素间的交互作用,方差齐性(Equality of Variances)检验等情况。下载本文