视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
项目数据分析师 ---- T检验、F检验和统计意义以及显著性差异
2025-09-24 18:18:43 责编:小OO
文档
项目数据分析师 ---- T检验、F检验和统计意义以及显著性差异

1、T检验和F检验的由来

一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。

通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的几率很少,亦即是说,实在机会很少,很罕有的情况下才出现,那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的几率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。

F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的几率。

2、统计学意义(P值或sig值)

结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联式总体中各变量关联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个试验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可以接受错误的边界水平。

3、T检验和F检验

至于具体要坚定地内容,须看你是在做哪一个统计程序。

举一个例子,比如,你要检验两样本均数差异是否能推论总体,而进行的t检验,两样本(如:某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在显著差异呢?

会不会总体中男女生根本没有差别,只不过是你那么巧抽到这两个样本的数值不同?

为此,我们进行t检验,算出一个t检验值。与统计学家建立的以“总体中没差别”作为基础的随机变量t分布进行比较,看看在多少百分比的机会(亦即显著性sig值)下会得到目前的结果。

若显著性sig值很少,比如《0.05小于5%几率》,亦即说是,“如果”总体“真的”没有差别,那么就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。虽然还是有5%机会出错,但我们还是可以“比较有信心”的说:目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,“总体中男女生不存差异”的虚无假设应予拒绝,简言之,总体应该存在显著差异。

每一种统计方法的检定的内容都不相同,同样是t检验,可能是上述的检定总体中是否存在差异,也同能是检定总体中的单一值是否等于0或者等于某一个数值。

至于F检验,方差分析(或变异系数分析,Analysis of Variance),它的原理大致也是上面说的,但他是透过检视变量的方差而进行的。它主要用于:均数拆别的显著性检验、分离各有关因素并估计期对总变异的作用,分析因素间的交互作用,方差齐性(Equality of Variances)检验等情况。下载本文

显示全文
专题