名词解释;
总体:具有相同性质和特征的个体所组成的集合。
间断性变量:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。
连续性变量:指称量、度量或测量方法所得到得数据,其各个观测值并不于整数,在两个数值之间可以有微量数值差异的第三个数值存在。
离散型随机变量;当实验只有几个确定的结果,并可一一列出,变量y的取值可用实数表示且y的取某一值时,其概率是确定的。
误差:是试验中不可控因素所引起的观测值偏离真值的差异
次数分布:在不同区间内变量出现的次数所构成的分布。
总体( population ):具有共同性质的个体所组成的集团.
随机现象:在一定条件下,有多种可能的结果发生,但事先并不能100%肯定发生哪一种结果的现象
随机事件:泛指随机现象的任何一种可能发生的结果,简称事件。
随机变量:将随机试验的每一种可能的结果数量化,建立起一一 对应的实数值,则称之。
随机试验;对某一随机现象进行一次观察具备的三个特征:
1)试验可以在相同条件下多次重复且相互;
2)给定条件下每次试验结果不只一个;
3每次试验不能预料出现那种结果,但可以大概预知。
基本事件;不能在分割的随机事件
复合事件;能在分割的随机事件。
包含事件;若事件A与事件B之间有如A包含于B。
必然事件(Ω):在一定条件下必然发生的现象。
不可能事件(Φ):在一定条件下不可能发生的现象。
古典概型;只有有限个不同的基本事件,各基本事件发生的概率相等。
古典概率;假定在某随机试验n个基本事件发生的可能性相等。
条件概率;在事件A发生的条件下,B事件发生的概率。
统计概率;假定在相同或相似条件下,重复进行同一个实验,某一时间A发生的次数与总观察次数n之比值a/n,当a-无穷是稳定接近的值p就叫统计概率。
组中值;在次数分布表中,将观察值分组后,每一组的终点值。
概率函数;随机变量y去任意一个实数值Yi的概率p(y=Yi)也可以用函数f(y)表述。
累计函数;随机变量y取值小于等于某一实数值Yi的概率p(y>=Yi)也可以用函数f(y)表述。
标准差;方差的正平方根之,用以表示资料的变异度,
复置抽样;将抽得的个体放回总体后再继续抽样。
标准误;抽样分布的标准差。度量抽样分布的变异。
差数标准差;两个的样本平均数差数分布的标准误。
综合实验;研究一定条件下各种因素最优组合的综合效应。
正态离差;以一个新变数u代y变数,即将y离平均数的差数以σ为单位转换,于是u=(y-u)/σ称作正态离差。
无偏估计值:如果参数所有样本的某一统计数的平均数等于总体的相应参数
(1)样本平均数是总体平均数的无偏估计值
(2)样本方差是总体方差的无偏估计值
(3)样本标准差不是总体的标准差的无偏估计值
抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。
局部控制;将整个试验环境分成若干个相对最为一致的小环境,再在小环境内设置成套处理。
随机排列;一个区组中每一处理都有相等的机会设置在任何一个试验小区章,避免任何主观成见。
试验因素:试验中所研究的影响试验指标的原因或原因组合,简称为因素或因子。
试验处理:指对受试对象给予某种外部干预(或措施),是试验实施因子水平的一个组合。可分为单因素处理和多因素处理。
试验单位:试验中能接受不同试验处理的的试验载体。实际上就是根据目的而确定的观测总体。
方差分析的基本假定:正态性、可加性、误差同质性
数据转换:平方根转换、对数转换、反正弦转换、倒数转换
试验小区:在田间试验中,安排一个处理的小块地段称为试验小区。
试验方案:按试验目的要求所拟定的进行比较的一组试验处理的总称。
试验指标:试验中用来衡量各种处理效果的好坏的指标,
边际效应:小区两边或两端的植株因有较大的空间而表现出的生长优势
保护行:为了使试验在较为均匀的环境下安全进行,在试验地周围种植同种作物品种的保护地段。
主效应:是指由于因素水平的改变而造成因素效应的改变。
互作:是指两个或两个以上处理因素间的相互作用产生的效应。
正态分布;一种重要的连续型随机变量的概率分布计量。
试验方案:根据试验目的要求所拟定的进行比较的一组试验处理的总称。
性试验序列;在相同的试验条件下,进行的一系列随机试验,观察某事件A发生与否,若每次试验结果相互,则这样的一系列试验成为性试验序列。
二次分布;多次贝努利试验中的事件A在其中若干次发生的概率所表现出来的多点分布类型。
贝努利概型:干查一次贝努利试验时(仅有两种可能的结果),事件A发生的概率与其对立事件发生的概率所表现出来的两点分布。
均方:用观察值数目除以离均平方和,得到平均的离均差平方
贝努利试验:对随机试验中某事件是否发生,试验可能结果只有两个,这种种有两种可能结果的试验称为贝努利试验
完全事件系:若事件A1,A2、、、、、、、An两两互斥,且每次试验结果必发生其一,则称A1,A2、、、、、、、An为完全事件系。
样本个数Nn:若从容量为N的有限总体抽样,若每次抽取的容量为n,可得样本个数Nn
观察值:观察每次随机试验的结果所获得的实数值,或观察实际个体在某一性状上具体表现的数值,也叫原始数据。
统计量:由样本全部个体的观察值参与计算得到的特征数。
母总体:在进行抽样研究时,以一定容量n 抽取样本时所依赖的、参数μ、σ已有定值的总体,如均匀总体、二项总体。
衍生总体 :进行抽样研究时,以一定容量n从某一总体中抽得样本的统计量如平均数、总和数等为个体构成的新总体。
准确度:总体标准误与样本平均数比值的百分数,是反映观察值与真值接近程度的相对数。
精确度:样本标准误与样本平均数比值的百分数,是反映观察值彼此接近程度的相对数。
简答题:
1、计算反映样本所有个体在某一性状上的数量变异指标时,为什么不用平均偏差 (即离均差的绝对值汇总后求平均)而一定要用标准差S?
类似问题:计算反映总体所有个体在某一性状上的数量变异指标时,为什么不用平均误差而一定要用标准差σ?
①对单个样本而言,只有先计算S再算出S Ӯ才能将Ӯ-μ转化为标准化变量t。
② 对两个样本而言,只有先算出 S1和 S2 再计算 S Ӯ1-Ӯ2才能将(Ӯ1- Ӯ2)-(μ1-μ2)转化为标准化变量t。
2根据抽样分布理论,“误差的大小与重复次数的平方根成反比”,这种说法错在哪里?类似问题:样本观察值的变异幅度和样本平均数的变异幅度怎么理解?
该两个字:标准误(替换“误差” )
或改四个字:抽样误差(替换“误差” ) 变异幅度(替换“大小” )
测验“两个样本所属的总体平均数有无显著性差异”的说法错在哪里?
去掉五个字:“所属的总体”
3、“右尾临界F值表是专供测验S12的总体方差是否显著大于S22的总体方差而设计的”,这种说法错在哪里?
类似问题:F检验是用于两个样本间方差的比较,那么χ2检验也可以不?
去掉两处的五个字:“的总体方差”
4、在显著性检验中,两个样本平均数的差数Ӯ 1-Ӯ2和两个样本配对观察值差数的平均数đ能否视为同一概念?为什么?
类似问题:当两个样本观察值个数一样多时,Ӯ 1-Ӯ2和d数值上相等,此时能否将两者视为同一概念呢?
① 不能视为同一概念。
② Ӯ 1-Ӯ 2特指由成组数据算得。
③ d专指由成对数据算得。
5、什么是显著性检验的Ⅰ类错误、Ⅱ类错误?
1)第一类错误(弃真错误):如果H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误
2)第二类错误(纳伪错误):如果H0不是真实的,假设检验时却接受了H0,否定了HA,这样就犯了接受不真实假设的错误。
6、将配对数据(即成对数据)按非配对数据(即成组数据)进行显著性检验会出现什么后果?
类似问题:为什么同一份数据,有时用成对数据比较,有时用成组数据平均数比较?将配对数据(即成对数据)按非配对数据(即成组数据)进行显著性检验时,为什么查t0.05的自由度为两个自由度之和?
犯Ⅱ类错误的可能性增加,不难证明:同一份数据资料按成组数据算出的标准误 总是超过按成对数据算出的标准误Sd ,因而使得t值总是偏小!
7、试验统计中试验误差的类型有那些,其特点是什么?
系统误差、随机误差。
系统误差;定向性、人为性,可消除。
随机误差;不可避免,只能减少不能消除。可以定量估计y-u任一取值范围的概率,直接影响试验的精确度。
8、试述“非零”统计假设在显著性检测中的一意义?
非零统计假设用于判断两个样本的总体平均数的差值大小,用非零统计假设往往能使H0更有实用性,应为针对他进行检验后获得的信息更为准确。
9、拉丁方试验一定要求正方形试验地吗 ?为什么
不是,拉丁方试验要求整块平坦的地,但并不要求试验地为正方
形。,恰恰小区长方形居多而要求长方形。
10、在提高试验效率方面,正交设计和裂区设计各有何优势?
裂区;是通过主副区设置简化试验统计分析过程来提高效率的。正交设的计是通过减少诸多不重要的处理组合来提高效率
11.怎样用方差分析法检验处理间倍数关系的显著性?
针对数据的主要缺陷,进行数据转换,恢复其可加性,再做数据分析。
12、根据方差分析的原理,误差均方MSe的实质是什么?
扣除了各种试验原因所引起的变异后的剩余变异平均值。
13、结合可控因素效应阐述平方和的分解原理。
实验误差可分为系统误差和偶然误差,有可控因素效应,系统误差效应课转换为处理效应和区组效应,顾平方和的分解原理可表示为总SST=处理SSt+区组SSr+误差SSe。
14、结合方差分析的原理和条件简述平方和SS的可加性。
方差分析是建立在一定的线性可加性模型基础上的,所有进行方差分析的数据都可分为几个分量之和,一般具有三个原因;1、处理原因或效应2、区组效应或原因3、试验误差。处理效应和区组效应具有可加性,三类原因相互。
15、S多个处理平均数间的相互比较为什么不宜用t检验?
t检测即LSD法。是根据两个样本平均差数(k=2)的抽样分布提出的,它只适用于k=2的检验,当k>2时LSD法可能会夸大最大与最小两个样本平均差数的显著性,即在统计推理时犯第一类错误。
16、LSR法与LSD法进行的多重比较有什么不同?
因为LSD法是根据两个样本平均差数的绝对值与LSDa进行比较,LS R法是将k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数的极差分别确定最小显著极差值LSRa值。当k=2时,法和法的显著尺度完全相同,当k>=3时法的显著尺度低于法。
17多重比较为什么不宜再使用LSD法?
因为LSD法是根据两个样本平均差数(k=2)的抽样分布提出的,当k>2时LSD法可能会夸大最大与最小两个样本平均差数的显著性,即在统计推理时犯第一类错误。
18、就正交表阐述正交性的含义。
任意一列各水平出现的次数相等,任意一列每一水平与其他任何一列的各水平相遇在同一行中的次数相等。即重复次数和配对次数相等、
19、试验统计中为什么要求正交试验也要设置重复?
因为田间试验受到许多难以控制的随机因素干扰,实验误差较大,由处理组合类的变异或处理与区间交互作用所估计的试验误差与由试验因素见得高级交互作用过估计的实验误差有时在性质上和层次有很大的差异,因而要求正交试验也要设置重复。
正交表在试验统计中是否只用于正交试验?为什么?
不是,正交表还可用与在有表可套的复因素试验结果分析中。
20、拉丁方在试验统计中是否只用于拉丁方试验?为什么?
26.不是,因为拉丁方重叠可构成正交表,用于正交试验以及在有表可套的复因素试验结果分析中。
21、正交表的表头设计对正交试验结果的分析有何影响?
正交实验的表头设计 表头设计是正交设计的关键,表头设计合理课大大的简化结果分析的过程,且使结果更加精确;若表头设计不合理,主效与交作混杂,难以对结果做出全面分析推论。
22、正交表在有表可套的复因素试验结果分析中的作用与其在正交试验中所起的作用有何异同
同;在两种试验中都可简化其分析过程。
异;正交表参与方差分析过程中,处理平方和SSt的再分解步骤异常简洁、直观;
在有表可套的复因素试验中,算的的空列SS、DF或其累加值就是相应的互作效应SS、DF值,这使按SSt再分解原理算得的剩余SS、DF值可与之佐证。
试验设计基本原理:重复、随机和局部控制
1)重复:同一处理所放置的试验单元数,即同一处理种植的小区数
2)随机:每一重复的每一处理都有同等的机会放在任何一个试验小区上。
3)局部控制:将整个试验空间分成若干个各自相对均匀的局部(区组)