效应量怎么报告(解读方差分析中的效应量)

2023-09-10 14:13:00 来源 : haohaofanwen.com 投稿人 : admin

下面是好好范文网小编收集整理的效应量怎么报告(解读方差分析中的效应量),仅供参考,欢迎大家阅读!

效应量怎么报告

1.方差分析的效应量

效应量就是实验处理的效果。处理的效果有多大,可以从效应量反映出来。例如,在t检验中,最直观的就是比较两个处理的均值(均值差除以标准差)。

在方差分析中,由于处理数大于2,通过两两比较均值来反应效应量不太恰当,所以需要一个全局的效应量。此时,用处理的变异与总体的变异比值,可以很好的反应处理的效果。

在总体中,使用方差表示变异,用omega_{effect}^2表示效应量:

omega_{effect}^2=dfrac{sigma_{effect}^2}{sigma_{total}^2}tag{1.1}

上述公式适用于单因素和多因素的方差分析。例如,在两因素方差分析中,A因素的效应量为:

omega_{A}^2=dfrac{sigma_{A}^2}{sigma_{total}^2} \

1.2 偏效应量

完全效应量的分母是总体的方差,也就是说,A因素的效应量大小受到了其他因素变异的影响。如果想要排除这种影响,得到“纯净”的A因素效应量,可以使用偏效应量omega_{(A)}^2:(此处下标用括号表示偏效应量,下同)

omega_{(A)}^2=dfrac{sigma_{A}^2}{sigma_{A}^2+sigma_{error}^2}tag{1.2}

1.3 效应量的估计

由于总体的方差是未知的,公式1.1和1.2只是理论公式,并不能实际运用。如果要使用样本数据来估计效应量,有以下几种方法:

1.3.1 最常用的eta^2

eta^2是最为常用的效应量,SPSS报告的就是偏eta^2。其计算与公式1.1和公式1.2非常类似,只是使用了样本的平方和代替总体方差作为变异。

完全eta^2:

eta_A^2=dfrac{SS_A}{SS_T}tag{1.3}

可见,此时的eta^2与线性回归中的决定系数R^2是一致的,所以有时也使用R^2来表示。

偏eta^2:

eta_{(A)}^2=dfrac{SS_A}{SS_A+SS_E}tag{1.4}

公式1.3与1.4计算非常方便,但是在paper中通常不会报告平方和,只会报告F值。这时,我们可以用等价的公式,利用F值计算偏eta^2

begin{align*} eta_{(A)}^2&=dfrac{SS_A}{SS_A+SS_E}\[2ex] &=dfrac{F_Atimes MS_Etimes df_A}{F_Atimes MS_Etimes df_A+MS_Etimes df_E}\[2ex] &=dfrac{F_Atimes df_A}{F_Atimes df_A+df_E}tag{1.5} end{align*}

同理,也可以计算完全eta^2。

1.3.2 不常用但更准确的hatomega^2

eta^2虽然最为常用(SPSS, G*POWER都使用),但它是有偏的,通常会高估效应量。可以想象一下,假设效应完全不存在,但由于抽样误差,SS_A不可能为0,所以计算出来的eta^2肯定是大于0的。

如果要更为准确的估计效应量,可以使用hatomega^2

偏效应量的计算如下:

begin{align*} hatomega_{(A)}^2&=dfrac{df_A(F_A-1)}{df_A(F_A-1)+N}tag{1.6} end{align*}

其中N是总的样本量。

可见,hatomega_{(A)}^2与eta_{(A)}^2相比,用F_A-1代替F_A。当效应量完全不存在时,F_A会非常接近1,使得hatomega_{(A)}^2变得很小,估计得更为准确。

不过,当样本量非常大时,hatomega_{(A)}^2与eta_{(A)}^2非常接近。所以,hatomega_{(A)}^2通常在样本量较小时使用。

1.3.3 更加直观的Cohen's f​

以因素A的主效应为例

当方差分析的零假设成立(alpha_i=0)时,F_A=dfrac{MS_A/df_A}{MS_E/df_E}服从自由度为(df_A,df_E)的F分布。

但如果是备择假设成立(alpha_ineq 0)时,F_A服从的是自由度为(df_A,df_E)的非中心F分布,非中心参数为

lambda=Ndfrac{sigma_A^2}{sigma_E^2}tag{1.7}

其中N是总样本量。所谓非中心参数,可以简单理解为偏离原来F分布的程度,只不过此时F分布的形态也会发生变化,而不像正态分布那样只是简单的平移。如图:

图中红线就是零假设成立时的F分布,蓝线是非中心F分布。

此时,令:f_{(A)}^2=dfrac{sigma_A^2}{sigma_E^2},f称为Cohen‘s f。

与公式1.2相比,得到:

f_{(A)}^2=dfrac{omega_{(A)}^2}{1-omega_{(A)}^2} \

如果用偏eta^2 来估计偏omega^2,得到

f_{(A)}^2=dfrac{eta_{(A)}^2}{1-eta_{(A)}^2}=dfrac{SS_A}{SS_E}=F_Atimes dfrac{df_A}{df_E}tag{1.8}

同理,也可以用偏hatomega^2来估计

得到f以后,便可以通过f来估计lambda ,此时有两种方法

方法一:用公式1.7直接估计(G*POWER3.1使用这种方法)

方法二:将公式1.7中的N替换成误差自由度df_E(SPSS使用这种方法)

方法二估计出来的非中心参数比方法一要低一些,如果进一步估计Power的话,也会较低。

实验结束后,便可以根据数据结果估计效应量,进一步计算非中心参数。得到了非中心参数后,上图蓝色的分布就可以确定了(蓝色分布与红色分布的区别就在于非中心参数)。此时,便可以根据预设的alpha确定的临界值,在蓝色分布中确定beta。

数据实例

某研究者进行了一项两因素完全随机设计,其中A因素有2个水平,B因素有3个水平,共6个处理。每个处理之下有5个被试。数据如下:

对数据进行两因素方差分析得到:

factorA=factor(c(rep(1,15),rep(2,15)))factorB=factor(c(rep(1,5),rep(2,5),rep(3,5),rep(1,5),rep(2,5),rep(3,5)))value=c(2,1,4,4,2,        3,4,4,5,1,        5,7,7,3,6,        8,10,12,11,6,        6,4,3,3,2,        3,4,4,5,3)df=data.frame(factorA,factorB,value)model_aov=aov(value~factorA*factorB)summary(model_aov)> summary(model_aov)                Df Sum Sq Mean Sq F value   Pr(>F)    factorA          1  22.53   22.53   8.611  0.00725 ** factorB          2  31.27   15.63   5.975  0.00784 ** factorA:factorB  2 101.27   50.63  19.350 9.89e-06 ***Residuals       24  62.80    2.62                     ---Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

根据alpha=0.05各效应对应的临界F值为:F_{(1,24,0.05)}=4.260;F_{(2,24,0.05)}=3.403

估计各效应的偏eta^2:

eta_{(A)}^2=dfrac{F_Atimes df_A}{F_Atimes df_A+df_E}=dfrac{8.611times1}{8.611times 1+24}=0.264

eta_{(B)}^2=dfrac{F_Btimes df_B}{F_Btimes df_B+df_E}=dfrac{5.975times2}{5.975times 2+24}=0.332

eta_{(Atimes B)}^2=dfrac{F_{Atimes B}times df_{Atimes B}}{F_{Atimes B}times df_{Atimes B}+df_E}=dfrac{19.350times2}{19.350times 2+24}=0.617

根据公式1.7,1.8,进一步计算出各效应的非中心参数

lambda_A=Ntimes dfrac{eta_{(A)}^2}{1-eta_{(A)}^2}=30times dfrac{0.264}{1-0.264}=10.761

lambda_B=Ntimes dfrac{eta_{(B)}^2}{1-eta_{(B)}^2}=30times dfrac{0.332}{1-0.332}=14.910

lambda_{Atimes B}=Ntimes dfrac{eta_{({Atimes B})}^2}{1-eta_{({Atimes B})}^2}=30times dfrac{0.617}{1-0.617}=48.329

接下来,计算非中心分布中,F临界值对应的概率,即为beta值。

> pf(4.260,1,24,ncp = 10.761)[1] 0.1177001> pf(3.403,2,24,ncp = 14.910)[1] 0.08957654> pf(3.403,2,24,ncp = 48.329)[1] 1.500473e-05

​ 1-beta就得到了power

3. 实验开始之前:推算样本量

根据1.9式,要推算样本量,需要知道非中心参数lambda和效应量f,eta ^2或hatomega^2 (三个效应量可以互相推导)。

其中效应量可以通过以往的研究,或者自己实施的预实验结果来估计。利用F值可以根据1.5式计算出eta ^2,进而1.8式计算出f^2。

非中心参数的估计就要复杂得多。可以通过查表(现在基本不用了)或者G*POWER计算。非中心参数可以通过以下因素进行计算:

显著性水平alpha:一般使用确定的0.05

统计检验力1-beta:研究者自己设定

效应量:通过以往研究进行估计

分子的自由度:实验设计时确定(自变量有几个水平自己肯定清楚)

实验处理的数量:实验设计时确定

实际上,alpha,beta以及效应量都与N有关,因为N影响了自由度,从而影响了F分布的形态,只有这三个值都确定以后,才能确定非中分参数。

数据实例

将之前的例子作为一个预实验,可以看到A因素的Power为1-beta=1-0.118=0.882,如果我想要将A因素的Power提升到0.95,正式实验中需要多少样本量呢?此时

alpha=0.05

1-beta=0.95

效应量f=sqrt{dfrac{eta_{(A)}^2}{1-eta_{(A)}^2}}=0.599

df_A=1

一共6个处理

在G*Power中,将已知数据输入,直接就可以得到结果,如图:

可见,此时需要的样本量为39,但由于一共有6个处理,为了保证等组设计,需要总样本量为6的倍数。实际研究中,一共需要42人,每组7人。

小结

方差分析效应量中最常用的是偏eta^2

实验前推断样本量需要自定义alpha和beta,并根据以往研究得到效应量

实验后需要根据非中心参数估计Power


相关文章

    暂无相关信息
专题分类