Статистика на основе t-критерия: эффект, неперекрытие, мощность

* Тема: Статистика на основе t-критерия: эффект, неперекрытие, мощность.
* Ключевые слова: t-критерий, t-проверка, t-test, t-тест, величина эффекта, effect size, неперекрываемость, nonoverlap, мощность критерия, statistical power.
* Опубликован: ?, перевод: 27.10.2008.
* Автор: Valentim R. Alferes (Университет Коимбра, Португалия), valferes@fpce.uc.pt.
* Перевод: А. Балабанов.
* Размещение: http://www.spsstools.ru/Syntax/T-Test/t-test.txt (.sps).
* Проверено: SPSS 15.0.0.

************************************************************************
**
** Синтаксис осуществляет проверку гипотезы о равенстве средних по двум независимым выборкам
** на основе t-критерия и вычисляет показатели величины эффекта, показатели неперекрываемости распределений и наблюдённую мощность.
**
** Выдача разделяется на 4 части:
**
** ЧАСТЬ I - стандартная выдача SPSS для t-проверки:
** - описательная статистика;
** - проверка Ливина (Leven) на равенство дисперсий 
** - t-критерий равенства средних (случаи предполагаемого равенства и неравенства дисперсий);
** - доверительный интервал для разности средних.
**
** ЧАСТЬ II - показатели величины эффекта:
** - d Кохена (Cohen's d, D);
** - Коррекция Хеджеса (Hedges, D_H);
** - точечно-бисериальная корреляция r (R);
** - квадрат точечно-бисериальной корреляции (R2);
** - биномиальный показатель величины эффекта (Binomial Effect Size Display, BESD_LO и BESD_UP).
**
** ЧАСТЬ III - показатели неперекрываемости распределений (см. Cohen, 1988, pp. 21-23):
** - U1 (процент неперекрывающихся плотностей двух распределений);
** - U2 (процент наибольших значений из группы 1, превосходящих такой же процент наименьших значений из группы 2);
** - U3 (соотношение процентилей = процентиль из распределения группы 2, соответствующий значениям из
**   50-го процентиля распределения группы 1).
**
** ЧАСТЬ IV - наблюдённая мощность критерия (см. алгоритм в Borenstein et al., 2001):
** - N1, N2 - размеры выборок, гармонический N (N_HARM);
** - альфа (ALFA) и наблюдённая мощность (OPOWER).
** 
** Если у пользователя имеются исходные данные (по каждому наблюдению в отдельности), он должен воспользоваться
** методом 1, если же у него есть только агрегированные данные (например, из журнальной статьи), он должен воспользоваться 
** методом 2.

************************************************************************

** МЕТОД 1: анализ исходных данных.

** Перед запуском синтаксиса данные должны быть загружены в редактор данных SPSS; в нём должны существовать
** две переменные числового типа:
** IV – независимая переменная (которая определяет совокупности: 1 = группа 1; 2 = группа 2):
** DV – зависимая переменная (для которой считаем средние).

* Задайте доверительный уровень доверительного интервала для разности средних
* (по умолчанию доверительный уровень = .95).
T-TEST GROUPS=IV(1 2)/VARIABLES=DV/CRITERIA=CIN(.95).
GRAPH/BAR(SIMPLE)=MEAN(DV) BY IV.
GRAPH/ERRORBAR(CI 95)=DV BY IV
 /TITLE='Доверительные интервалы для средних'.
AGGREGATE/OUTFILE=*/BREAK=iv/m2=MEAN(dv)/dp2=SD(dv)/N2=N.
COMPUTE N1=LAG(N2,1).
COMPUTE M1=LAG(M2,1).
COMPUTE DP1=LAG(DP2,1).
EXECUTE.
SELECT IF(IV=2).
EXECUTE.

* Задайте альфу для вычисления наблюдённой мощности
* (по умолчанию ALFA = 0.05).
COMPUTE ALFA = 0.05.
COMPUTE SP2=(((N1-1)*(DP1**2))+((N2-1)*(DP2**2)))/(N1+N2-2).
COMPUTE T=(M1-M2)/SQR(SP2*((1/N1)+(1/N2))).
COMPUTE GL=N1+N2-2.
COMPUTE R=T/SQR((T**2)+GL).
COMPUTE R2=R**2.
COMPUTE D=T*SQR((1/N1)+(1/N2)).
COMPUTE D_H=D*(1-(3/(4*(N1+N2)-9))).
COMPUTE BESD_LO=.50-(R/2).
COMPUTE BESD_UP=.50+(R/2).
COMPUTE U3=CDF.NORMAL(D,0,1)*100.
COMPUTE U2=CDF.NORMAL((D/2),0,1)*100.
COMPUTE U2X=CDF.NORMAL((ABS(D)/2),0,1).
COMPUTE U1=(2*U2X-1)/U2X*100.
COMPUTE N_HARM=(2*N1*N2)/(N1+N2).
COMPUTE NCP=ABS((D*SQR(N_HARM))/SQR(2)).
COMPUTE T_ALPHA=IDF.T(1-ALFA/2,GL).
COMPUTE POWER1=1-NCDF.T(T_ALPHA,GL,NCP).
COMPUTE POWER2=1-NCDF.T(T_ALPHA,GL,-NCP).
COMPUTE OPOWER=POWER1+POWER2.
FORMATS ALL(F8.4) N1 N2(F8.0) U1 U2 U3(F8.1).
SUMMARIZE/TABLES=D D_H R R2 BESD_LO BESD_UP/FORMAT=NOLIST TOTAL
 /TITLE='ЧАСТЬ II - показатели величины эффекта'/CELLS=FIRST.
SUMMARIZE/TABLES=U1 U2 U3/FORMAT=NOLIST TOTAL
 /TITLE='ЧАСТЬ III - показатели неперыкрываемости'/CELLS=FIRST.
SUMMARIZE/TABLES=N1 N2 N_HARM ALFA OPOWER/FORMAT=NOLIST TOTAL
 /TITLE='ЧАСТЬ IV - наблюдённая мощность'/CELLS=FIRST.

************************************************************************

** МЕТОД 2: Воспроизведение в SPSS выдачи t-проверки по опубликованным агрегированным данным.

* Заполните две строки файла данных следующими статистиками:
* N - число наблюдений в группе, M - среднее значение группы, SD - стандартное отклонение в группе.
DATA LIST LIST /N(F8.0) M(F8.2) SD(F8.2).
BEGIN DATA
17  7,46  1,98
15  5,34  2,14
END DATA.
COMPUTE IV=$CASENUM.
LOOP ID=1 TO N.
XSAVE OUTFILE=XOUT1.
END LOOP.
EXECUTE.
GET FILE=XOUT1.
COMPUTE DV=M.
COMPUTE K=SQR((SD**2*(N-1))/2).
IF (ID=1) DV=M+K.
IF (ID=2) DV=M-K.
EXECUTE.

* Задайте доверительный уровень доверительного интервала для разности средних
* (по умолчанию доверительный уровень = .95).
T-TEST GROUPS=IV(1 2)/VARIABLES=DV/CRITERIA=CIN(.95).
GRAPH/BAR(SIMPLE)=MEAN(DV) BY IV.
GRAPH/ERRORBAR(CI 95)=DV BY IV
 /TITLE='Доверительные интервалы для средних'.
AGGREGATE/OUTFILE=*/BREAK=IV/N2=MEAN(N)/M2=MEAN(M)/DP2=MEAN(SD).
COMPUTE N1=LAG(N2,1).
COMPUTE M1=LAG(M2,1).
COMPUTE DP1=LAG(DP2,1).
EXECUTE.
SELECT IF(IV=2).
EXECUTE.

* Задайте альфу для вычисления наблюдённой мощности
* (по умолчанию ALFA = 0.05).
COMPUTE ALFA = 0.05.
COMPUTE SP2=(((N1-1)*(DP1**2))+((N2-1)*(DP2**2)))/(N1+N2-2).
COMPUTE T=(M1-M2)/SQR(SP2*((1/N1)+(1/N2))).
COMPUTE GL=N1+N2-2.
COMPUTE R=T/SQR((T**2)+GL).
COMPUTE R2=R**2.
COMPUTE D=T*SQR((1/N1)+(1/N2)).
COMPUTE D_H=D*(1-(3/(4*(N1+N2)-9))).
COMPUTE BESD_LO=.50-(R/2).
COMPUTE BESD_UP=.50+(R/2).
COMPUTE U3=CDF.NORMAL(D,0,1)*100.
COMPUTE U2=CDF.NORMAL((D/2),0,1)*100.
COMPUTE U2X=CDF.NORMAL((ABS(D)/2),0,1).
COMPUTE U1=(2*U2X-1)/U2X*100.
COMPUTE N_HARM=(2*N1*N2)/(N1+N2).
COMPUTE NCP=ABS((D*SQR(N_HARM))/SQR(2)).
COMPUTE T_ALPHA=IDF.T(1-ALFA/2,GL).
COMPUTE POWER1=1-NCDF.T(T_ALPHA,GL,NCP).
COMPUTE POWER2=1-NCDF.T(T_ALPHA,GL,-NCP).
COMPUTE OPOWER=POWER1+POWER2.
FORMATS ALL(F8.4) N1 N2(F8.0) U1 U2 U3(F8.1).
SUMMARIZE/TABLES=D D_H R R2 BESD_LO BESD_UP/FORMAT=NOLIST TOTAL
 /TITLE='ЧАСТЬ II - показатели величины эффекта'/CELLS=FIRST.
SUMMARIZE/TABLES=U1 U2 U3/FORMAT=NOLIST TOTAL
 /TITLE='ЧАСТЬ III - показатели неперыкрываемости'/CELLS=FIRST.
SUMMARIZE/TABLES=N1 N2 N_HARM ALFA OPOWER/FORMAT=NOLIST TOTAL
 /TITLE='ЧАСТЬ IV - наблюдённая мощность'/CELLS=FIRST.

************************************************************************
* Литература:
** Borenstein, M., Rothstein, H., & Cohen, J. (2001). SamplePower 2.0 
**    [Computer Manual]. Chicago: SPSS Inc.
** Cohen, J. (1988). Statistical power analysis for the behavioral 
**    sciences (2nd ed.). Hillsdale, NJ: Lawrence Erbaum.
************************************************************************.
...
Navigate from here