* Тема: Статистика на основе t-критерия: эффект, неперекрытие, мощность. * Ключевые слова: t-критерий, t-проверка, t-test, t-тест, величина эффекта, effect size, неперекрываемость, nonoverlap, мощность критерия, statistical power. * Опубликован: ?, перевод: 27.10.2008. * Автор: Valentim R. Alferes (Университет Коимбра, Португалия), valferes@fpce.uc.pt. * Перевод: А. Балабанов. * Размещение: http://www.spsstools.ru/Syntax/T-Test/t-test.txt (.sps). * Проверено: SPSS 15.0.0. ************************************************************************ ** ** Синтаксис осуществляет проверку гипотезы о равенстве средних по двум независимым выборкам ** на основе t-критерия и вычисляет показатели величины эффекта, показатели неперекрываемости распределений и наблюдённую мощность. ** ** Выдача разделяется на 4 части: ** ** ЧАСТЬ I - стандартная выдача SPSS для t-проверки: ** - описательная статистика; ** - проверка Ливина (Leven) на равенство дисперсий ** - t-критерий равенства средних (случаи предполагаемого равенства и неравенства дисперсий); ** - доверительный интервал для разности средних. ** ** ЧАСТЬ II - показатели величины эффекта: ** - d Кохена (Cohen's d, D); ** - Коррекция Хеджеса (Hedges, D_H); ** - точечно-бисериальная корреляция r (R); ** - квадрат точечно-бисериальной корреляции (R2); ** - биномиальный показатель величины эффекта (Binomial Effect Size Display, BESD_LO и BESD_UP). ** ** ЧАСТЬ III - показатели неперекрываемости распределений (см. Cohen, 1988, pp. 21-23): ** - U1 (процент неперекрывающихся плотностей двух распределений); ** - U2 (процент наибольших значений из группы 1, превосходящих такой же процент наименьших значений из группы 2); ** - U3 (соотношение процентилей = процентиль из распределения группы 2, соответствующий значениям из ** 50-го процентиля распределения группы 1). ** ** ЧАСТЬ IV - наблюдённая мощность критерия (см. алгоритм в Borenstein et al., 2001): ** - N1, N2 - размеры выборок, гармонический N (N_HARM); ** - альфа (ALFA) и наблюдённая мощность (OPOWER). ** ** Если у пользователя имеются исходные данные (по каждому наблюдению в отдельности), он должен воспользоваться ** методом 1, если же у него есть только агрегированные данные (например, из журнальной статьи), он должен воспользоваться ** методом 2. ************************************************************************ ** МЕТОД 1: анализ исходных данных. ** Перед запуском синтаксиса данные должны быть загружены в редактор данных SPSS; в нём должны существовать ** две переменные числового типа: ** IV – независимая переменная (которая определяет совокупности: 1 = группа 1; 2 = группа 2): ** DV – зависимая переменная (для которой считаем средние). * Задайте доверительный уровень доверительного интервала для разности средних * (по умолчанию доверительный уровень = .95). T-TEST GROUPS=IV(1 2)/VARIABLES=DV/CRITERIA=CIN(.95). GRAPH/BAR(SIMPLE)=MEAN(DV) BY IV. GRAPH/ERRORBAR(CI 95)=DV BY IV /TITLE='Доверительные интервалы для средних'. AGGREGATE/OUTFILE=*/BREAK=iv/m2=MEAN(dv)/dp2=SD(dv)/N2=N. COMPUTE N1=LAG(N2,1). COMPUTE M1=LAG(M2,1). COMPUTE DP1=LAG(DP2,1). EXECUTE. SELECT IF(IV=2). EXECUTE. * Задайте альфу для вычисления наблюдённой мощности * (по умолчанию ALFA = 0.05). COMPUTE ALFA = 0.05. COMPUTE SP2=(((N1-1)*(DP1**2))+((N2-1)*(DP2**2)))/(N1+N2-2). COMPUTE T=(M1-M2)/SQR(SP2*((1/N1)+(1/N2))). COMPUTE GL=N1+N2-2. COMPUTE R=T/SQR((T**2)+GL). COMPUTE R2=R**2. COMPUTE D=T*SQR((1/N1)+(1/N2)). COMPUTE D_H=D*(1-(3/(4*(N1+N2)-9))). COMPUTE BESD_LO=.50-(R/2). COMPUTE BESD_UP=.50+(R/2). COMPUTE U3=CDF.NORMAL(D,0,1)*100. COMPUTE U2=CDF.NORMAL((D/2),0,1)*100. COMPUTE U2X=CDF.NORMAL((ABS(D)/2),0,1). COMPUTE U1=(2*U2X-1)/U2X*100. COMPUTE N_HARM=(2*N1*N2)/(N1+N2). COMPUTE NCP=ABS((D*SQR(N_HARM))/SQR(2)). COMPUTE T_ALPHA=IDF.T(1-ALFA/2,GL). COMPUTE POWER1=1-NCDF.T(T_ALPHA,GL,NCP). COMPUTE POWER2=1-NCDF.T(T_ALPHA,GL,-NCP). COMPUTE OPOWER=POWER1+POWER2. FORMATS ALL(F8.4) N1 N2(F8.0) U1 U2 U3(F8.1). SUMMARIZE/TABLES=D D_H R R2 BESD_LO BESD_UP/FORMAT=NOLIST TOTAL /TITLE='ЧАСТЬ II - показатели величины эффекта'/CELLS=FIRST. SUMMARIZE/TABLES=U1 U2 U3/FORMAT=NOLIST TOTAL /TITLE='ЧАСТЬ III - показатели неперыкрываемости'/CELLS=FIRST. SUMMARIZE/TABLES=N1 N2 N_HARM ALFA OPOWER/FORMAT=NOLIST TOTAL /TITLE='ЧАСТЬ IV - наблюдённая мощность'/CELLS=FIRST. ************************************************************************ ** МЕТОД 2: Воспроизведение в SPSS выдачи t-проверки по опубликованным агрегированным данным. * Заполните две строки файла данных следующими статистиками: * N - число наблюдений в группе, M - среднее значение группы, SD - стандартное отклонение в группе. DATA LIST LIST /N(F8.0) M(F8.2) SD(F8.2). BEGIN DATA 17 7,46 1,98 15 5,34 2,14 END DATA. COMPUTE IV=$CASENUM. LOOP ID=1 TO N. XSAVE OUTFILE=XOUT1. END LOOP. EXECUTE. GET FILE=XOUT1. COMPUTE DV=M. COMPUTE K=SQR((SD**2*(N-1))/2). IF (ID=1) DV=M+K. IF (ID=2) DV=M-K. EXECUTE. * Задайте доверительный уровень доверительного интервала для разности средних * (по умолчанию доверительный уровень = .95). T-TEST GROUPS=IV(1 2)/VARIABLES=DV/CRITERIA=CIN(.95). GRAPH/BAR(SIMPLE)=MEAN(DV) BY IV. GRAPH/ERRORBAR(CI 95)=DV BY IV /TITLE='Доверительные интервалы для средних'. AGGREGATE/OUTFILE=*/BREAK=IV/N2=MEAN(N)/M2=MEAN(M)/DP2=MEAN(SD). COMPUTE N1=LAG(N2,1). COMPUTE M1=LAG(M2,1). COMPUTE DP1=LAG(DP2,1). EXECUTE. SELECT IF(IV=2). EXECUTE. * Задайте альфу для вычисления наблюдённой мощности * (по умолчанию ALFA = 0.05). COMPUTE ALFA = 0.05. COMPUTE SP2=(((N1-1)*(DP1**2))+((N2-1)*(DP2**2)))/(N1+N2-2). COMPUTE T=(M1-M2)/SQR(SP2*((1/N1)+(1/N2))). COMPUTE GL=N1+N2-2. COMPUTE R=T/SQR((T**2)+GL). COMPUTE R2=R**2. COMPUTE D=T*SQR((1/N1)+(1/N2)). COMPUTE D_H=D*(1-(3/(4*(N1+N2)-9))). COMPUTE BESD_LO=.50-(R/2). COMPUTE BESD_UP=.50+(R/2). COMPUTE U3=CDF.NORMAL(D,0,1)*100. COMPUTE U2=CDF.NORMAL((D/2),0,1)*100. COMPUTE U2X=CDF.NORMAL((ABS(D)/2),0,1). COMPUTE U1=(2*U2X-1)/U2X*100. COMPUTE N_HARM=(2*N1*N2)/(N1+N2). COMPUTE NCP=ABS((D*SQR(N_HARM))/SQR(2)). COMPUTE T_ALPHA=IDF.T(1-ALFA/2,GL). COMPUTE POWER1=1-NCDF.T(T_ALPHA,GL,NCP). COMPUTE POWER2=1-NCDF.T(T_ALPHA,GL,-NCP). COMPUTE OPOWER=POWER1+POWER2. FORMATS ALL(F8.4) N1 N2(F8.0) U1 U2 U3(F8.1). SUMMARIZE/TABLES=D D_H R R2 BESD_LO BESD_UP/FORMAT=NOLIST TOTAL /TITLE='ЧАСТЬ II - показатели величины эффекта'/CELLS=FIRST. SUMMARIZE/TABLES=U1 U2 U3/FORMAT=NOLIST TOTAL /TITLE='ЧАСТЬ III - показатели неперыкрываемости'/CELLS=FIRST. SUMMARIZE/TABLES=N1 N2 N_HARM ALFA OPOWER/FORMAT=NOLIST TOTAL /TITLE='ЧАСТЬ IV - наблюдённая мощность'/CELLS=FIRST. ************************************************************************ * Литература: ** Borenstein, M., Rothstein, H., & Cohen, J. (2001). SamplePower 2.0 ** [Computer Manual]. Chicago: SPSS Inc. ** Cohen, J. (1988). Statistical power analysis for the behavioral ** sciences (2nd ed.). Hillsdale, NJ: Lawrence Erbaum. ************************************************************************.