Проверка Чоу (Chow test) на равенство параметров регрессии
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 | * Тема: Проверка Чоу (на равенство регрессионных уравнений в нескольких группах). * Ключевые слова: равенство параметров регрессии, группы, Чоу, Chow, test, проверка, тест, SPSS, F, REGRESSION, число степеней свободы, сумма квадратов. * Опубликован: 10.10.2001, перевод: 01.11.2008. * Автор: David Matheson (Техническая поддержка SPSS) / SPSS AnswerNet. * Перевод: А. Балабанов. * Размещение: http://www.spsstools.ru/Syntax/RegressionRepeatedMeasure/ChowTest.txt (.sps). * Проверено: SPSS 15.0.0. *(Вопрос) В службу поддержки поступил запрос о выполнении проверки Чоу (CHOW Test) в SPSS. Если хотите узнать о том, что это такое и получить подробные объяснения, вам сюда: http://www.stata.com/support/faqs/stat/chow.html (Нет, это не реклама конкуренту, тем более, что для Stata это тоже нестандартная статистика) * Здесь приводится перевод комментариев к одному из двух решений, размещенных в оригинальном файле (http://www.spsstools.net/Syntax/RegressionRepeatedMeasure/ChowTest.txt). Второе (отсутствующее в данной версии) решение предполагает использование процедуры UNIANOVA для проведения данной проверки. В его описании делается ссылка на службу технической поддержки SPSS. Мой опыт использования второго решения показал, что оно даёт результаты, отличные от тех, что даёт решение через процедуру REGRESSION, описанное ниже (см. мой вопрос в SPSSX-L: http://listserv.uga.edu/cgi-bin/wa?A2=ind0704&L=spssx-l&D=1&P=39668). Алгоритм же приведённого решения также имеет ссылку на техподдержку SPSS, но совпадает с другими описаниями схемы проверки Чоу (см., например, ссылку выше на Stata.com). Кроме того, в настоящее время (ноябрь 2008) на сайте технической поддержки SPSS находится лишь решение на основе процедуры REGRESSION. По этим причинам я оставил здесь именно это решение. Если вы можете дать комментарий к решению на основе процедуры UNIANOVA, буду признателен - примеч. перев. Решение 100000298 : Проверка Чоу на равенство наборов регрессионных коэффициентов между группами Вопрос. Какова формула для проверки Чоу на равенство регрессионных параметров для разных групп наблюдений? Можно ли этот тест выполнить в SPSS? Ответ. В SPSS нет процедуры или подкоманды, которые бы назывались проверкой Чоу. Но этот тест можно легко выполнить с помощью процедуры регрессии (REGRESSION). Проверка Чоу позволяет ответить на вопрос, можно ли считать наборы параметров регрессионных уравнений (константа, наклон), построенные для разных групп наблюдений, одинаковыми. Допустим, мы используем переменную SALNOW из примера данных bank.sav для SPSS for Windows в качестве зависимой переменной, а переменную EDLEVEL - в качестве предиктора. Допустим, мы также хотим знать, равны ли параметры такого регрессионного уравнения для мужчин и женщин. * См. Employee data.sav и переменные salary, educ, minority, соответственно, как пример с аналогичной описанной структурой данных. * Либо, если хотите использовать именно пол как группирующий признак, перекодируйте из переменной gender m - в 0, f - в 1. - примеч. перев. Алгоритм для проверки Чоу следующий: 1. Выполним регрессию, не делая разделения на мужчин и женщин. Запомним сумму квадратов остатков и число степеней свободы. Обозначим их как RSS1 и DF1. 2. Запустим регрессию отдельно сначала для мужчин, потом - для женщин и найдём сумму сумм квадратов остатков по двум запускам, а также - сумму степеней свободы. Обозначим эти величины как RSS2 и DF2. 3. Найдём (RSS1 - RSS2)/(DF1 - DF2). 4. Поделим результат из предыдущего шага на RSS2/DF2 и найдём частное в F-распределении c числами степеней свободы (DF1-DF2) и DF2. Нулевая гипотеза в данном случае такова, что коэффициенты регрессии не зависят от пола. Можно выполнить эту проверку в процедуре SPSS REGRESSION. Там же можно выполнить и отдельные проверки на равенство только констант, либо только коэффициентов наклона для регрессий в разных группах по полу. Группирующая переменная должна быть закодирована как двоичная ("0" для одной группы и "1" для другой). В файле bank.sav переменная SEX уже имеет такую форму, при этом 1 обозначает группу женщин. Построим эффект взаимодействия как произведение предиктора и пола (EDLEVEL и SEX). Сначала выполним REGRESSION лишь с предиктором EDLEVEL. Затем пол и взаимодействие (названное EDSEX в данном примере) включаются в модель на втором шаге (во второй подкоманде METHOD=ENTER). Запрашиваем изменение R-квадрат с помощью ключевого слова CHA в подкоманде /STATISTICS. Это также даст нам проверку на то, что изменение R-квадрат больше нуля. Эта проверка эквивалентна проверке Чоу как мы её выполнили в п. 1-4 выше. Стандартная выдача процедуры REGRESSION также предоставляет проверки и доверительные интервалы для коэффициентов перед SEX и EDSEX, которые дают поправки к модели для респондентов женского пола. Вид команды REGRESSION для выполнения такого анализа представлен ниже. COMPUTE edsex = edlevel * sex . REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING LISTWISE /STATISTICS COEFF OUTS CI R ANOVA END CHA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT salnow /METHOD=ENTER edlevel /METHOD=ENTER sex edsex. То же самое можно сделать и не через синтаксис, а через диалоговые окна (GUI). Команда REGRESSION может быть запущена через меню Regression->Linear в SPSS. Эффект взаимодействия требуется предварительно посчитать через меню Transform->Compute. Несколько блоков переменных можно ввести в модель, используя кнопку Next (над списком независимых переменных в главном диалоговом окне регрессии) по завершении ввода очередного блока переменных. Запрос статистики "Изменение в R-квадрат" (CHA) можно сделать через диалог Statistics, вызываемый из основного окна регрессии. В версиях SPSS, более ранних, чем 7.5, запросить CHA через диалоговые окна нельзя. Простейший способ обойти это препятствие - задать максимум спецификаций модели в диалоговых окнах, вставить командный синтаксис, а затем дополнить подкоманду Statistics ключевым словом CHA. Если имеется K групп, в которых надо сравнить регрессионные коэффициенты, вам следует создать K-1 двоичную переменную, а затем умножить каждую из них на независимый предиктор (предикторы) для создания K-1 эффекта взаимодействия (или K-1 набора эффектов взаимодействия). Проверка Чоу представлена в статье Gregory Chow 'Tests of Equality Between Sets of Coefficients in Two Linear Regressions', Econometrica, 1960, 28(3), 591-605. Обсуждение подхода на основе двоичных переменных для проверки Чоу см. в двух статьях Damodar Gujarati в журнале The American Statistician: 1970, 24(1), 50-52; и 1970, 24(5), 18-22. |