*~~~~~~~~~~~~~~~~~~~~~. *~~~~~~~~~~~~~~~~~~~~~. *~~~~~~~~~~~~~~~~~~~~~. * Статвывод для долей. *~~~~~~~~~~~~~~~~~~~~~. * 20 марта 2001 . *~~~~~~~~~~~~~~~~~~~~~. *~~~~~~~~~~~~~~~~~~~~~. *для справок см. Moore and McCabe (2001), Intro to the Practice of Statistics, глава 8. *-------------------------------------------------------------------------------. *-------------------------------------------------------------------------------. * Проверка гипотезы о доле в генеральной совокупности по большой выборке. * (см. Moore and McCabe (2001), Intro to the Practice of Statistics, стр. 588-591). *-------------------------------------------------------------------------------. MATRIX. COMPUTE n = {4040}. /* Введите сюда объём выборки (т.е. измените число в фигурных скобках)*/ COMPUTE x = {1992}. /* Введите число "успешных" исходов (определяет долю) (измените число в фигурных скобках)*/ COMPUTE p0 = {0.5}. /* Введите проверяемое значение доли в генеральной совокупности (измените число в фигурных скобках)/* *Далее синтаксис вычисляет статистку z и её значимость для значений n, x и p0, которые вы задали выше. *NB С этой строки вам больше ничего не следует изменять. COMPUTE p = x/n. COMPUTE SE_p0 = SQRT((p0*(1-p0))/n). COMPUTE z = (p - p0) /SE_p0. COMPUTE SIGz_2TL = 2 * (1 - CDFNORM(ABS(Z))). COMPUTE SIGz_LTL = CDFNORM(Z). COMPUTE SIGz_UTL = 1 - CDFNORM(Z). COMPUTE ANSWER = {n, p, SE_p0, z, SIGz_2TL, SIGz_LTL, SIGz_UTL}. PRINT ANSWER / FORMAT "F10.3" / CLABELS = n, p, SE, z, SIGz_2TL, SIGz_LTL, SIGz_UTL. END MATRIX. *В выводе выше: n - объём выборки, p - выборочная доля, SE - стандартная ошибка доли, z - статистика критерия, SIGz_2TL - двусторонняя значимость статистики, SIGz_LTL - левосторонняя значимость, SIGz_UTL - правосторонняя значимость - А.Б. *NB Если требуется получить значения статистик с большим/меньшим числом десятичных знаков, измените формат в предпоследней строке. *например, если требуется только 2 знака, укажите формат "F10.2". *-------------------------------------------------------------------------------. *-------------------------------------------------------------------------------. *-------------------------------------------------------------------------------. * Доверительный интервал для доли в генеральной совокупности по большой выборке. * (см. Moore and McCabe (2001), Intro to the Practice of Statistics, стр. 586-588). *-------------------------------------------------------------------------------. *Для вычисления обратного нормального распределения я использую аппроксимацию, представленную на http://www.hpmuseum.org/software/67pacs/67ndist.htm, которая была адаптирована по книге Abramowitz and Stegun, Handbook of Mathematical Functions, National Bureau of Standards 1970. MATRIX. COMPUTE n = {4040}. /* Введите сюда объём выборки (т.е. измените число в фигурных скобках)*/ COMPUTE x = {2048}. /* Введите число "успешных" исходов (определяет долю) (измените число в фигурных скобках)*/ COMPUTE CONFID = {0.99}. /* Введите желаемый доверительный уровень */ *Далее синтаксис строит доверительный интервал с параметрами, заданными выше. *NB С этой строки вам больше ничего не следует изменять. COMPUTE Q = 0.5 * (1-CONFID). COMPUTE A = ln(1/(Q**2)). COMPUTE T_ = SQRT(A). COMPUTE zstar = T_ - ((2.515517 + (0.802853*T_) + (0.010328*T_**2))/ (1 + (1.432788*T_) + (0.189269*T_**2) + (0.001308*T_**3))). COMPUTE phat = x/n. COMPUTE SE_phat = SQRT((phat*(1-phat))/n). COMPUTE m = zstar * SE_phat. COMPUTE LOWER = phat - m. COMPUTE UPPER = phat + m. COMPUTE ANSWER = {n, phat, zstar, SE_phat, Lower, Upper}. PRINT ANSWER / FORMAT "F10.5" /Title = "ДИ для доли в генеральной совокупности" / CLABELS = n, phat, zstar, SE, Lower, Upper. END MATRIX. *В выводе выше: n - объём выборки, phat - выборочная доля (точечная оценка генеральной доли), SE - стандартная ошибка доли, zstar - z-значение, соответствующее заданному доверительному уровню, Lower - нижняя граница ДИ, Upper - верхняя граница ДИ - А.Б. *NB Если требуется получить значения статистик с большим/меньшим числом десятичных знаков, измените формат в предпоследней команде. *например, если требуется только 2 знака, укажите формат "F10.2". *------------------------------------------------------------------------------. *------------------------------------------------------------------------------. *##############################################################################. *------------------------------------------------------------------------------. *------------------------------------------------------------------------------. * Проверка равенства долей в генеральных совокупностях (по двум большим выборкам). MATRIX. COMPUTE n1 = {7180}. /* Введите объём первой выборки (в фигурные скобки)*/ COMPUTE n2 = {9916}. /* Введите объём второй выборки (в фигурные скобки)*/ COMPUTE x1 = {1630}. /* Введите число "успешных" исходов (определяющих долю) в первой выборке (в фигурные скобки)*/ COMPUTE x2 = {1684}. /* Введите число "успешных" исходов (определяющих долю) во второй выборке (в фигурные скобки)*/ *Далее синтаксис вычисляет статистику критерия z и уровень значимости для введённых величин. *NB С этой строки вам больше ничего не следует изменять. COMPUTE p1 = x1/n1. COMPUTE p2 = x2/n2. COMPUTE phat = (x1 + x2) / (n1 + n2). COMPUTE SE_phat = SQRT(phat * (1 - phat) * ((1/n1) + (1/n2))). COMPUTE z = (p1 - p2) /SE_phat. COMPUTE SIGz_2TL = 2 * (1 - CDFNORM(ABS(z))). COMPUTE SIGz_LTL = CDFNORM(Z). COMPUTE SIGz_UTL = 1 - CDFNORM(Z). COMPUTE ANSWER = {p1, p2, SE_phat, z, SIGz_2TL, SIGz_LTL, SIGz_UTL}. PRINT ANSWER / FORMAT "F10.5" / CLABELS = p1, p2, SE, z, SIGz_2TL, SIGz_LTL, SIGz_UTL. END MATRIX. * В выдаче выше: p1 - доля в первой выборке, p2 - доля во второй выборке, SE - стандартная ошибка разницы, z - статистика критерия, SIGz_2TL - двусторонняя значимость статистики, SIGz_LTL - левосторонняя значимость, SIGz_UTL - правосторонняя значимость - А.Б. *-------------------------------------------------------------------------------. *-------------------------------------------------------------------------------. *-------------------------------------------------------------------------------. * Доверительный интервал для разности двух долей в ген. совокупностях (по двум большим выборкам). * (см. Moore and McCabe (2001) Intro to the Practice of Statistics, стр. 602-604). *-------------------------------------------------------------------------------. *Для вычисления обратного нормального распределения я использую аппроксимацию, представленную на http://www.hpmuseum.org/software/67pacs/67ndist.htm, которая была адаптирована по книге Abramowitz and Stegun, Handbook of Mathematical Functions, National Bureau of Standards 1970. MATRIX. COMPUTE n1 = {84}. /* Введите объём первой выборки (в фигурные скобки)*/ COMPUTE n2 = {106}. /* Введите объём второй выборки (в фигурные скобки)*/ COMPUTE x1 = {15}. /* Введите число "успешных" исходов (определяющих долю) в первой выборке (в фигурные скобки)*/ COMPUTE x2 = {21}. /* Введите число "успешных" исходов (определяющих долю) во второй выборке (в фигурные скобки)*/ COMPUTE CONFID = {0.90}. /* Введите желаемый доверительный уровень */ *Далее синтаксис вычисляет доверительный интервал для величин, введённых выше. *NB С этой строки вам больше ничего не следует изменять. COMPUTE Q = 0.5 * (1-CONFID). COMPUTE A = ln(1/(Q**2)). COMPUTE T_ = SQRT(A). COMPUTE zstar = T_ - ((2.515517 + (0.802853*T_) + (0.010328*T_**2))/ (1 + (1.432788*T_) + (0.189269*T_**2) + (0.001308*T_**3))). COMPUTE p1hat = x1/n1. COMPUTE p2hat = x2/n2. COMPUTE SE_phat = SQRT(((p1hat*(1-p1hat))/n1) + (p2hat*(1-p2hat))/n2)). COMPUTE m = zstar * SE_phat. COMPUTE LOWER = (p1hat - p2hat) - m. COMPUTE UPPER = (p1hat - p2hat) + m. COMPUTE diffp1p2 = p1hat - p2hat. COMPUTE ANSWER = {n1, n2, diffp1p2, zstar, SE_phat, Lower, Upper}. PRINT ANSWER / FORMAT "F10.5" /Title = "Доверительный интервал для разности двух долей" / CLABELS = n1, n2, diffp1p2, zstar, SE, Lower, Upper. END MATRIX. *В выводе выше: n1 и n2 - объёмы выборок diffp1p2 - разница долей, SE - стандартная ошибка разности, zstar - z-значение, соответствующее заданному доверительному уровню, Lower - нижняя граница ДИ, Upper - верхняя граница ДИ - А.Б. *NB Если требуется получить значения статистик с большим/меньшим числом десятичных знаков, измените формат в предпоследней команде. *например, если требуется только 2 знака, укажите формат "F10.2". *(c) Gwilym Pryce 2002.