Реструктурирование данных с сохранением группирующего параметра

* Реструктурирование данных с сохранением группирующего параметра.

**Программа составлена Рейналем Левек и применяется к обработке вопросников об оценке качества читаемых курсов **.
** (слушателей просят высказать своё согласие/несогласие с рядом утверждений, характеризующих прослушанный курс).
** Потом может быть интересно в единой таблице сопоставить распределения ответов на отдельные вопросы:
** посмотреть, какие аспекты курса нуждаются в улучшении.

**Мой веб-сайт, посвящённый SPSS http://www.spsstools.net **.

**Пример поддерживает группирующий признак, преобразовывая данные к "широкому" формату **.
**Затем уже на "широком" массиве данных генерируется описательная статистика по каждому из заданных вопросов **.
**Синтаксис генерирует отдельный отчёт для каждого значения группирующего признака **.
**Данная программа может быть полезна для накопления исторической информации о качестве читаемых курсов **.

PRESERVE.
SET Printback=ON Length=None Width=80.

DATA LIST LIST /var1(A1) vec b a (3F8.0).
BEGIN DATA
A    1 2 3 
A    5 2 4
A    5 3 3
A    5 2 5
B    5 1 5
C    5 3 5
C    5 2 2
D    3 3 3 
D    5 5 8
D    0 2 .
D    1 1 1
END DATA.

* Преобразуем те значения, которые выходят за пределы стандартной шкалы согласия / несогласия (от 1 до 5) в -1.
* Далее -1 будет объявлен пропущенным значением.

DO REPEAT var=vec TO a.
IF Not Any(var, 1, 2, 3, 4, 5) var=-1.
END REPEAT PRINT.

SAVE OUTFILE='c:\\temp\\mydata.sav'.

GET FILE='c:\\temp\\mydata.sav'.

** Определим макрос, задающий число необходимых колонок в широком файле (переменных) **.

SET MPRINT=no.

AGGREGATE OUTFILE=*
  /BREAK=var1
  /n = N(var1).

COMPUTE nobreak=1.
AGGREGATE OUTFILE=*
  /BREAK=nobreak
  /n = MAX(n).

DO IF $CASENUM=1.
WRITE OUTFILE='c:\\temp\\define n.sps' /'DEFINE !n()'n'!ENDDEFINE.'.
END IF.
EXECUTE.

INCLUDE FILE='c:\\temp\\define n.sps'.

** Теперь определим макрос, который реструктурирует данные из "высокого" формата в "широкий" **.

*////////////.
DEFINE !flip(!POS=!TOKENS(1) /!POS=!TOKENS(1) /vnames=!CMDEND)

GET FILE='c:\\temp\\mydata.sav'.
AUTORECODE VARIABLES=var1 /INTO var1num.

!LET !nbvar=!NULL
!DO !var !IN (!vnames)

  /* Считаем число переменных */
  !LET !nbvar=!CONCAT(!nbvar,"1")

  /* создаём нумерованные имена переменных (вектор) */
- STRING !CONCAT('vname',!LENGTH(!nbvar)) (A8).
- COMPUTE !CONCAT('vname',!LENGTH(!nbvar))=!QUOTE(!var).

  /* Запоминаем имя последней переменной */
  !LET !lastnam=!var
!DOEND
!LET !nbvar=!LENGTH(!nbvar)

VECTOR vname=vname1 TO !CONCAT('vname',!nbvar)		
	/v=!HEAD(!vnames) TO !lastnam.

STRING vname(A8).
LOOP cnt=1 TO !nbvar.
- COMPUTE c=v(cnt).
- COMPUTE vname=vname(cnt).
- COMPUTE vnameidx=cnt.
- DO IF NOT SYSMIS(c).
-   XSAVE OUTFILE='c:\\temp\\temp.sav' /KEEP=var1 vname vnameidx c var1num.
- END IF.
END LOOP.
EXECUTE.

GET FILE='c:\\temp\\temp.sav'.
SORT CASES BY vnameidx var1.
COMPUTE casen=$CASENUM.

RANK VARIABLES=casen(A) BY vnameidx !1 /RANK INTO idx .

VECTOR c(!n).
COMPUTE c(idx)=c.
AGGREGATE OUTFILE=*
	/PRESORTED
	/BREAK=vnameidx var1num
	/var1 vname c1 TO !CONCAT('c',!n)=FIRST(var1 vname c1 TO !CONCAT('c',!n)).
ADD FILES FILE=* /DROP=vnameidx !1.
EXECUTE.

!ENDDEFINE.
*////////////.

** Вызовем макрос для выполнения преобразований **.
SET MPRINT=yes.
!flip var1num var1 vnames=vec b a.
SET MPRINT=no.



*Переименовываем переменные.
RENAME VARS (VNAME C1 C2 C3 C4 = ITEM V1 V2 V3 V4).
EXECUTE.

** Теперь определим макрос для вычисления описательной статистики **.

*////////////////////.
DEFINE !doit(nb=!TOKENS(1))

!LET !vlast=!CONCAT(v,!nb)
VECTOR v=v1 TO !vlast.
MISSING VALUES v1 TO !vlast (-1).
DO REPEAT cnt=1 TO 5 /c=c1 TO c5 /Nc=Nc1 TO Nc5.
. COUNT c=v1 TO !vlast (cnt).
. COUNT Nc=v1 TO !vlast (cnt).
. COMPUTE mean=MEAN(v1 TO !vlast).
. COMPUTE SD=SD(v1 TO !vlast).
. COMPUTE n=NVALID(v1 TO !vlast).
. COMPUTE c=c/n*100.
. COMPUTE NMis=NMIS(v1 TO !vlast).
. FORMATS c(PCT4.0) NMis Nc(COMMA8).
END REPEAT PRINT.

*STRING Item(A4).
*COMPUTE Item = SUBSTR(case_lbl,2,2).
FORMATS n(COMMA8) mean (F8.2) sd (F8.2).
VARIABLE LABEL mean "Среднее"  
	Nc1 "Полн. несогл." Nc2 "Несогл." Nc3 "Нейтр." Nc4 "Согл." Nc5 "Полн. согл."
	c1 "Полн. несогл.%" c2 "Несогл.%" c3 "Нейтр.%" c4 "Согл.%" c5 "Полн. согл.%" NMis "Пропуски".
!ENDDEFINE.
*////   /////  //////.


* Вызов макроса, вычисляющего статистику.
SET MPRINT=yes.
!doit nb=!n.
SET MPRINT=no.

SORT CASES BY VAR1 ITEM.
EXECUTE.
SPLIT FILE SEPARATE BY var1.
Report
  /FORMAT= CHWRAP(ON) PREVIEW(OFF) CHALIGN(BOTTOM)  UNDERSCORE(ON)
  ONEBREAKCOLUMN(OFF) CHDSPACE(1)  SUMSPACE(0)  AUTOMATIC  LIST
   BRKSPACE(-1)
  PAGE(1) MISSING'.' LENGTH(1, 71) ALIGN(LEFT) TSPACE(1) FTSPACE(1)
  MARGINS(1,101)
 /TITLE=
  CENTER 'Отчёт по тестам' 
	')Год (может быть передан через скрипт, см. комм. ниже)' 
	'Статистика по вопросам*'
  LEFT ''
 /FOOTNOTE=
  LEFT '* Среднее основано на порядковой шкале, где 5=полное согласие; 4=согласие; 3=неопределённость; 2=несогласие; 1=полное несогласие;'
           '  SD=Стандартное отклонение (SD показывает изменчивость рейтингов); N=число действительных ответов на данный вопрос;'
           '  Пропуски=число пропущенных ответов (из-за неприменимости вопросов, неотвеченных вопросов и нераспознанных сканером ответов);'
           '  Статистика строится на основе действительных ответов студентов, пропуски исключаются из расчёта статистик;'
           '  Непосредственно число выборов каждой из градаций вопроса можно определить, исходя из представленных процентов, учтя число действительных ответов.'
   /VARIABLES
 mean  (VALUES)  (RIGHT)  (OFFSET(0)) (4)
 sd  (VALUES)  (RIGHT)  (OFFSET(0)) (4)
 n  (VALUES)  (RIGHT)  (OFFSET(0)) (4)
 nmis  (VALUES)  (RIGHT)  (OFFSET(0)) (5)
 SEP1(DUMMY) (3) ' '
 c5  (VALUES)  (RIGHT)  (OFFSET(0)) (5)
 c4  (VALUES)  (RIGHT)  (OFFSET(0)) (5)
 c3  (VALUES)  (RIGHT)  (OFFSET(0)) (5)
 c2  (VALUES)  (RIGHT)  (OFFSET(0)) (5)
 c1  (VALUES)  (RIGHT)  (OFFSET(0)) (5)
 /BREAK   item  (LABELS)  (LEFT)  (OFFSET(0)) (10) .

SPLIT FILE OFF.


**Возможные дополнения. Указанные ниже скрипты помогут сэкономить время на подготовку отчётов **.

**Первое: поскольку данные пример может быть полезен для добавления фрагментов данных в более крупный (основной) файл,
** полезным будет добавление переменной с указанием на время, к которому относятся фрагменты данных.
** Начать выполнение синтаксиса можно с вызова скрипта, который запрашивает время, к которому относятся данные (например, год и месяц),
** после чего создаёт макрос !fy, содержащий это значение. Вы можете дополнить синтаксис командой, создающей переменную var со значением 
** !fy, после чего информация о времени может быть помещена в заголовок отчёта посредством 
** указания строки ')var' в синтаксисе, где var - имя переменной, содержащей информацию о времени **.
**См. скрипт Рейналя Левека: http://www.spsstools.net/Scripts/dialogs/GetFyFromUserThenRunSyntax.txt **.
**Где-то в начале вашей программы поместите команду, подобную той, что приведена ниже, с указанием пути к файлу скрипта **.
**SCRIPT FILE='C:\\--(укажите путь к файлу .sbs)--\\GetFyFromUserThenRunSyntax.sbs'. **.
** Указанная версия скрипта пытается вызвать синтаксис report.sps после своего завершения. Можно поправить скрипт так, 
** чтобы этого вызова не происходило - примеч. перев.

**Второе: Можно использовать скрипт SPSS Clean Viewer для удаления ненужных частей выдачи **.
**См.: http://www.spsstools.net/Scripts/OutputDoc/DeleteStatisticsAndCaseProcessingSummary.txt **. 
**Вызов:.
**SCRIPT FILE='C:\\--(подставьте сюда нужный путь к файлу)--\\Clean Viewer.sbs'. **.

**Третье: Можно использовать скрипт, экспортирующий выдачу в MS Word для распечатки **.
**См. скрипт Рейналя Левека: http://www.spsstools.net/Scripts/ImportExport/ExportVisibleOutputToWordViaHTML.txt **.

*Четвёртое: если вся выдача направляется одному и тому же человеку, можно использовать скрипт, который направляет всю выдачу по указанному адресу **.
**См. скрипт Рейналя Левека: http://www.spsstools.net/Scripts/ImportExport/SendDocumentByEmail.txt **.

*Следующая команда восстанавливает исходные установки системы SPSS, сохранённые в начале.
RESTORE.
...
Navigate from here