Выберите в этом диалоговом окне опцию Weight cases by и перенесите переменную gewicht в поле под ней (в диалоге это поле называется Frequency Variable).
Описанным выше путем создайте частотные таблицы переменных beamier и thema3 и таблицу сопряженности из этих переменных. Вы получите следующий результат:
Служащий?
|
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
Valid |
да |
110 |
8,4 |
8,4 |
8,4 |
|
нет |
1189 |
91,6 |
61,6 |
100,0 |
|
Total |
1299 |
100,0 |
100,0 |
|
Борьба с инфляцией
|
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
Valid |
первостепенная важность |
110 |
8,5 |
8,5 |
8,5 |
|
второстепенная важность |
239 |
18,4 |
18,4 |
26,9 |
|
важность третьей степени |
375 |
28,8 |
28,8 |
55,8 |
|
важность четвертой степени |
575 |
44,2 |
44,2 , |
100,0 |
|
Total |
1299 |
100,0 |
100,0 |
|
Таблица сопряженности Борьба с инфляцией * Служащий?
Служащий? | |||||
да |
Нет |
Total | |||
Борьба с инфляцией |
первосте- пенная важность |
Count |
5 |
105 |
110 |
% от Борьба с инфляцией |
4,5% |
95,5% |
100,0% | ||
%от Служащий? |
4,5% |
8,8% |
8,5% | ||
второсте- пенная важность |
Count |
11 |
228 |
239 | |
% от Борьба с инфляцией |
4,6% |
95,4% |
100,0% | ||
%от Служащий? |
10,0% |
19,2% |
18,4% | ||
важность третьей степени |
Count |
30 |
345 |
375 | |
% от Борьба с инфляцией |
,U /0 |
92,0% |
100,0% | ||
%от Служащий? |
27,3% |
29,0% |
28,9% | ||
важность четвертой степени |
Count |
64 |
511 |
575 | |
% от Борьба с инфляцией |
11,1% |
88,9% |
100,0% | ||
%от Служащий? |
58,2% |
43,0% |
44,3% | ||
Total |
Count |
110 |
1189 |
1299 | |
% от Борьба с инфляцией |
8,5% |
91,5% |
100,0% | ||
%от Служащий? |
100,0% |
100,0% |
100,0% |
Chi-Square Tests
Value |
Df |
Asymp. Sig. (2-sided) | |
Pearson Chi-Square |
12,156 a |
3 |
,007 |
Likelihood Ratio |
12,972 |
3 |
,005 |
Linear-by-Linear Association |
11,410 |
1 |
,001 |
N of Valid Cases |
1299 |
|
|
а. 0 cells (,0%) have expected count less than 5. The minimum expected count is 9,31. (Ячейки с нулями (,0%) имеют ожидаемую частоту менее 5. Минимальная ожидаемая частота 9,31.)
Общая частота осталась неизменной — 1299, но взаимное отношение частот изменилось. В переменной beamter количество служащих снизилось с 137 до 110, что соответствует реальной доле служащих 8,4%. Также незначительно изменилась частотная таблица для переменной themaS; взвешивание повлияло и на нее.
То же можно сказать и о таблице сопряженности. Однако здесь процентные значения по столбцам не изменились; сохранились соотношения между отдельными значениями переменных в ячейках.
Установленное взвешивание будет действовать до тех пор, пока вы снова не выберете в диалоговом окне Weight Cases опцию Do not weight cases (He взвешивать наблюдения).
Описанный метод взвешивания при отсутствии репрезентативности может привести к возникновению некоторых проблем, которые, впрочем, не проявляются в изученном примере.
Если мы рассмотрим, например, взвешенную частотную таблицу переменной «Борьба с инфляцией», то обнаружим, что общее количество наблюдений (1299) не меняется при взвешивании. Это связано с тем, что сумма весовых коэффициентов по всем случаям равна числу случаев. Однако в варианте взвешивания, который будет изложен в разделе 8.7.2, это не так.
Если вы попробуете вручную просуммировать частоты упоминания всех четырех вариантов ответов, то в результате вы также получите число 1299. Однако это не закономерность, а скорее счастливое совпадение, о чем свидетельствует следующий пример.
Загрузите файл mai.sav, содержащий результаты опроса членов профсоюза на тему 1 мая (см. главу 24).
С помощью команд меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies... (Частоты) создайте частотные таблицы переменных v2 (Пол) и v20 (Занятие).
Пол
|
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
Valid |
женский |
77 |
28,4 |
28,4 |
28,4 |
|
мужской |
184 |
71,6 |
71,6 |
100,0 |
Total |
271 |
100,0 |
100,0 |
|
|
Занятие
|
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
Valid |
Учащийся |
8 |
3,0 |
3,0 |
3,0 |
|
Рабочий |
47 |
17,3 |
17,3 |
20,3 |
|
Квалифици- рованный рабочий |
47 |
17,3 |
17,3 |
37,6 |
|
Специалист |
4 |
1,5 |
1,5 |
39,1 |
|
Служащий |
66 |
24,4 |
24,4 |
63,5 |
|
Менеджер |
8 |
3,0 |
3,0 |
66,4 |
|
Государствен- ный служащий |
31 |
11,4 |
11,4 |
77,9 |
|
Пенсионер |
42 |
15,5 |
15,5 |
93,4 |
|
Домохозяйка |
g |
3,3 |
3,3 |
96,7 |
|
Нетрудоспо- собный |
1 |
,4 |
,4 |
97,0 |
|
Безработный Total |
8 271 |
3,0 100,0 |
3,0 100,0 |
100,0 |
Взвесим наблюдения так, чтобы устранить неравномерность между количествами респондентов обоих полов. Учитывая частотное распределение полов, характерное для имеющейся выборки, это выполняется при помощи следующих команд:
IF v2=1 w=135.5/77.
IF v2=2 w=135.5/194.
EXECUTE
Теперь описанным выше способом проведем взвешивание, используя только что полученную переменную w, и построим обе частотные таблицы заново:
Пол
|
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
Valid |
женский |
135 |
50,0 |
50,0 |
50,0 |
|
мужской |
135 |
50,0 |
50,0 |
100,0 |
|
Total |
271 |
100,0 |
100,0 |
|
Занятие
|
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
Valid |
Учащийся |
10 |
3,6 |
3,6 |
3,6 |
|
Рабочий |
46 |
16,8 |
16,8 |
20,4 |
|
Квалифици- рованный рабочий |
35 |
12,9 |
12,9 |
33,3 |
|
Специалист |
3 |
1,0 |
1,0 |
34,4 |
|
Служащий |
83 |
30,7 |
30,7 |
65,1 |
|
Менеджер |
7 |
2,5 |
2,5 |
67,5 |
|
Государствен- ный служащий |
32 |
11,9 |
11,9 |
79,4 |
|
Пенсионер |
36 |
13,2 |
13,2 |
92,6 |
|
Домохозяйка |
9 |
3,5 |
3,5 |
96,1 |
|
Нетрудоспо- собный |
2 |
,6 |
,6 |
96,8 |
|
Безработный |
9 |
3,2 |
3,2 |
100,0 |
|
Total |
271 |
100,0 |
100,0 |
|
Хотя общее число наблюдений, 271, опять не изменилось, но суммирование частот по категориям дает несколько другие результаты.
Это особенно заметно для переменной Пол. Так как после определения переменной взвешивания обе категории должны иметь одинаковые частоты, с самого начала ясно, что сумма не может быть нечетной. Для переменной занятие сложение частот по категориям также дает результат 272, что на единицу отличается от общего количества наблюдений — 271, выводимого в окне просмотра. SPSS всегда, в том числе при взвешивании, выдает целочисленные частоты. Поэтому негативное влияние округления будет неизбежным. Другие статистические программы, например, Stata, обходят эту ситуацию, вычисляя взвешенные частоты с дробной частью.
Если сделать выборку наблюдений, то отображаемые программой суммы до и после взвешивания, как правило, также будут различаться. Это связано с тем, что в частичной выборке количество наблюдений обычно не соответствует сумме весовых коэффициентов, попадающих в эту выборку. Это можно проверить, создав на основе открытого файла данных частотную таблицу переменной «Занятие» до взвешивания и после взвешивания, но только для приверженцев партии СДПГ (v22=2). Тогда мы получим соответственно суммы 91 и 83.
Взвешивание для выравнивания характеристик при нарушении репрезентативности применяется в первую очередь при эпидемиологических исследованиях. Так как при весовом коэффициенте, превосходящем единицу, количество наблюдений искусственно увеличивается по сравнению с фактически измеренным, к результатам теста на значимость следует подходить весьма критически.