Видно, что в 10 версии появилась возможность сохранения информации о модели в так называемом, XML-файле (см. примечания к рис. 16.3).
Активируйте вывод Predicted group membership (Прогнозируемой принадлежности к группе), Discriminant scores (Значений дисриминантной функции) и Probabilities of group membership (Вероятностей принадлежности к группе).
Подтвердите нажатием Continue (Далее) и затем ОК.
В окне просмотра появится сначала обзор действительных и пропущенных значений:
Analysis Case Processing Summary (Анализ обработанных наблюдений)
Unweighted Cases (He взвешенные случаи) |
|
N |
Percent (Процент) |
Valid (Действительные) |
|
2200 |
71,9 |
Excluded (Исключенные) |
Missing or out-of-range group codes (Отсутствующие или находящиеся за пределами допустимой области кодировки принадлежности к группе) |
19 |
,6 |
At least one missing discriminating variable (По меньшей мере одна отсутствующая дискриминационная переменная) |
816 |
26,7 | |
Both missing or out-of-range group codes and at least one missing discriminating variable (Обе кодировки принадлежности к группе отсутствуют или находятся за пределами допустимой области, или по меньшей мере одна отсутствующая дискриминационная переменная) |
23 |
,8 | |
Total (Общее количество исключённых) |
858 |
28,1 | |
Total (Общее количество случаев) |
|
3058 |
100,0 |
В общей сложности 858 наблюдений из 3058, находящихся в файле postmat.sav, были исключены из анализа из-за отсутствия значения переменной ingl_dic или отсутствия значений одной из дискриминационных переменных. Таким образом анализ проводился для 2200 наблюдений. Далее приводятся средние значения, стандартные отклонения и количество наблюдений для всех переменных из обеих групп и для каждой группы в отдельности.
По средним значениям уже заметно, что для постматериалистических типов характерны: более высокий социально-экономический статус отца (2,8148 по сравнению с 2,3904), более высокое образование (2,9853 по сравнению с 2,5248) и принадлежность к младшей возрастной группе (2,1842 по сравнению с 2,8151).
Group Statistics
(Статистики для групп) | |||||
INGL_DIC (Индекс Ингпехарта, дихото-мический) |
|
Mean (сред-нее значе-ние) |
Std. Deviation (Станда-ртное отклоне-ние) |
Valid N (listwise) (Действительные значения (по списку)) | |
Unwei-ghted (Не взвеше-нные) |
Weigh-ted (Взвеше-нные) | ||||
1,00 (Пост-материа-листический тип) |
SES-lndex des Vaters (социально-экономи-ческий статус отца) |
2,8148 |
1,1718 |
1091 |
1091,000 |
Schulabschluss (Образование) |
2,9853 |
,8194 |
1091 |
1091,000 | |
ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошен-ного(ой), разбит на категории) |
2,1842 |
1,0887 |
1091 |
1091,000 | |
Berufsaus-bildung (Профес-сиональное образо-вание) |
2,1888 |
1,1562 |
1091 |
1091,000 | |
2,00 (Материа-листический тип) |
SES-lndex des Vaters (социально-экономи-ческий статус отца) |
2,3904 |
1,0407 |
1109 |
1109,000 |
Scnulabschluss (Образование) |
2,5248 |
,7627 |
1109 |
1109,000 | |
ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст ,опрошен-ного(ой), разбит на категории) |
2,8151 |
1,2111 |
1109 |
1109,000 | |
Berufsa-usbildung (Профес-сиональное образование) |
1,8792 |
1,0249 |
1109 |
1109,000 | |
Total (Сумма) |
SES-lndex des Vaters (социально-экономи-ческий статус отца) |
2,6009 |
1,1275 |
2200 |
2200,000 |
Schulabschluss (Образование) |
2,7532 |
,8240 |
2200 |
2200,000 | |
ALTER, BEFRAGTE<R>, KATEGORI-SIERT (Возраст, опрошен-ного(ой), разбит на категории) |
2,5023 |
1,1942 |
2200 |
2200,000 | |
Berufsa-usbildung (Профес-сиональное образование) |
2,0327 |
1,1027 |
2200 |
2200,000 |
Затем проводится тест на значимость различия между переменными, относящимися к обеим группам, то есть выясняется присутствуют ли в них разделяющие (дискриминирующие) особенности, позволяющие судить об отношении к одной из двух групп (постматериалисты — материалисты).
Tests of Equality of Group Means (Тест равенства групповых средних значений)
|
Wilks1 Lambda (Лямбда Уилкса) |
F |
df1 |
df2 |
Sig. (Значимость) |
SES-lndex des Vaters (социально-экономический статус отца) |
,965 |
80,746 |
1 |
2198 |
,000 |
Schulabschluss (Образование) |
,922 |
186,281 |
1 |
2198 |
,000 |
ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ых), разбит на категории) |
,930 |
164,951 |
1 |
2198 |
,000 |
Berufsausbildung (Профессиональное образование) |
,980 |
44,222 |
1 |
2198 |
,000 |
Как следует из колонки значимости, по всем переменным наблюдается значительное различие между группами (р < 0,001).
Далее приводится корреляционная матрица между всеми переменными, причём коэффициенты были рассчитаны для обеих групп:
Pooled Within-Groups Matrices (Объединённые матрицы внутри групп)
SES-lndex des Vaters (социально- экономи-ческий статус отца) |
Schulab-schluss (Образо-вание) |
ALTER, BEFRAG -TE<R>, KATEGO-RISIERT (Возраст, опрошен-ного(ой), разбит на категории) |
Berufsau-sbildung (Профес- сиона-льное образо-вание) | ||
Corre-lation (Корре-ляция) |
SES-lndex des Vaters (социально-экономи-ческий статус отца) |
1,000 |
,327 |
-,033 |
,137 |
Schula-bschluss (Образо-вание) |
,327 |
1,000 |
-,275 |
,377 | |
ALTER, BEFRA-GTE<R>, KATEGO-RISIERT (Возраст, опрошен-ного(ых), разбит на категории) |
-,033 |
-,275 |
1,000 |
,018 | |
Berufsa-usbildung (Профес-сиональное образо-вание) |
,137 |
,377 |
,018 |
1,000 |
Прежде всего, здесь очень заметна корреляция между переменными schule и statpas и между переменными ausbild и schule. Чем выше социально-экономический статус отца, тем выше школьное образование опрашиваемого; чем выше его школьное образование, тем выше и профессиональное образование.
Далее следует анализ коэффициентов дискриминантной функции. Корреляционный коэффициент между рассчитанными значениями дискриминантной функции и реальной принадлежностью к группе, равный 0,353, является неудовлетворительным:
Eigenvalues (Собственные значения)
Function (Функция) |
Eigenvalue (Собствен-ное значение) |
% of Variance (% диспе-рсии) |
Cumulative % (Сово-купный %) |
Canonical Correlation (Канони-ческая корре-ляция) |
1 |
,142а |
100,0 |
100,0 |
,353 |
a. First 1 canonical discriminant functions were used in the analysis (Первые 1 канонические дискриминантные функции будут применяться в анализе).
Wilks' Lambda (Лямбда Уилкса)
Test of Function(s) Wilks' Lambda (Тест функции (и)) (Лямбда Уилкса) |
Chi-square (Хи-квадрат) |
df |
Sig. (Значимость) |
1 ,875 |
292,431 |
4 |
,000 |
Тест, проведенный с помощью критерия "Лямбда Уилкса" (k), на предмет, значимо ли различаются между собой средние значения дискриминантной функции в обеих группах, показал очень значимый результат (значение р < 0,001).
Затем приводятся стандартизированные коэффициенты дискриминантной функции и их корреляция с используемыми переменными:
Standardized Canonical Discriminant Function Coefficients
(Стандартизиро-ванные канонические коэффициенты дискриминантной функции) | |
|
Function (Функция) |
1 | |
SES-lndex des Vaters (социально-экономический статус отца) |
,321 |
Schulabschluss (Образование) |
,434 |
ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ой), разбит на категории) |
-,599 |
Berufsausbildung (Профессиональное образование) |
,179 |
Structure Matrix
(Структурная матрица) | |
|
Function (Функция) |
1 | |
Schulabschluss (Образование) |
,771 |
ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ой), разбит на категории) |
-,726 |
SES-lndex des Vaters (социально-экономический статус отца) |
,508 |
Berufsausbildung (Профессиональное образование) |
,376 |
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions (Объединённые корреляции внутри групп между дискриминантными переменными и стандартизированными каноническими дискриминант-ными функциями)
Variables ordered by absolute size of correlation within function (Переменные расположены соответственно величине их абсолютных корреляционных показателей).
После этого приводятся нестандартизированные коэффициенты дискриминантной функции и средние значения дискриминантной функции в обеих группах:
Canonical Discriminant Function Coefficients
(Канонические коэффициенты дискриминантной функции) | |
|
Function (Функция) |
1 | |
SES-lndex des Vaters (социально-экономический статус отца) |
,290 |
Schulabschluss (Образование) |
,549 |
ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ой), разбит на категории) |
-,520 |
Berufsausbildung (Профессиональное образование) |
,164 |
(Constant) (Постоянно) |
-1,297 |
Unstandardized coefficients (нестандартизированные коеффициенты)
Functions at Group Centroids (Функции для групповых центроидов)
INGL DIC |
Function (Функция) |
1 | |
1 ,00 (Постматериалистический тип) |
,380 |
2,00 (Материалистический тип) |
-.374 |
Unstandardized canonical discriminant functions evaluated at group means (Нестандартизированные канонические дискриминантные функции, оценка которых происходит относительно средних значений групп).
В данном случае мы отказались от вывода очень длинной таблицы, в которой для каждого наблюдения построчно, приводится информация о значении дискриминантной функции и принадлежности к одной из двух групп.
В заключении приводится классификационная таблица с указанием точности попадания прогнозов:
Classification Resultsа
(Классификационные результаты) | |||||
INGL_DIC (Индекс Инглехарта, дихото-мический) |
Predicted Group Membership (Прогнозируемая принадлежность к группе) |
Total (Сум-ма) | |||
1,00 (Постматери-алисти-ческий тип) |
2,00 (Материа-листи-ческий тип) | ||||
Original (Перво-начально) |
Count (Коли-чество) |
1 ,00 (Пост-материа-листи-ческий тип) |
710 |
381 |
1091 |
2,00 (Материа-листический тип) |
410 |
699 |
1109 | ||
Ungrouped cases (He сгруп-пирован-ные наблю-дения) |
7 |
12 |
19 | ||
% |
1 ,00 (Постматериа-листический тип) |
65,1 |
34,9 |
100,0 | |
2,00 (Материа-листи-ческий тип) |
37,0 |
63,0 |
100,0 | ||
Ungrouped cases (He сгруп-пирован-ные наблю-дения) |
36,8 |
63,2 |
100,0 |
а. 64,0% of original grouped cases correctly classified (64 % наблюдений, первоначально разнесённых по группам, были классифицированы корректно).
Правая колонка таблицы ("Total" (Сумма)) указывает на общее количество наблюдений, которые фактически относятся к соответствующим группам. К группе постматериалистических типов относится 1091 наблюдение, а к группе материалистических типов 1109. Обе колонки, объединенные общим наименованием ("Predicted Group Membership" (Прогнозируемая принадлежность к группе)), указывают на фактическое количество наблюдений, относящихся к каждой из групп. Первая колонка указывает на количество наблюдений, которые были отнесены к первой группе. Из 1091 постматериалистическйх наблюдений корректно определены были 710, это соответствует 65,1 % всех наблюдений. 381 наблюдение было по ошибке отнесено ко 2 группе, что соответствует 34,9 % всех наблюдений. Из 1109 материалистических наблюдений по ошибке к группе 1 были отнесены 410, что соответствует 37,0 %. 699 наблюдений были корректно отнесены к группе 2, что составило 63 %. Строка "Ungrouped cases" (Несгруппированные наблюдения) содержит наблюдения, которые не соответствуют ни одной из групп. Хотя эти наблюдения и не учитываются при расчёте дискриминантной функции, значение функции для них всё равно вычисляется. Из 19 наблюдений, для которых отсутствуют данные о принадлежности к какой-либо группе, 7 были отнесены к постматериалистическим типам, а 12 к материалистическим. В строке под таблицей приводится итоговый результат. 64 % наблюдений были классифицированы корректно. Так как даже при чисто случайном отнесении некоторого наблюдения к одной из двух имеющихся групп, корректность классификации данного наблюдения составила бы 50 %, то 64 %-ную точность прогноза следует рассматривать как довольно умеренный результат. Такой неудовлетворительный результат можно попытаться объяснить тем, что в обе группы входили смешанные типы, которые тяжелее классифицировать, нежели чистые типы. Проверим это предположение путём повторного проведения расчёта, но уже с учётом только чистых типов.
Выберите в меню Data (Данные) Select Cases... (Выбрать наблюдения)
Щёлкните на опции If condition is satisfied (Если выполняется условие) и затем на выключателе If... (Если).
В редакторе условий введите следующее условие:
ing1_ind = 1 OR ing1_ind = 4
Подтвердите нажатием Continue (Далее) и затем ОК.
В диалоговом окне Discriminant Analysis (Дискриминантный анализ) переменную ingl_ind (не ingl_dic!) поместите в поле для групповых переменных. В качестве границ области изменения задать значения 1 и 4.
В список независимых переменных поместите переменные statpaps, schule, alter и ausbild.
Дополнительные установки под выключателями Statistics... (Статистики), Classify... (Классифицировать) и Save... (Сохранить) произведите так, как было описано ранее.
Вы получите следующую классификационную таблицу:
Classification Results
(Результаты классификации) | |||||
|
INGLEHART-INDEX (Индекс Инглехарта, дихото-мический) |
Predicted Group Membership (Прогнозируемая принадлежность к группе |
Total (Сумма) | ||
POSTMATE-RIALISTEN (Постмате-риалисты) |
MATERI-ALISTEN (Матери-алисты) | ||||
Original (Перво-начально) |
Count (Коли-чество) |
POSTMATE-RIALISTEN (Постмате-риалисты) |
409 |
109 |
518 |
MATERI-ALISTEN (Матери-алисты) |
133 |
297 |
430 | ||
% |
POSTMATE-RIALISTEN (Постмате-риалисты) |
79,0 |
21,0 |
100,0 | |
MATERI-ALISTEN (Матери-алисты) |
30,9 |
69,1 |
100,0 |
а. 74,5% of original grouped cases correctly classified (74,5 % наблюдений, первоначально разнесённых по группам, были классифицированы корректно).
К группе постматериалистов относится 518 наблюдений. 409 наблюдений (79 %) были спрогнозированы корректно, а 109 (21,0 %) по ошибке отнесены к группе 4 ("чистые материалисты"). В группе чистых материалистов насчитывается 403 наблюдения. 297 наблюдений (69,1 %) были определены корректно, а 133 (30,9 %) по ошибке были отнесены к группе 1 ("чистые постматериалисты"). Конечным результатом является корректная идентификация наблюдений, равная 74,5 %. Этот показатель значительно выше предыдущего и может быть расценен как приемлемый.