Линейные распределения и таблицы сопряженности

Основная цель любых преобразований эмпирической информации — представить ее в компактном, «сжатом» виде для детального содержательного анализа.

Получение линейных распределений частот значений переменных эмпирического массива документов — самый простой и обязательный способ решения этой задачи.

Линейное распределение эмпирической информации получается с помощью процедуры счета: подсчитывается количество реально зафиксированных значений всех переменных во всех документах эмпирического массива. Результаты подсчета представляются в абсолютных и относительных величинах.

Например, после проведения всех предварительных операций, рассмотренных выше, на обработку поступили 1000 ед. документа, фрагмент которого показан в табл. 1.

Линейное распределение частот ответов на вопросы этой анкеты может быть оформлено в табличном виде (табл. 2).

Таблица 2

Пример линейного распределения частот вариантов ответов на вопросы анкеты

Номер перемен-ной  

Текст вопроса и вариантов ответов

 

Абсолютная частота

 

%

1

 

 

 

 

 

 

24

Что Вы можете сказать о положении дел на предприятии?

1 – улучшается 2 – не меняется 3 – ухудшается

4 – затрудняюсь ответить 5 – нет ответа

 

Как Вы оцениваете уровень своего благосостояния?

1 – живу в достатке

2 – живу от зарплаты до зарплаты 3 – вечно в долгах

4 – нет ответа

 

 

110 230 470 130 60 …

 

 

70 640 240 50

 

 

11 23 47 13 6 …

 

 

7 64 24 5

Часто применяется графическая форма представления результатов счета, в особенности—при сравнении двух или более числовых рядов, а также для отображения динамики изучаемых процессов.

Поскольку практически все (не менее 95%) переменные в социологии измеряются в номинальных шкалах, наиболее оптимальными формами их графического отображения являются гистограммы и круговые диаграммы. Их вид применительно к табл. 2 представлен на рис. 1 и 2.

В чисто номинальных шкалах отдельные значения перемен-ной относительно автономны, поэтому на гистограмме их можно переставлять местами в зависимости от целей и удобства анализа. Ширина полос на гистограмме обычно одинакова и произвольна, а высота соответствует величине данного значения в линейном распределении в процентах.

Те немногие переменные в социологии, которые имеют естественные метрические измерительные шкалы (возраст, доход, численность семьи и т.п.), на практике измеряются в интервальных шкалах, в которых все изучаемые значения измеряемых переменных делятся на конечное множество интервалов, внутри каждого из которых все возможное множество значений заменяются как бы одним.

Таким образом, по своему характеру метрическая шкала трансформируется в порядковую, где вместо непрерывного множества реальных значений переменной анализируется лишь не-сколько дискретных.

Благодаря этому изучение всех включенных в полевой документ переменных ведется в рамках единого класса измерительных шкал, чем обеспечивается возможность их сопряжения, а также содержательная ясность получаемых результатов и практическое удобство их анализа.

Главная задача социолога — не только (и даже не столько!) определить состояние изучаемого явления или процесса, но и установить причины, выявить факторы, обусловившие именно это состояние.

Практически эта задача решается как подсчет величины связей между переменными, которыми представлено изучаемое явление: определяются изменения в характере распределения интересующей исследователя переменной, которая рассматривается как зависимая (или функция), при изменении конкретных значений другой — независимой — переменной (или аргумента).

В качестве аргумента могут выбираться значения не только одной перемен-ной, но и несколько значений различных переменных, для чего конструируется соответствующая типологическая группировка.

На-пример, можно сравнивать разницу в характере распределений ответов на определенные вопросы анкеты (переменные-функции) тех респондентов, которые имеют различный уровень образования (переменная-аргумент), или замужних женщин, имеющих высшее образование (типологическая группировка).

Результаты оформляются в виде так называемых таблиц сопряженности. Пример такого распределения представлен в табл. 3. В ней содержатся результаты обработки материалов реального опроса жителей одного из подмосковных округов в зависимости от возраста опрошенных.

Таблица 3

Самооценка жизненного уровня в зависимости от возраста опрошенных (N = 1560)

Жизненный уровень Возраст, лет  

Всего

до 24 25—34 35—44 45—54 55
Очень хорошо 2 22,2 1,1 2 22,2 1,1 5 55,6 1,4 9 0,6
Хорошо 27 22,3 14,4 28 23,1 10,4 28 23,1 10,4 16 13,2 6,6 22 18,2 4,5 121 7,8
Жизненный уровень Возраст, лет  

Всего

до 24 25—34 35—44 45—54 55
Средне 124 13 66,3 179 18,7 66,8 233 24,4 63 134 14 55,6 285 29,8 57,7 955 61,2
Плохо 25 6,3 13,4 53 13,4 19,8 84 21,2 22,7 75 18,9 31,1 159 40,2 32,2 396 25,4
Очень плохо 9 11,4 4,8 6 7,6 2,2 20 25,3 5,4 16 20,3 6,6 28 35,4 5,7 79 5,1
Всего: 187 12 268 17,2 370 23,7 241 15,4 494 31,7 1560 100
Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)