Социологические данные, полученные в результате обработки первичной информации, представляют собой, образно говоря, различных цветов и оттенков «краски», с помощью которых предстоит нарисовать реалистическую картину знаний о предмете исследования.
Наиболее простая форма обобщения первичной социологической информации - группировка. Она позволяет зачислить респондента в ту или иную группу в соответствии с выбранным признаком (или признаками) группировки. Подытоживая число ответов на вопросы анкеты в опоре на такие признаки, исследователь осуществляет не что иное, как простую группировку респондентов с учетом их социально-демографических признаков, мнений, установок, информированности, индивидуальных оценок и т.п. Выделенные таким образом однородные по составу (по признаку группировки) группы значительно легче соотносить, сравнивать, анализировать.
Выбор признака группировки - не произвольная процедура, он диктуется задачей социологического исследования, сформулированными ранее гипотезами. Ошибочный выбор признака группировки приводит к неверным выводам при анализе характеристик объекта исследования.
В зависимости от шкалы измерения, в соответствии с которой получены ответы на вопрос, группировка социологической информации может представлять собой:
- зачисление респондентов в номинальные группы (группировка опрошенных по полу, национальности и т.п.);
- упорядочение информации в ранжированном ряду, например, по характеру труда (выполняющие ручной труд, работающие с механизмами, выполняющие труд интеллектуальный) или по степени включенности в общественную работу и т.п.;
- группировку по количественному признаку, в результате которой группы респондентов характеризуются числовой величиной и потому количественно сравнимы между собой.
Операции с номинальными и ранжированными группами осуществляются при помощи математических приемов, соответствующих номинальной и ранговой шкалам. Что касается групп, распределенных по количественному признаку, то они могут быть подвергнуты дальнейшему изучению при помощи любых приемов математической статистики, так как такая группировка осуществляется по интервальной шкале.
Когда респондентов распределяют в группы по двум или более признакам, например, выделяют мужчин в возрасте до 30 лет, имеющих высшее образование (три признака - пол, возраст, образование), то говорят о комбинационной группировке. В зависимости от решаемых задач она может быть структурной, типологической и аналитической.
Каждой выделенной группе соответствует некоторое число, отражающее ее количественный состав. Такой ряд чисел, получаемый в результате группировки, называется рядом распределения. Ряды распределений, отражающие результат группировки респондентов по качественным признакам, называются атрибутивными., а по количественным - вариационными.
В соответствии с характером количественных признаков вариационные ряды делятся на дискретные и непрерывные. Последние, как правило, носят интервальный характер. Это значит, что та или иная группа респондентов характеризуется по количественному признаку не одним числом, а числовым интервалом, например возрастными интервалами: 20-24 года, 25-30 лет и т.д. Это важно учитывать при вычислении среднестатистического показателя.
В соответствии с задачами группировки интервалы могут выбираться равные и неравные, с возрастающими и убывающими значениями. Числа, обозначающие интервалы, называются их границами.
Составление таблиц не представляет собой отдельный вид математической операции обобщения первичной социологической информации. Эта только форма отображения рядов распределения, имеющая преимущество в том, что в ней кратко даются пояснения числовых значений соответствующих групп. Числовые данные в таблице объясняются заголовками, подлежащим и сказуемым. Заголовки в таблице бывают общие, выступающие в качестве названия таблицы и раскрывающие структуру группировки рассматриваемой совокупности респондентов либо связь между рядами распределения. Наряду с этим в названии таблицы целесообразно указывать место и время, к которым относятся приводимые сведения, а также общие для всех показателей единицы измерения (проценты, число человек, оценочный индекс, номинал денег и т. д.). Содержание строк и столбцов раскрывается внутренними заголовками: боковыми для строк и верхними для столбцов.
Подлежащим в таблице называется объект (совокупность респондентов), характеристики которого - сказуемое - выражены в таблице в числовом виде.
Наряду с табличными в целях наглядности широко применяется графический способ отображения социологических данных. Чаще всего он имеет вид полигона или гистограммы. Полигон преимущественно используется для графического отображения непрерывных рядов, а гистограмма - дискретных.
Более глубокий вид математического анализа характеристик изучаемого явления - выяснение их взаимодействия и тенденций изменения. Осуществляется оно при помощи сравнения и сопоставления рядов распределения, построенных на основании группировок по различным признакам. Для решения подобной задачи существуют специальные коэффициенты. Их называют коэффициентами корреляции.
Корреляцией называют наличие статистической взаимосвязи признаков. Рассмотрим один из них - коэффициент ранговой корреляции. Он легко рассчитывается «вручную», а применение его весьма эффективно при анализе распределении социологической информации, полученной при помощи ранговой шкалы.
Коэффициенты парной корреляции призваны измерять взаимосвязь между двумя признаками исследуемого объекта. Эта взаимосвязь при изучении социальных явлений не обязательно носит причинно-следственный характер. Если при корреляции двух признаков между ними существует причинно-следственная связь, то признак, влияющий на характер вариации другого признака, принято называть факторным, а зависимый от него признак -результативным.
Наиболее простой метод выявления взаимосвязи двух признаков -группировка и сравнение средних. Корреляционная связь двух (или нескольких) признаков социального объекта носит не функциональный, а статистический характер, в связи с чем она является не строгой закономерностью, а лишь тенденцией.
В процессе измерения корреляции между признаками решаются две задачи: определение формы и тесноты связи признаков.
При определении формы связи выявляются вариации (характер изменения) средних параметров результативного под воздействием факторного признака при условии их независимости от других признаков. При установлении направленности и тесноты связи возможны три случая:
- прямая связь - увеличение (уменьшение) параметров факторного признака приводит к увеличению (уменьшению) параметров результативного признака;
- обратная связь - увеличение (уменьшение) параметров факторного признака приводит к уменьшению (увеличению) параметров результативного признака;
- изменение параметров факторного признака не приводит к изменению параметров результативного признака, т. е. корреляция отсутствует.
Наиболее простой метод определения связи между признаками, измеренными при помощи номинальной шкалы - расчет коэффициента ассоциации.
Наиболее совершенным для измерения взаимосвязи между двумя признаками является линейный коэффициент корреляции.
Наряду с приведенными математическими методами обобщения первичной информации и ее сведения в эмпирический показатель путем группировки, либо интеграции в индекс (средняя арифметическая, дисперсия. Коэффициент корреляции), отражающий динамику показателя, исследователь может для решения отдельных задач сам сконструировать некоторый индекс.
Обычно индексы конструируют для решения сложных задач. Успех их построения во многом зависит от находчивости и социологического опыта исследователя.
Таким образом, приведенные виды обобщения и отображения социологических данных в принципе достаточно, чтобы решить задачи, возникающие в ходе опросов общественного мнения.