Обработка данных - один из этапов социологического исследования. Включает ряд компонентов, каждый из которых требует решения организационных, технических, методических, а подчас и теоретических проблем. Необходимо подчеркнуть взаимосвязь этапа обработки данных с другими этапами исследования. Многие аспекты обработки данных должны учитываться при написании программы исследования, при составлении анкеты, при определении стратегии выборки, а также при оценках сроков, стоимости и трудоемкости всего проекта.
Общая структура этапа обработки данных социологического исследования включает следующие процедуры;
- редактирование и кодирование информации. Основное назначение этой процедуры состоит в унификации и формализации той информации, которая была получена в ходе исследования. Часть анкетной информации заранее формализована: даны закрытые вопросы (т.е. приведены возможные варианты ответов) и проставлены их цифровые коды. Однако нередко в ответах и на такие вопросы встречаются описки, нечеткое написание и др. погрешности, которые устраняются при редактировании собранных анкет. Другой тип данных, собираемых при массовых опросах, представляют ответы на открытые вопросы. Их группировка и последующее кодирование также являются задачей этой процедуры;
- перенос данных на компьютеры. Объем информации, собираемой в ходе социологического исследования, как правило, достаточно велик. Среднее по масштабу социологическое исследование дает не менее нескольких тысяч единиц (байт) информации, а в некоторых случаях это число достигает миллионов. Обработка таких массивов данных без применения современных компьютеров крайне сложна и малоэффективна;
- проверка качества данных и коррекция ошибок;
- создание переменных.
Собранная на основании анкет информации в ряде случаев прямо не отвечает на те вопросы, которые необходимо решить в исследовании. Связано это с том, что подчас сложно бывает непосредственно замерить изучаемую характеристику. Для ее получения может потребоваться выполнение ряда преобразований собранных данных. Так, для фиксации среднедушевого дохода необходимо задать респонденту вопросы о его зарплате (доходе), о зарплатах членов семьи и о количестве членов семьи и др. После этого для получения показателя среднедушевого дохода необходимо сложить ответы на вопросы о зарплатах и разделить сумму на число членов семьи. Создание переменных является процедурой, в некотором смысле обратной процедуре операционализации понятий: создаваемые переменные выступают в качестве показателей, изучению которых, собственно, и посвящено исследование. Для многих вопросов анкет получаемая информация непосредственно отвечает задачам исследования, и в этом случае сами вопросы являются переменными;
- статистический анализ. Эта процедура является ключевой в процессе анализа социологических данных. В ходе статистического анализа выявляются искомые статистические закономерности и зависимости. Социологи используют большое число различных математических методов, позволяющих полно и всесторонне анализировать собранную информацию.
Существуют множество программных средств, с помощью которых можно обрабатывать социологическую информацию. Они делятся на два больших класса: специализированные программные средства для социологов и универсальные статистические пакеты программ.
Подготовка данных к обработке - это один из наиболее трудоемких этапов эмпирического исследования. В нем можно условно выделить, как мы уже отметили, ввод данных в компьютер; проверка и чистка данных; специальная подготовка данных.
В организации ввода данных в компьютер за последние годы произошли значительные изменения. Современные статистические пакеты позволяют создавать макеты ввода данных непосредственно в компьютере, не загромождая инструментарий избыточной информацией.
Статистический анализ социологических данных обычно применяется к исследованию причинных связей между изучаемыми показателями или, точнее, к проверке гипотез о наличии и характере таких связей. Для того, чтобы связь могла рассматриваться как причинная, необходимо (но не достаточно), чтобы выполнялись три принципа причинности (каузальности):
- причины (предикторы) должны во времени предшествовать следствию и с очевидностью порождать (инициировать) его наступление; -причины и следствие должны коррелировать друг с другом;
- взаимосвязь причин и следствия должна быть изолирована от влияния других факторов.
Таким образом, выбор методов обработки информации зависит от цели и задач исследования, а также от способов измерения используемых показателей. При решении поставленных задач не всегда удается использовать один или два метода, в основном применяют несколько методов.