Подготовка первичной социологической информации к обработке


Обработка данных - один из этапов социологического исследо­вания. Включает ряд компонентов, каждый из которых требует ре­шения организационных, технических, методических, а подчас и теоретических проблем. Необходимо подчеркнуть взаимосвязь эта­па обработки данных с другими этапами исследования. Многие аспекты обработки данных должны учитываться при написании программы исследования, при составлении анкеты, при определе­нии стратегии выборки, а также при оценках сроков, стоимости и трудоемкости всего проекта.

Общая структура этапа обработки данных социологического исследования включает следующие процедуры;

- редактирование и кодирование информации. Основное назна­чение этой процедуры состоит в унификации и формализации той информации, которая была получена в ходе исследования. Часть анкетной информации заранее формализована: даны закрытые воп­росы (т.е. приведены возможные варианты ответов) и проставлены их цифровые коды. Однако нередко в ответах и на такие вопросы встречаются описки, нечеткое написание и др. погрешности, кото­рые устраняются при редактировании собранных анкет. Другой тип данных, собираемых при массовых опросах, представляют ответы на открытые вопросы. Их группировка и последующее кодирова­ние также являются задачей этой процедуры;

- перенос данных на компьютеры. Объем информации, собира­емой в ходе социологического исследования, как правило, доста­точно велик. Среднее по масштабу социологическое исследование дает не менее нескольких тысяч единиц (байт) информации, а в некоторых случаях это число достигает миллионов. Обработка та­ких массивов данных без применения современных компьюте­ров крайне сложна и малоэффективна;

- проверка качества данных и коррекция ошибок;

- создание переменных.

Собранная на основании анкет информации в ряде случаев пря­мо не отвечает на те вопросы, которые необходимо решить в ис­следовании. Связано это с том, что подчас сложно бывает непос­редственно замерить изучаемую характеристику. Для ее получе­ния может потребоваться выполнение ряда преобразований собран­ных данных. Так, для фиксации среднедушевого дохода необходимо задать респонденту вопросы о его зарплате (доходе), о зарплатах членов семьи и о количестве членов семьи и др. После этого для получения показателя среднедушевого дохода необходимо сложить ответы на вопросы о зарплатах и разделить сумму на число членов семьи. Создание переменных является процедурой, в некотором смысле обратной процедуре операционализации понятий: создавае­мые переменные выступают в качестве показателей, изучению кото­рых, собственно, и посвящено исследование. Для многих вопросов анкет получаемая информация непосредственно отвечает задачам исследования, и в этом случае сами вопросы являются переменны­ми;

- статистический анализ. Эта процедура является ключевой в процессе анализа социологических данных. В ходе статистическо­го анализа выявляются искомые статистические закономерности и зависимости. Социологи используют большое число различных математических методов, позволяющих полно и всесторонне ана­лизировать собранную информацию.

Существуют множество программных средств, с помощью ко­торых можно обрабатывать социологическую информацию. Они делятся на два больших класса: специализированные программ­ные средства для социологов и универсальные статистические паке­ты программ.

Подготовка данных к обработке - это один из наиболее трудо­емких этапов эмпирического исследования. В нем можно условно выделить, как мы уже отметили, ввод данных в компьютер; про­верка и чистка данных; специальная подготовка данных.

В организации ввода данных в компьютер за последние годы произошли значительные изменения. Современные статистические пакеты позволяют создавать макеты ввода данных непосредствен­но в компьютере, не загромождая инструментарий избыточной ин­формацией.

Статистический анализ социологических данных обычно при­меняется к исследованию причинных связей между изучаемыми показателями или, точнее, к проверке гипотез о наличии и характе­ре таких связей. Для того, чтобы связь могла рассматриваться как причинная, необходимо (но не достаточно), чтобы выполнялись три принципа причинности (каузальности):

- причины (предикторы) должны во времени предшествовать след­ствию и с очевидностью порождать (инициировать) его наступление; -причины и следствие должны коррелировать друг с другом;

- взаимосвязь причин и следствия должна быть изолирована от влияния других факторов.

Таким образом, выбор методов обработки информации зависит от цели и задач исследования, а также от способов измерения ис­пользуемых показателей. При решении поставленных задач не все­гда удается использовать один или два метода, в основном приме­няют несколько методов.

Предмет: