Литмир - Электронная Библиотека
A
A

Глава 9 посвящена обсуждению факторного анализа (ФА) и метода главных компонент (МГК). Приводится обсуждение различий метода ФА и МГК. Факторный анализ претендует на выявление некоторых латентных переменных, а метод главных компонент позволяет сократить размерность пространства. Таким образом, он может быть обоснованием создания индекса.

Глава 10 описывает методику проведения кластерного анализа, представляющего метод многомерной классификации данных, позволяющего находить группы похожих объектов в пространстве данных по заданным параметрам классификации. В главе также рассматривается метод классификации к-средних.

Глава 11 рассматривает метод деревьев решений (CHAID), который также относится к методам многомерной классификации. С помощью данного метода можно ответить на вопрос, какие из независимых переменных наиболее сильно связаны с зависимой переменной. В социологии данный метод часто применяется для построения социально-демографического портрета какой-либо из социальных групп. Метод очень нагляден, удобен в интерпретации и в использовании, поскольку позволяет осуществить применение любого вида шкал, а также он устойчив к выбросам, позволяет улавливать не только линейные, но и нелинейные связи.

Глава 12 описывает дискриминантный анализ. Данный метод многомерной классификации предполагает предсказание попадания объектов в определенный класс. Задача метода – узнать, отличаются ли друг от друга классы по заданным параметрам.

Перед прочтением данного учебного пособия рекомендуем повторить[1] базовые для социолога понятия, которые будут встречаться в тексте, такие как выборка, генеральная совокупность, статистическая гипотеза, доверительный интервал, ошибка первого и второго рода, нулевая и альтернативная гипотезы, статистическая значимость, нормальное распределение, мода, медиана, среднее значение и другие.

Необходимо отметить, что при анализе данных в большинстве случаев мы имеем дело с выборками, а не с генеральной совокупностью. Практически никогда у нас нет в доступе генеральной совокупности. Поэтому за страницами данной книги останутся темы качества выборки, ее репрезентативности, правильного сбора данных, так как это темы для отдельного обсуждения.

Для исследовательских задач редко бывает необходимо получать результаты по конкретной нерепрезентативной выборке, обычно важно переносить результаты выборки на генеральную совокупность. Поэтому в учебном пособии большое внимание уделяется способам переноса данных с исследуемой выборки на генеральную совокупность, для этого осуществляется проверка статистических гипотез. Большинство методов анализа, которые мы будем обсуждать, предполагают генерализацию выводов (то есть статистическую проверку того, что вывод, полученный на выборке, которую мы используем, характерен и для генеральной совокупности).

Автор книги – Наталья Сергеевна Воронина – кандидат социологических наук, старший научный сотрудник Института социологии ФНИСЦ РАН, доцент Государственного университета гуманитарных наук (где преподает дисциплину «Практикум по анализу данных в социологии» с 2017 года), автор более 50 научных публикаций по социологии, участник многочисленных научных грантов РНФ, РФФИ. Наталья Сергеевна Воронина окончила школу с золотой медалью, с 2005 по 2010 год обучалась в ГАУГН (получен диплом с отличием, специальность «социолог, преподаватель социологии»), затем продолжила освоение количественных методов в социологии с помощью ряда курсов повышения квалификации (2017 год – «Количественный анализ социальных данных на основе SPSS и R» НИУ ВШЭ, 2017 год – «Методы многомерной классификации» НИУ ВШЭ, 2019 год – «Математические методы в психологии» СПбГУ, 2019 год – «Эксперт IBM SPSS Statistics» МГТУ имени Баумана).

Автор хотел бы поблагодарить своих преподавателей количественных методов Г. Г. Татарову, Ю. Н. Толстову, А. В. Стрельникову, А. Ю. Кропачева, Ю. Б. Епихину, М. Ф. Черныша, которые оказали неоценимую поддержку автору на этапе приобретения исследовательских навыков, призывали аккуратно относиться к анализу данных, познакомили с количественными методами и привили любовь к аналитической деятельности. Автор благодарит рецензентов Д. С. Григорьева, А. В. Стрельникову и А. В. Кученкову, а также Практикум по анализу данных в социологии в программе SPSS А. В. Жаворонкова за ценные комментарии и научную редактуру, которые были учтены при доработке текста. Благодарю А. В. Андреенкову за возможность анализировать российские данные Европейского Социального Исслледования, Ю. А. Зубок за небезразличное отношение к проблемам молодых ученых, коллег из ИСФНИСЦ РАН, которые всегда помогали советом и вдохновляли личным примером. Благодарю Д. Колодинского за качественную верстку данного учебного пособия. А также благодарю всю свою семью за поддержку.

Автор отдельно хотел бы поблагодарить преподавателя курсов повышения квалификации в НИУ ВШЭ Воронину Наталью Дмитриевну, чьи лекции были полезными для освоения навыка анализа данных. Знания, полученные на этих курсах, были использованы автором в собственной преподавательской деятельности и при составлении данного учебного пособия.

Автор благодарит талантливую молодую художницу Галину Рачко, придумавшую и создавшую иллюстрации к этой книге, с помощью которых мир анализа данных, мы надеемся, станет еще увлекательнее.

Глава 1. Практическое применение навыка анализа данных

Перед начинающим исследователем часто стоит вопрос: как в действительности применить навыки использования анализа данных?

В практике руководства студенческими работами автор часто сталкивается с тем, что студенты, освоив некоторый набор методов анализа данных и включив в текст некоторую аналитику данных, ошибочно полагают, что они тем самым подготовили научную работу. Поэтому мы считаем необходимым начать обсуждение с того, какое место занимает анализ данных в структуре научной работы.

В методической литературе существует большое количество описаний того, как строится научная деятельность и как написать научную работу. Этот процесс всегда содержит творческий элемент, видение автора, однако работать в некоторой структуре всегда легче, чем без нее. В самом упрощенном виде логику написания научной работы можно представить таким образом:

1.1. Примерный план научной работы

• Введение (актуальность, проблема, цель, задачи).

• Глава 1. Основные теоретические подходы к вашей теме.

• 1.1. Обоснование выбора теоретического подхода, используемого в работе.

• 1.2. Обзор зарубежных исследований о вашей теме.

• 1.3. Обзор российских исследований о вашей теме.

• Гипотезы.

• Глава 2. Данные и метод.

• 2.2. Результаты.

• 2.3. Обсуждение.

• Используемая литература.

Разберем подробнее каждый из пунктов.

Прежде всего стоит сказать несколько слов о выборе области исследования для научной работы. Для лучшей мотивации к работе над текстом стоит выбирать область, которая вас действительно интересует и увлекает.

Чтобы определить область исследования, необходимо сначала немало прочитать и записать много вариантов того, как может звучать ваша тема исследования. Советуем записывать варианты и затем обсуждать их с научным руководителем. Чтобы корректно и лучшим образом сформулировать тему исследования, посмотрите названия научных статей, диссертаций на выбранную вами тематику. Нужно помнить: то, что допускается для названия научной статьи, не всегда допускается для студенческих / аспирантских работ. Название для ВКР / диссертации должно быть сформулировано таким образом, чтобы оно не просто включало в себя описательный характер (например, «Особенности студенческой молодежи города Москвы»), а содержало в себе проблемную составляющую (например, «Влияние экономических и культурных ресурсов на успеваемость школьников из многодетных семей»[2]). Чаще всего тема, содержащая слово «особенности», сформулирована по принципу «это просто интересно посмотреть», не содержит научной новизны и как таковой исследовательской проблемы. Иначе говоря, выявление особенностей какой-либо социальной группы не является проблемой исследования, а сам термин «особенности» даже не является научным, но о формулировке проблемы исследования поговорим чуть позже.

вернуться

1

Например, по литературе: Пашкевич А. В. Теория вероятности и математическая статистика для социологов и менеджеров: Учебник для вузов / Под. ред. А. А. Макарова. Новое издание. – М.: МЦНМО, 2020. С 352.

вернуться

2

Епихина Ю. Б. Влияние экономических и культурных ресурсов на успеваемость школьников из многодетных семей: Автореф. дисс. к. соц.н. // Официальный сайт ИC РАН. 2011. URL: http://www.isras.ru/publ.html?id=2216.

2
{"b":"899688","o":1}