Происхождение.Представляется возможным классифицировать историческую документацию по ее источникам, а исследование избирательной кампании – по речам, объявлениям, листовкам, газетам; газетные сообщения могут разделяться на местные, национальные, международные.
Вышеуказанные категории касались содержания, но имеются также категории, относящиеся к форме.
Конкретный пример контентного анализа. Две важные проблемы, соответствующие двум этапам анализа.
1. Какие категории следует выбрать? На какой основе собирать данные? Что мы хотим узнать?
2. Как квалифицировать данные? Какие категории следует выбрать.Весьма скоро обнаружилось, что интерес к референдуму выражается в числе «да» и «нет». Можно было также выбрать из газеты аргументы в пользу «да» и в пользу «нет». Эти категории оказались довольно примитивными, поскольку крайне правые и крайне левые голосовали «нет», и степень убежденности тех, кто отвечал «да», оказалась далеко не одинаковой. Кроме того, некоторые политические группы призывали воздерживаться от участия в голосовании или требовали отменить референдум, а ряд газетных статей содержал комментарии без указания позиций.
Чтение газет и размышления натолкнули нас на выбор категорий направления (коммуникаторы надеются на то или другое) и подкатегории интенсивности: энтузиаст, умеренный. Эти категории, как нам показалось, соответствуют техническим требованиям. Они – объективные (даже различение между «да» энтузиаста и «да» умеренного не поднимало трудно объяснимых вопросов, и обе группы кодировщиков получили одинаковые результаты), исчерпывающие, уместные, взаимоисключающие.В связи с последней категорией возник ряд вопросов.
Если целая статья в рубрике «Открытая трибуна» излагает аргументы против референдума, но кончается призывом голосовать «за», то как рассматривать цель всей статьи? Этот случай имеет отношение к проблеме квантификации, которую мы и рассмотрим.
2. Вторая стадия: вопросы квантификации содержания.
Цель анализа заключается в квантификации выбранных при помощи указанных категорий позиций по отношению к референдуму, содержащихся в разных рубриках газеты. Анализ осложнялся следующими обстоятельствами.
1. Кампания продолжалась тридцать дней, и поэтому пришлось изучать 30 номеров газеты.
2. Каждый номер газеты содержал разные рубрики; передовую статью, отражающую направленность газеты, независимые выступления, информацию.
3. В защиту каждой позиции, «да» или «нет», использовались иногда сходные аргументы, но с разными целями.
Нужно ли нам учитывать все номера газет или сделать выборку? Если выборку, то какую? В каком объеме требуется квантификация? Надо ли различать статьи (в том числе по признаку «да» и «нет»)? Какие еще единицы надо подсчитывать? Считать ли количество слов «да» и «нет», считать ли количество строк или сантиметров текста, посвященного этим позициям?
К основным проблемам квантификации контентного анализа относятся:
Проблема выборки.Первые контентные анализы страдали от отсутствия методики при выборе источников: иногда стремились рассматривать все тексты, иногда изучали ряд речей и т. д.
Что может обеспечить репрезентативность выборки документов? Заранее это неизвестно. Чаще всего признаки определяют в зависимости от формулируемых гипотез; это, однако, малонаучно и может не учитывать всех факторов.
Проблема выборки содержит в себе три решения, если речь идет об анализе коммуникации: выбор источника, число и дата сообщений, исследуемое содержание.
Выбор источника. Этот выбор зависит от задачи. При изучении прессы можно сделать географическую выборку, учитывающую роль местных газет. Если речь пойдет о сравнении разных аудиторий читателей на основе анализа романов, печатаемых в журналах и читаемых в разных кругах, изучаемая совокупность будет состоять из всех романов, печатаемых во всех журналах, вышедших в стране за какое-то определенное время.
Но можно провести и репрезентативную выборку этих журналов, а также выборку романов из каждого журнала. В данном случае мы сталкиваемся со сложной проблемой репрезентативной выборки. Можно ли считать репрезентативным роман, если журнал, в котором он публикуется, имеет небольшое число читателей или страниц? Публикует ли данный журнал лишь этот или несколько романов?
Если исследователь в состоянии подтвердить общие выводы, которые он сформулировал на основании изученных данных, он должен суметь точно выразить мотивы, которые побудили его ограничить изучаемую совокупность.
Число сообщений и временной диапазон. Чтобы выборка была достаточно репрезентативной, нужно установить затем, каково должно быть число сообщений и какой период времени они должны охватывать. Время зависит от избираемой темы. В частности, речь может идти о послевоенном периоде или о впечатлении от определенных речей за три месяца.
Нужно, чтобы изучаемая единица с определенной вероятностью попадала в выборку и в то же время была независимой от любых корреляций между единицами этой совокупности.
Представим, что мы решили ограничиться выборкой одного номера данной газеты из семи. Что мы должны делать, если выбор падает на воскресный выпуск, который значительно отличается от других? Необходимо заранее отметить периодические отклонения выбранных источников, которые могут влиять на характер сообщений.
Наблюдаемое содержание. Остается, наконец, определить выборку выборки, то есть установить наблюдаемое содержание изучаемой газеты за конкретный период. Содержание должно соответствовать свойствам газеты, которые зависят от типографии, от расположения и т. д. Так, первая страница газеты отличается от последней.
Разные единицы квантификации.При квантификации надо выбрать постоянные признаки категорий и установить величину элементов, на которые расчленяется содержание.
Единица регистрации. Первой единицей анализа является единица регистрации.Это определенный сегмент содержания, который характеризуется при введении его в определенную категорию.
Единицы регистрации являются переменными величинами. Слово – мельчайшая единица. Можно подсчитать, сколько раз в тексте употреблялись определенные слова. Например, в анализе политического текста, содержащего такие категории, как «национализм» и т. д., слова «родина» и «нация» могут причисляться к единицам регистрации в категории «национализм».
Тема – это значимый фрагмент, соответствующий идее, которая охватывает одну из категорий. Вместо того чтобы ограничиться словом «родина» в предыдущем примере, можно взять тему, например, «демократия».
Тема – элемент менее точный, чем слово, так как она может занимать две строчки или страницы. Можно удовлетвориться числом повторяющихся упоминаний темы, как и числом повторяющихся слов. Но не будет ни точным, ни соответствующим действительности равно учитывать краткое упоминание и пространное изложение темы.
Понятно, что, кроме единицы регистрации, которая представляет элемент, иллюстрирующий данную категорию, требуется еще более гибкая и точная единица измерения, чем число повторений. Ниже мы встретимся с такой единицей, которая называется единицей перечисления.
Предмет.Этот, несомненно, наиболее употребляемый термин в широком смысле слова означает содержание целиком – книги, фильма, речи. В узком смысле «предмет» может быть синонимом единицы регистрации, то есть всего того, что подвергается измерению. Слово, тема, вопрос, употребленные в смысле единицы регистрации, рассматриваются просто как предметы.
Единица контекста. Это более гибкое понятие, не предполагающее строгой квантификации. Это лишь более широкий сегмент содержания,к которому мы обращаемся, чтобы понять саму единицу регистрации.
Например, если единицей регистрации является слово, то единицей контекста может быть предложение.
Единица перечисления. Здесь речь идет не о значении, которое надо подсчитать, а о способе самого подсчета. Другими словами, если установление единицы регистрации преследует цель – на что указывает само это понятие – выделения значимого элемента, то единица перечисления касается способа перечисления разных выделенных частей.