МЕТОД КОНТЕНТ-АНАЛИЗА В ИССЛЕДОВАНИИ БЛОГОСФЕРЫ - Студенческий научный форум

VIII Международная студенческая научная конференция Студенческий научный форум - 2016

МЕТОД КОНТЕНТ-АНАЛИЗА В ИССЛЕДОВАНИИ БЛОГОСФЕРЫ

Толмачев Р.В. 1, Воронова Л.И. 1
1МТУСИ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
В статье кратко описываются возможности контент-анализа в исследовании блогосферы, выявленные при анализе предметной области для информационной системы, разрабатываемой в рамках ВКР на тему «Разработка ресурса для контент-анализа интернет-публикаций», научн. рук. проф. Воронова Л.И.).

Исследование блогов, как источников интеллектуальной и социологической информации, имеет важное значение при анализе различных социальных явлений. Блогосфера это важный источник, который позволяет узнать реакцию людей на ту или иную проблему. Для блогов характерны публичность, наличие сторонних читателей и возможность свободного обсуждения. Это дает заинтересованным лицам большое количество исходных данных для контент-анализа.

В нашей стране растет популярность создания личных и деловых блогов, а это значит что для обработки такого количества информации целесообразно использовать и разрабатывать ресурсы, позволяющие автоматически анализировать доступные данные.

В работе блоги рассматриваются, как совокупность различной информации: записей, мультимедиа файлов, ссылок, комментариев. При этом внимание акцентируется не на количественном варианте контент-анализа, а на качественном, предполагающем анализ содержания текстовых массивов и дальнейшей интерпретации числовых результатов.

В [1] приводится такое определение: контент-ана́лиз (от англ.: англ. contents — содержание, содержимое) или анализ содержания — стандартная методика исследования в области общественных наук, предметом анализа которой является содержание текстовых массивов и продуктов коммуникативной корреспонденции.

В подавляющем большинстве объектами исследования являются тексты. В 60-80 годы прошлого столетия во время так называемого «методологического взрыва» исследования с применением методики контент-анализа были чрезвычайно активны.

В настоящее время интерес к этой области исследований резко возрос, в связи с огромным количеством информации, находящейся в интернете.

Типы контент-анализа

Существует 2 типа контент-анализа: количественный и качественный. Количественный контент-анализ (также именуется содержательным) основывается на исследовании слов, тем и сообщений, сосредоточивая внимание исследователя на содержании сообщения. Таким образом, собираясь подвергнуть анализу выбранные элементы, нужно уметь предвидеть их смысл и определять каждый возможный результат наблюдения в соответствии с ожиданиями исследователя[2]. На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа исследователь должен создать своего рода словарь, в котором каждое наблюдение получит определение и будет отнесено к соответствующему классу[2]. Проблема состоит в том, что исследователь должен предвидеть не только упоминания, которые могут встретиться, но и элементы их контекстуального употребления, а для этого должна быть разработана детальная система правил оценки каждого случая употребления. Эта задача обычно решается посредством пилотажа подлежащей анализу совокупности сообщений (то есть с помощью выявления на материале небольшой выборки сообщений тех типов ключевых упоминаний, которые с наибольшей вероятностью могут встретиться в последующем, более полном анализе) в сочетании с арбитражными оценками контекстов и способов употребления терминов. Предпочтительнее иметь дело с наблюдениями не одного, а нескольких исследователей[2].

В качественном анализе текста разделяют проведение внутреннего и внешнего анализа сообщения[3].

Внешний анализ предполагает:

  • изучения контекста написания сообщения

  • условия написания

  • позиции адресата, адресантов и сообщения

  • общественный резонанс

  • форму документа

Внутренний анализ:

  • изучает достоверность указанных данных

  • установки автора сообщения

  • цель написания документа

  • латентный смысл написанного, его подтекст

Достоинством качественного метода изучения текста служит глубина познания, высокая информативность. Недостатками метода являются субъективность исследования, отсутствие возможности статистического подтверждения гипотез. Сложность проведения — высокие требования к уровню подготовки специалистов.

Примеры применения контент-анализа в блогосфере[4]

Цель: выявить степень различия в изображении скрытой агрессии интимного партнёра в блогах и в реальности. Выборка: публикации за месяц, стратифицированные на основе знаний о географии рынка. Единица анализа: пост (публикация).

Категории: тип агрессии; отношение между жертвой и агрессором; место происшествия акта агрессии. Статистика: z-тест

Цель: выявить, как представляются различные социальные группы в испаноязычных блогах. Выборка: блоги, публикующиеся в течении недели в наиболее активное время просмотра интернет аудиториями. Единица анализа: главные герои. Категории: демографические характеристики; физические атрибуты; речевые характеристики. Статистика: ANOVA.

Цель: описать представление пластической хирургии в интернет новостях. Выборка: Анонсы (сводки) новостей с 1972 по 2004 года. Единица анализа: сводка. Категории: типы пластической хирургии; новостные источники; типы проблем. Статистика: процентное соотношение.

Результаты контент-анализа

Результатом контент-анализа будут разного рода показатели и индексы. Например[5]

  1. Pr-охват – количество лиц, которые могли ознакомиться с публикацией. Этот показатель зависит от количества опубликованных статей и аудитории, тиража опубликовавших их СМИ;

  2. Оценка Pr-бюджетов – это сумма денег, которые потратила на свою pr-компанию тот или иной человек. Рассчитывается на основе рекламных тарифов по каждому СМИ;

  3. Тематика публикаций – данный показатель по одному автору или нескольким в целом даст представление о том, какие темы сейчас волнуют людей;

  4. Характер публикаций – оценивается как "конфликт", "позитив", либо "другое". Данная оценка позволяет выявить "дружественных" и "враждебных" авторов, СМИ;

  5. Рейтинг авторов – это распределение авторов по количеству написанных ими публикаций об исследуемой теме и т.д..

Программы, позволяющие производить контент-анализ

  1. QDAminer[6]

QDA miner – компьютерная программа, предназначенная для проведения качественных исследований. С ее помощью можно кодировать, комментировать и анализировать большие и маленькие объемы документов и визуальной информации.

В программе есть множество полезных процедур, например:

  • Инструмент “Text Retrieval” (текстовый информационный поиск) позволяет проводить поиск различных текстовых единиц в документе -

  • Инструмент “Section Retrieval” (секционный информационный поиск) выискивает сегменты документа, ограниченного определенными характеристиками.

  • Инструмент “Keyword Retrieval” (информационный поиск по ключевым словам) позволяет извлекать информацию из любого документа, параграфа, предложения или закодированного сегмента.

  • Инструмент “Coding Frequencies” (статистика кодирования) позволяет составить список кодов существующей кодовой книги с их описанием и статистической информацией.

  1. ВААЛ[7]

Система ВААЛ реализована в виде набора DLL-библиотек, которые подключаются к наиболее популярному текстовому процессору Word for Windows.

Система позволяет:

  • Оценивать неосознаваемое эмоциональное воздействие фонетической структуры текстов и отдельных слов на подсознание человека.

  • Генерировать слова с заданными фоносемантическими характеристиками.

  • Оценивать неосознаваемое эмоциональное воздействие фонетической структуры текстов на подсознание человека.

  • Задавать характеристики желаемого воздействия и целенаправленно корректировать тексты по выбранным параметрам в целях достижения необходимого эффекта воздействия.

  • Оценивать звуко-цветовые характеристики слов и текстов.

  • Производить словарный анализ текстов.

  • Осуществлять полноценный контент-анализ текста по большому числу специально составленных встроенных категорий и категорий, задаваемых самим пользователем.

  • Производить выделение тем, затрагиваемых в текстах, и осуществлять на основе этого автоматическую категоризацию.

  • Производить эмоционально-лексический анализ текстов.

  • Настраиваться на различные социальные и профессиональные группы людей, которые могут быть выделены по используемой ими лексике.

  • Производить вторичный анализ данных путем их визуализации, факторного и корреляционного анализа.

Выводы

При восприятии текста и особенно больших текстовых потоков, таких как блоги, мы достаточно хорошо ощущаем, что разные формальные и содержательные компоненты представлены в них в разной степени, причем эта степень по крайней мере отчасти поддается измерению: ее мерой служит то место, которое они занимают в общем объеме, и/или частота их встречаемости.

Основная идея контент-анализа заключается в том, чтобы систематизировать эти интуитивные ощущения, сделать их наглядными и проверяемыми и разработать методику целенаправленного сбора тех текстовых свидетельств, на которых эти ощущения основываются. При этом предполагается, что вооруженный такой методикой исследователь сможет не просто упорядочить свои ощущения и сделать свои выводы более обоснованными, но даже узнать из текста больше, чем хотел сказать его автор, ибо, скажем, настойчивое повторение в тексте каких-то тем или употребление каких-то характерных формальных элементов или конструкций может не осознаваться автором, но обнаруживает и определенным образом интерпретируется исследователем.

Список источников и литературы

1. https://ru.wikipedia.org/wiki/Контент-анализ

2. Мангейм Дж.Б., Рич Р.К. Политология: Методы исследования (http://grachev62.narod.ru/Mr/)

3. http://c-discurs.ru/methods/kontent-analiz/katschestvennyiy-kontent-analiz/

4. ROGER D. WIMMER и JOSEPH R. DOMINICK «Mass Media Research»

  1.  
    1.  
      1. http://www.sociocity.ru/scitys-652-1.html

      2. QDA minerпособие по работе

      3. http://www.vaal.ru

Просмотров работы: 3032