ПРИМЕНЕНИЕ НЕЧЕТКИХ ИНТЕРФЕЙСОВ ДЛЯ ОБРАБОТКИ НЕЧИСЛОВЫХ ДАННЫХ И СНИЖЕНИЯ ИХ СУБЪЕКТИВНОСТИ ПРИ ПРОВЕДЕНИИ ФЕДЕРАЛЬНЫХ СТАТИСТИЧЕСКИХ НАБЛЮДЕНИЙ - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

ПРИМЕНЕНИЕ НЕЧЕТКИХ ИНТЕРФЕЙСОВ ДЛЯ ОБРАБОТКИ НЕЧИСЛОВЫХ ДАННЫХ И СНИЖЕНИЯ ИХ СУБЪЕКТИВНОСТИ ПРИ ПРОВЕДЕНИИ ФЕДЕРАЛЬНЫХ СТАТИСТИЧЕСКИХ НАБЛЮДЕНИЙ

Темерова Н.И. 1
1Сибирский федеральный университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Вступление

Исследования, связанные с человеческим фактором, несут в себе необходимость обработки нечисловых, субъективных данных, что принимает особую актуальность в сфере использования статистических данных при принятии управленческих решений на различных уровнях. Федеральные статистические наблюдения представляют собой основной источник получения экономических данных, формируемых в качестве официальной статистической информации. Потребителями официальной статистической информации, которые принимают управленческие решения, выступают органы государственной власти и местного самоуправления, а также юридические лица. При этом, показатели ряда форм федерального статистического наблюдения содержат информацию, основанную на экспертной оценке респондентов, снижение ее субъективности на этапах ввода и обработки данных сможет повысить ее значимость и уровень информативности для потребителей.

В настоящее время в формах статистических наблюдений, которые включают экспертную оценку респондента, предусмотрены варианты ответа, представляющие собой лингвистическую шкалу с положительным, нейтральным и отрицательным вариантами ответа, – тем самым процесс обработки полученных данных сводится к анализу долей респондентов, ответивших тем или иным образом. При этом, субъективные сведения респондентов, которые, как правило, выходят за рамки трех вариантов ответа, предполагая наличие промежуточных мнений, не поддаются формализации. Указанные факторы влекут за собой трудности, связанные, во-первых, с организацией такого способа сбора и последующего ввода данных, который обеспечивал бы корректную интерпретацию мнения респондента, который, в свою очередь, не в состоянии достаточно точно выразить оцениваемые сведения способом, предусмотренным рамками форм и указаний к ним, во-вторых, с последующим анализом полученных в результате наблюдения данных.

Проблема решается простым сочетанием алгоритмов четкой и нечетной логики при обработке полученных данных, однако, традиционный нечеткий логический вывод основывается на вводе количественных данных, либо конкретных лингвистических переменных, что затрудняет его применение напрямую, поскольку при первом варианте ввода – формы ответа в рамках указанных статистических наблюдений не предусматривают ввода числовых данных, во втором – лингвистические переменные достаточно ограничены (как правило, до трех).

Поэтому необходимо применение такого способа ввода данных, который будет основан на нечеткой логике, что позволит опрашиваемым максимально просто и точно выразить свои субъективные ощущения по вопросам, которые невозможно оценить другими способами.

Опыт Красноярскстата в использовании лингвистических шкал для обработки нечисловых данных

Ежегодно Красноярскстат проводит исследование удовлетворенности пользователей официальной статистической информации. Индекс удовлетворенности пользователей определяется на основе интегральной экспертной оценки, данной респондентами по отдельным индикаторам. В исследованиях, проводимых в 2011 – 2013 годах, использовались полярные (оппозиционные) лингвистические шкалы с бинарными оценками: удовлетворен – не удовлетворен, согласен – не согласен, доверяю – не доверяю. С 2014 года варианты ответов на вопросы анкеты были построены с использованием балльной системы экспертной оценки, приведенной в соответствие методике определения удовлетворенности пользователей официальной статистической информации Росстата. Методика предусматривает одновременное использование полярной лингвистической шкалы с четырьмя лингвистическими оценками и соответствующей ей десятибалльной шкалы. В таблице приведена расшифровка шкалы для оценки уровня удовлетворенности:

Значение лингвистической шкалы

Значение числовой десятибалльной шкалы

не удовлетворен

1 – 3

скорее не удовлетворен

4 – 5

скорее удовлетворен

6 – 7

удовлетворен

8 – 10

Таким образом, шкала приближена к симметричной шкале Стейпла, исключающей нейтральные оценки и представляющей возможность респонденту выразить, в какой мере к официальной статистической информации относится та или иная характеристика.

Одновременное использование лингвистической и числовой шкал обеспечивает, с одной стороны для респондента – более точное и однозначное выражение своей точки зрения при ответе на вопрос, который носит субъективный характер, с другой – для исследователя – предоставляет инструментарий, позволяющий дать объективную оценку ситуации, используя в процессе интерпретации терминологию респондента.

Исследования, проведенные Красноярскстатом в 2011 – 2013 годы, позволили выявить доли респондентов, удовлетворенных или не удовлетворенных качеством статистической информации. Введенная в анкеты 2014 года шкала позволила дать уровню удовлетворенности не только количественную (какая доля респондентов удовлетворена официальной статистической информацией), но и качественную (в какой мере респонденты удовлетворены официальной статистической информацией) оценку. Тем самым для лиц, принимающих управленческие решения, введение такой системы оценки, повлекло доступность более полной информативности полученных сведений для анализа и принятия в последующем на его основе корректирующих мер. К примеру, положительной может считаться тенденция незначительного снижения доли удовлетворенных пользователей при существенном росте балльной оценки, и, напротив, негативной – тенденция, при которой наряду с увеличением доли удовлетворенных пользователей наблюдается существенное снижение балльной оценки удовлетворенности пользователей.

Таким образом, опыт Красноярскстата демонстрирует использование дискретных шкал оценки, характеризуемое ввиду наибольшей продуктивности тенденцией перехода к непрерывным шкалам, которые требуют нечеткого ввода данных.

Визуальный интерфейс нечеткого ввода данных

Для обеспечения нечеткого ввода был разработан визуальный интерфейс. В простейшем случае он представляет собой шкалу-слайдер, концы которого обозначены лингвистическими переменными, с движущимся курсором. Также возможно условное деление шкалы с использованием промежуточных лингвистических переменных, порядок и расположение которых будет соответствовать их степени принадлежности Опрашиваемый может поместить курсор в любое место шкалы, так, чтобы это максимально соответствовало его ощущениям, связанным с экспертными знаниями. В зависимости от положения курсора будет рассчитываться конкретное значение функции принадлежности.

Применение подобных интерфейсов при проведении статистических наблюдений в электронной форме позволяет наиболее точно определить значение функции принадлежности для опрашиваемого, так как он не ограничен в своих ответах конечным набором вариантов (лингвистических переменных), а может выбрать промежуточное значение, наиболее точно выражающее его мнение. Данный интерфейс может быть адаптирован под различные типы функций принадлежности. Для функций заданных так, что внутри некоторого интервала функция принадлежности равна 1, а вне этого интервала равна 0 достаточно описанной шкалы с обозначенными крайними точками. Для функции типа треугольника, которая задается тремя числами A < B < C , при этом левее A и правее C функция принадлежности равна 0, а точке B функция принадлежности принимает значение 1, возможно 2 варианта применения данного интерфейса. Первый вариант - поместить лингвистическую переменную, советующую точке B в центр. В первом варианте шкала будет иметь 1 курсор, и значение функции принадлежности будет задаваться его удаленностью от точки B, во втором варианте реализации предусматривается 2 курсора, на отрезках [A; B] и [B; C], а результирующим значением функции принадлежности будет среднее расстояние от курсоров до точки B.

Для функции принадлежности типа трапеции пользовательский интерфейс формируется аналогично.

В результате применения такого пользовательского интерфейса по каждому вопросу будет получена уже фаззифицированная, т.е. приведенная к «нечеткому» виду, степень принадлежности, тем самым исключится необходимость в фаззификации входных величин. Рисунок 1 иллюстрирует изменения, связанные с применением интерфейса нечеткого ввода по сравнению с традиционным алгоритмом обработки данных с помощью нечеткой логики.

Рисунок 1. Использование нечеткого ввода данных

Полученные в результате проведенного наблюдения данные могут обрабатываться стандартными методами нечеткого логического вывода, обеспечивая тем самым на выходе четкое значение величины, пригодное для последующего агрегирования и анализа.

Использование визуального интерфейса для ввода данных при проведении федеральных статистических наблюдений

Росстатом предусмотрены формы федерального статистического наблюдения, в которых информация, полученная на основе экспертных оценок респондентов, носит качественный характер. К подобного рода наблюдениям относятся в частности обследования деловой и инвестиционной активности организаций, по которым предусмотрены формы: № ДАС «Обследование деловой активности строительной организации», № ИАП «Обследование инвестиционной активности организаций», № ДАФЛ «Обследование деловой активности организации, осуществляющей деятельность в сфере финансового лизинга», № ДАП-ПМ «Обследование деловой активности малых предприятий добывающих, обрабатывающих производств, производства и распределения электроэнергии, газа и воды». В указанных формах респонденты дают оценку ситуации, производственной деятельности, финансовым показателям, ценам и т.д.

В соответствии с указаниями к заполнению форм показатели ряда разделов являются качественными и представляют собой экспертные оценки соответствующих показателей деятельности, определяемые на основе профессионального мнения руководителя (менеджера) предприятия, т.е. на основе субъективной оценки. В свою очередь, следует отметить, что пользователями официальной статистической информации в соответствии с Федеральным законом от 29.11.2007 № 282-ФЗ "Об официальном статистическом учете и системе государственной статистики в Российской Федерации" выступают государственные органы, а также органы местного самоуправления, принимающие управленческие решения и нуждающиеся в качественной информации, объективно отражающей реальное состояние ситуации, что свидетельствует о важности получения органами статистики максимально полных, объективных сведений.

Применение информационных технологий в процессе сбора статистической отчетности позволяет проводить обследования с использованием электронных форм федеральной статистической отчетности, достоверность которых обеспечивается электронной подписью. Это позволяют шире внедрять визуальный интерактивный интерфейс для ввода данных, что позволяет реализовать ввод субъективных данных с использованием лингвистических переменных. Такой способ ввода данных позволяет, как было показано выше, повысить точность обработки субъективных экспертных оценок респондентов, а использование электронной подписи и электронного ввода в целом, позволит повысить точность ввода данных за счет снижения роли воздействия человеческого фактора. Однако следует учитывать, что на сегодняшний день существует доля респондентов, отчитывающихся по формам федерального статистического наблюдения с использованием традиционной формы предоставления информации – на бумажных носителях. В таких случаях для обеспечения объективности и сопоставимости данных в бланке формы следует предусмотреть либо шкалу, на которой пользователь смог бы указать условным знаком свою оценку, что является полным аналогом нечеткого ввода данных в электронном виде, либо окно для фиксации своего отношения к ситуации посредством значения от 1 до 100, которое впоследствии будет фаззифицировано для интеграции с данными, полученными в электронном виде.

Заключение

Резюмируя, следует подчеркнуть несомненные преимущества использования визуального интерфейса нечеткого ввода в процессе ввода и обработки данных. Разработанный метод использования визуального интерфейса для ввода субъективных данных позволит повысить привлекательность заполнения форм со стороны респондентов за счет того, что формами будет предусмотрен весь спектр вариантов ответа для респондента, обеспечив тем самым точность предоставляемых сведений и сокращение времени на заполнение (у опрашиваемого исключает потребность в дополнительном обдумывании предложенных вариантов ответа для определения из них того, который соответствует его субъективному мнению в большей мере). Со стороны Красноярскстата как субъекта официального статистического учета метод наряду со снижением трудоемкости ввода данных обеспечивается рост точности ввода данных, обусловленный снижением роли человеческого фактора оператора, производящего ввод данных. В свою очередь, на этапе предоставления информации - повышение ее объективности, связанное с более точной передачей сложно формализуемых данных, и снижение человеческого фактора со стороны респондента. Таким образом, на выходе пользователь получит качественную социально-экономическую информацию, основанную на экспертных оценках респондентов, отвечающую требованиям, предъявляемым к информации для принятия эффективных управленческих решений.

Просмотров работы: 1037