КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Владение основами статистических методов необходимо специалистам, работающим в естественнонаучных и инженерных областях, а также представителям гуманитарных профессий: экономистам, социологам, психологам, лингвистам. Возможности компьютеров в обработке больших объемов информации сделали доступными для пользователей самые современные методы статистического анализа. В настоящее время разработано большое количество статистических пакетов программ, которые по своим возможностямделятся на две основные группы:специализированные пакеты и пакеты общего назначения.

Статистические пакеты общего назначения имеют универсальную направленность, которая позволяет решать задачи разных предметных областей: финансово-экономическая сфера (анализ рисков, прогнозирование финансовых и экономических показателей, микро- и макроэкономическое моделирование, анализ операций по вкладам, страхование); торговля (сравнительный анализ поставщиков, прогнозирование потребления и оптимизация запасов, ценообразование); маркетинг (ранжирование товаров, сегментирование рынка, анализ спроса); производство (анализ качества продукции, прогнозирование потребления ресурсов, оптимизационные эксперименты); социология (анализ результатов опросов, анализ качества услуг информационных провайдеров в Интернет); образование (обучение методам статистического анализа данных) и многие другие.

Универсальные статистические пакеты реализуют множество модификаций статистических методов анализа, при этом объем обрабатываемых данных ограничивается лишь возможностями компьютера. Рассмотрим наиболее известные универсальные статистические пакеты программ.

В настоящее время одним из лидеров среди универсальных статистических пакетов является SPSS[13]. Пакет отличается гибкостью и мощностью применения для всех видов статистических расчетов. В России существует представительство компании SPSS, которое распространяет русифицированную версию пакета. На русском языке создан электронный учебник по применению данного пакета, изданы работы по его применению [20].Вместе с тем в пакете SPSS встроенные модули и тесты для пространственных данных и временных рядов отстают от современного уровня развития науки. Это делает его малопривлекательным для современных эконометрических исследований.

Среди универсальных систем статистического анализа данных широкое распространение получил пакет STATISTICA [1,2,5]. Он относится к числу базовых пакетов вузов России. Фирма-разработчик этого пакета имеет свое российское представительство [16], на сайте которого размещен электронный учебник по статистике, а также доступная студенческая версия программы.Пакет программ STATISTICA по своим средствам и возможностям графического отображения информации конкурирует с универсальным научным пакетом MATHEMATICA [18].

Универсальная система статистических программ SAS - мощный интегрированный комплекс более чем из 20 различных программных продуктов. Основное преимущество данного пакета - его непревзойденная мощность по набору реализованных алгоритмов статистических процедур, хотя по качеству и многообразию тот или иной его раздел может уступать соответствующему разделу специализированного статистического пакета. В России функционирует центр SAS-технологий в МГТУ им. Н.Э. Баумана.

К числу достаточно мощных универсальных статистических пакетов относится также STATGRAPHICS PLUS [19]. Важнейшим достоинством пакета считаются хорошая интеграция математико-статистического аппарата обработки данных с современной интерактивной графикой и его динамичная эволюция с учетом развития компьютерных технологий.

Статистическая система Systat [17] в течение нескольких лет была одним из лучших среди универсальных пакетов углубленного статистического анализа. Широкий диапазон реализованных статистических методов и доскональность функционального наполнения позволяют использовать пакет для выполнения самых разнообразных эконометрических исследований.

Специализированные пакеты ориентированы на реализацию только одного или двух определенных разделов статистики или методов, используемых в конкретной предметной области. Наиболее распространенными являются пакеты для анализа и прогнозирования временных рядов, корреляционного и регрессионного анализа, классификации объектов, решения задач сокращения размерности, реализации методов описательной статистики и др.

Рассмотрим некоторые специализированные статистические пакеты, которые имеют профессиональную ориентацию на реализацию методов анализа данных, применяемых для разработки эконометрических моделей.

Профессиональный статистический пакет Stata [6,10,15] ориентирован на решение задач эконометрики. Программа имеет хорошие средства для обработки пространственных данных и временных рядов и обстоятельную документацию; для пользователей системы издается специальный журнал. Интерфейс пакета предполагает программирование на командном языке при выполнении минимальных действий с помощью диалогового графического меню. Встроенный язык программирования удобен для разработки дополнительных приложений. В качестве причины, сдерживающей распространение данного пакета, отмечают отсутствие на официальном сайте [15] его демонстрационной версии.

Отечественный статистический пакет МЕЗОЗАВР (MESOSAUR) [7] является профессионально-ориентированной системой для анализавременных рядов. В целом данный пакет отличается быстротой анализа данных, подбором возможных моделей, легкостью освоения и использования и, несмотря на отсутствие отдельных современных эконометрических методов, выгодно отличается от аналогичных систем.

Отечественный пакет STADIA [10,20] - достаточно известная система статистического анализа данных. Набор модулей данного пакета составлен исходя из следующих принципов: значительная часть реализованных классических методов изучается в вузах России при подготовке выпускников разных специальностей и подробно описана в учебниках; в него включены почти все наиболее часто применяемые статистические методы; пакет не перегружен новыми или сложными специфическими методами. В пакет встроен справочник, который вместе с документацией может служить методическим пособием для студентов. Со страницы сети Интернет [4] можно перекачать демонстрационную версию пакета.

К числу широко используемых эконометрических пакетов относится программная система EViews[14], которая предоставляет разнообразные возможности анализа временных рядов, обеспечивает сложный и тонкий инструментарий статистической обработки пространственных данных, строит прогнозные модели. Пакет функционирует под управлением ОС Windows, имеет встроенный язык программирования для разработки пользователями своих приложений, удобный и легко осваиваемый интерфейс. На сайте разработчика [14] размещена подробная информация о пакете, имеется также доступная студенческая версия программы. Пакет снабжен развитой системой подсказок, которая по существу является учебником по эконометрике с практической ориентацией. В доступной форме на странице Интернета [9] приведено учебное пособие «Компьютерный практикум по начальному курсу эконометрики (реализация на Eviews)».

В зависимости от реализованной системы управления различают три группы статистических пакетов: управляемые с помощью меню, обладающим удобным графическим интерфейсом; управляемые на основе интерфейса, задаваемого в виде командной строки; использующие специализированные языки программирования и соответствующие процессоры с входного языка, которые обладают встроенными возможностями для выполнения стандартных статистических вычислений. Пакеты первой группы используют в основном в учебных целях; пакеты второй группы ориентированы на профессионалов, имеющих навыки программирования; пакеты третьей группы имеют исследовательский характер, так как профессиональные пользователи с помощью встроенных языков программирования могут создавать прикладные программы в виде приложений для решения различных задач. Существует также группа статистических пакетов, которая использует комбинации перечисленных типов управления в интересах пользователей различной квалификации и профессиональных интересов.

Несмотря на разнообразие статистического программного обеспечения в России чаще всего используется программный комплекс (приложение) MicrosoftExcel [2,11,12]. Это объясняется широким распространением русскоязычной версии данного ПО для персональных компьютеров. В программной среде MSOffice приложение MSExcel выполняет функции электронной таблицы с достаточно мощной математической поддержкой решения задач, в которой определенные статистические процедуры являются дополнительными встроенными формулами. Существует также макрос-дополнение XLSTAT-Pro [8,10] для приложения MSExcel, включающее в себя более 50 статистических процедур.

Таким образом, благодаря современному уровню развития информационных технологий в распоряжении исследователей различных сфер науки и техники, экономики и производства, а также образовательных учреждений имеются доступные научные и статистические пакеты программ, удовлетворяющие разнообразные потребности пользователей.

Список использованной литературы:

  1. Боровиков, В.П. Прогнозирование в программе STATISTICA в среде Windows: Основы теории и интенсивная практика на компьютере: учеб. пособие / В.П. Боровиков, Г.И. Ивченко. – М.: Финансы и статистика, 2006. – 368 с.

  2. Вуколов, Э.А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL: учеб. пособие / Э.А. Вуколов. – М.: ИНФРА-М, 2004. – 462 с.

  3. Гагарина, Л.Г. Компьютерный практикум для менеджеров: информационные технологии и системы: учеб. пособие / Л.Г. Гагарина, Е.М. Портнов, И.С. Холод; под ред. Л.Г. Гагариной. – М.: Финансы и статистика, 2006. – 352 с.

  4. Демоверсия пакета STADIA - http://protein.bio.msu.ru/~akula/Podr2~1.htm

  5. Кацко, И.А. Практикум по анализу данных на компьютере / И.А. Кацко, Н.Б. Паклин; под ред. Г.В. Гореловой. – М.: КолосС, 2009. – 278 с.

  6. Колеников С. О. Прикладной эконометрический анализ в статистическом пакете Stata- http://ecsocman.hse.ru/text/19185672/

  7. Кузнецов С.Е. и др. Система статистического анализа временных рядов МЕЗОЗАВР. – М.: Финансы и статистика, 1991

  8. Макрос-дополнение XLSTAT-Proдля MS Excel - http://www.xlstat.com/

  9. Молчанов И.Н. Компьютерный практикум по начальному курсу эконометрики (реализация на Eviews) - http://www.molchanov.narod.ru/ucheb_posob/econometr_pract_2000.html

  10. Образовательный математический сайт - http://www.exponenta.ru/

  11. Орлова И.В. Экономико-математическое моделирование: практическое пособие по решению задач. – М.: Вузовский учебник, 2007. – 144 с.

  12. Орлова, И.В. Экономико-математические методы и модели: компьютерное моделирование: учеб. пособие. – М.: Вузовский учебник, 2009. – 365 с.

  13. Официальный русскоязычный сайт компании SPSS – http://www/spss.com, http://www.predictivesolutions.ru/software/

  14. Программа для эконометрики Eviews, сайт разработчика - http://www.eviews.com/

  15. Профессиональный статистический пакет Stata - http://www.stata.com/

  16. Российское представительство компании StatSoft - http://www.statsoft.ru/

  17. Сайт компании Systat Software - http://www.systat.com/

  18. Сайт компании WOLFRAM - http://www.wolfram.com/mathematica/

  19. Сайт статистического пакета STATGRAPHICS PLUS - http://info.statgraphics.com/

  20. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В.Э. Фигурнова. – 3-е изд., перераб. и доп. – М.: ИНФРА-М, 2003. – 544 с.

Просмотров работы: 5398