В настоящее время происходит стремительное развитие информационно-коммуникационной инфраструктуры, в частности сети Интернет. С каждым днем размеры информационных потоков становятся все больше и больше, а найти в них необходимую информацию становится все сложнее и сложнее. Наряду с увеличением количества информации увеличивается и количество ее источников. Это породило ряд проблем связанных с хранением и обработкой больших объемов информации. Существующие программные средства, методики и алгоритмы не всегда справляются с поставленной задачей, поэтому необходимо их совершенствовать, а также разрабатывать новые. Чтобы это сделать, необходимо изучить все то, что уже существует: программные средства, модели, методы и алгоритмы обработки данных, т.к. нельзя сделать что-то новое, не изучив при этом старого. Тема моей работы звучит следующим образом: «Исследование методов описания информационных потоков в сети Интернет».
На самом деле данная тема не нова. Известные ученые и исследователи, Д.В. Ландэ, А.Б. Литвин, А. Брёдер, Р. Кумар, уделяют этой проблеме довольно много внимания. Особенно хотелось бы отметить работы Д.В. Ландэ. В своей монографии «Основы интеграции информационных потоков» автор рассказывает о различных взглядах и подходах к изучению информационного пространства. Несмотря на большой объем работ, посвященных исследованию данных проблем, продолжают возникать вопросы, требующие новых исследований.
В моем исследовании предпринята попытка детально рассмотреть технологии и принципы контент-мониторинга, используемые при решении различных типов задач. На основе этих принципов можно разработать методику сбора информации, а также проводить систематизацию и анализ полученной информации. Процесс сбора и анализа информации можно автоматизировать путем создания программного средства, которое позволит ускорить обработку полученной информации.
Поэтому целью данной работы является выявление закономерностей в поведении информационных потоков сети интернет и изучение возможности их использования для анализа и прогнозирования. Для этого необходимо:
рассмотреть современные технологии и принципы, которые используются при обработке информационных потоков;
выявить сильные и слабые стороны рассмотренных методов;
разработать методику сбора информации с новостного сайта;
разработать программный модуль, который позволит автоматизировать сбор и систематизацию информации;
проанализировать насколько точно математическая модель описывает наблюдаемые информационные потоки сети интернет;
сделать выводы о возможных параметрах настройки модели.
Литература:
Ландэ Д. В. Основы интеграции информационных потоков. / -2005.
Брайчевский С. М., Ландэ Д. В. Современные информационные потоки: актуальная проблематика. / Научно-техническая информация. – Сер. 1. – 2005. - №11. – С. 21-33.
Ландэ Д. В., Морозов А. Ю. Новостной Интернет. / Телеком, -№ 1-2. -2005. –С. 58-62.