АЛГОРИТМ РАБОТЫ ПОИСКОВОЙ СИСТЕМЫ - Студенческий научный форум

X Международная студенческая научная конференция Студенческий научный форум - 2018

АЛГОРИТМ РАБОТЫ ПОИСКОВОЙ СИСТЕМЫ

Валеева Д.Р. 1
1Тюменский индустриальный университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Интернет – это бесчисленные поток информации, в которой невозможно разобраться самостоятельно. Для того, чтобы решить данную проблему в конце 20 века появились поисковые системы. Поисковые системы или по-другому поисковики помогают нам подобрать необходимую информацию, т.е. они хранят и сортируют информацию на сайтах.

На сегодняшний день существует достаточно большое количество поисковых систем, как мировых, так и отечественных: Google, Яндекс, Rambler, Yahoo, Mail.ru, MSN search. Миллионы людей ежедневно пользуются поисковиками, но никто не задумывался о том, как они работают. Давайте попробуем в этом разобраться.

Необходимо понимать, что есть разница, между тем как работает поисковик и тем, как любая другая система, которая ищет информацию в базе данных. Поисковая система формирует ответ на наш запрос, основываясь на своем собственном хранилище данных – индексе. И если возникнут изменения во всемирной сети, то они отразятся только после того, как будут добавлены в индекс.

Обратимся к элементам поисковой машины:

  1. Паук (spider). Их функция достаточно проста. Они копируют страницы на просторах интернета, чтобы в дальнейшем поисковик смог индексировать загруженные страницы для наиболее эффективного поиска.

  2. Краулер (crawler). Данный робот заходит на сайты и по ссылкам переходит на другие ресурсы, либо же проверяет разделы этого сайта. Результатом его работы являются новые страницы, которая также в дальнейшем индексируются.

  3. Индексатор (indexer). Его функция – анализ страницы интернета, т.е. делить страницы на основные части такие, как название странички, ее заголовки, прочие ресурсы и т.п. И если она не удовлетворяет критериям, то страница не проходит индексацию.

  4. Подсистема ранжирования. Данный робот занимается сортировкой страниц по степени соответствия содержания странички запросу. Факторов, по которым происходит ранжирование, существует огромное количество. Есть внешние факторы (например, показатель отказов, время, проведенное на сайте, показатель возвратов) и внутренние (правильные заголовки, ключевые слова). Та страница, которая удовлетворит больше факторов, покажется в первую очередь.

  5. Подсистема выдачи результатов. Данная подсистема переводит запрос пользователя на структурированный запрос индекса и генерирует результаты поиска. В добавок к функциям этого робота относится и персонализированный поиск. Поисковик анализирует ваши предыдущие запросы и результаты следующих будут связаны именно с ними. Безусловно, поисковые системы проверяют ваше местоположения и выдают запросы, ссылаясь на эти данные.

Каждая поисковая система имеет свои собственные алгоритмы для выдачи необходимого результата. Но все – таки общие принципы работы в основном у всех похожие.

Первым делом в ход вступают пауки и краулеры, а затем происходит индексирование. Их работа протекает почти параллельно, ведь каждый день в интернете появляется все больше и больше информации. Задумайтесь, кому нужны уже неактуальные или бесполезные данные? Далее в процесс вступает ранжирование. Алгоритмы поиска информации постоянно совершенствуется. Поисковая машина, которая выдаст наиболее корректный и точный результат, будет набирать популярность среди людей.

Естественно, что здесь не только машинная работа, но и работа людей. Разработчики поисковых систем прикладывают огромные усилия для того, чтобы удовлетворить своих пользователей. Они могут сами корректировать релевантность выдачи результатов на запросы и оценивать сайты.

На сегодня по статистикам самой мощной поисковой системой является Google. База индексов обновляется очень часто, можно сказать, что почти каждый день, поэтому на наши запросы мы получаем актуальную и нужную информацию. Но не стоит забывать и про отечественную поисковую систему Яндекс. Безусловно Google выдаст нам информацию лучше на уровне всего мира, но если нам нужна информация регионального характера, то актуальнее результаты будут у Яндекса. Набор инструментов у данных поисковых машин почти одинаковый. Поэтому можно сделать вывод о том, что нельзя определенно сказать, что лучше и хуже, необходимо ориентироваться на собственные запросы и выбирать подходящую поисковую систему.

Всемирная паутина является самым необходимым источником информации на сегодняшний день и невозможно представить нашу жизнь без поисковых систем, намного облегчающую нам жизнь. Зная, как работает поисковая система, мы можем правильно строить запросы и получать качественную и самую свежую информацию.

Список используемых источников:

  1. Поисковая система [Электронный ресурс] . – http://procomputer.su/osnovy-interneta/54-poiskovaya-sistema

  2. Поисковые системы [Электронный ресурс] . – http://codingcraft.ru/searchengines.php

  3. Отличие Google от Яндекс [Электронный ресурс] . - http://www.seodiplom.ru/3-poiskovie-sistemi/otlichiya-raboti-yandex-i-google/

  4. Отличие Google от Яндекс [Электронный ресурс] . - https://prodex.ua/blog/raznitsa-mezhdu-algoritmami-google-i-yandeks/

Просмотров работы: 130