Проблема поиска и сбора информации ‑ одна из важнейших проблем информационно - поисковых систем. Сейчас она заключается не в том, что информации мало и поэтому ее трудно найти, а в том, что ее слишком много, и от этого найти ответ на интересующий вопрос может оказаться сложной задачей.
Существует несколько методов поиска:
адресный поиск - Процесс поиска документов по чисто формальным признакам, указанным в запросе.
семантический поиск - Процесс поиска документов по их содержанию, при данном методе поиска находится множество документов без указания адресов.
документальный поиск - Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.
фактографический поиск - Процесс поиска фактов, соответствующих информационному запросу.
Семантический:
Существует огромное количество семантических отношений, определяющих взаимосвязь между двумя понятиями. Ниже представлены наиболее часто использующиеся взаимосвязи:
Active relation. Семантическое отношение между двумя понятиями, одно из которых выражает выполнение действия, затрагивающего другое понятие.
Associative relation. Отношение, которое определяется психологически. Пример: понятие А ментально связано с понятием В. Часто ассоциативные связи – это просто неклассифицированные отношения.
“Instance of” relation. Отношение определяет семантическую связь между общим понятием и отдельными случаями общего понятия. Пример: Москва – случай (Instance) общего понятия “столица”.
Locative relation. Семантическое отношение, в котором понятие указывает на местоположение объекта, определяемого другим понятием.
“Part of” relation. Является меронимией, то есть отношение между целым и его частями.
Следующие три семантические связи являются частными случаями отношения иерархической зависимости (“гипоним – гипероним”):
“Kind of” relation. Пример: А – вид В.
“Narrower than” relation. Пример: понятие А более узкое, чем понятие В.
“Broader than” relation. Пример: Понятие А шире понятия В.
Документальный:
Документальный информационный поиск [document retrieval ] - вид информационного поиска, связанный с процессами нахождения и выдачи документов.
Задача документального информационного поиска сводится к тому, чтобы, не прочитывая текстов множества документов, по каким-то внешним описательным признакам выбирать из этого множества документы, по смыслу соответствующие информационному запросу. Для этого каждый документ снабжается поисковым образом - характеристикой, в которой кратко и однозначно выражается основное смысловое содержание документа. В виде такой же краткой и однозначной записи - поискового предписания - должен быть сформулирован и информационный запрос. Благодаря этому процедура информационного поиска может быть сведена к простому сопоставлению поисковых образов документов с заданным поисковым предписанием. Если поисковый образ документа в установленной степени совпадает с поисковым предписанием, то считается, что этот документ отвечает на информационный запрос.
В документальном информационном поиске обратная связь с абонентом служит для уточнения информационных потребностей и коррекции запроса для поиска в существующем банке документов.
Фактографический:
Выполнение фактографических запросов требует от библиографа высоких профессиональных знаний. Уметь находить фактографическую продукцию должен и будущий выпускник педагогического колледжа.
При фактографическом запросе уточняется желательная форма описания факта, его характеристика, текст или источник цитаты. Далее подбор и анализ источников, его проводят в «уме» без непосредственного обращения к источникам. Источники фактографического поиска можно разделить по трем признакам:
по назначению - прямые (справочные издания и материалы в изданиях) и косвенные, требующие выборочного просмотра разнородных текстов);
по надежности - новейшие, устаревшие;
по способу организации информации - ориентированные на оперативный поиск (издания с детальным оглавлением, вспомогательными указателями, базы данных со средствами ориентации) или требующие сплошного просмотра текста.
Выделяют 5 групп запросов:
словарные (требуется установить значения слов, их написание, неологизмов, аббревиатур, перевод иноязычных слов);
географические (установить местонахождение географических объектов);
хронологические (установить даты исторических событий);
количественные и качественные характеристики предметов и явлений;
подобрать фрагменты текстов (цитаты, афоризмы) или установить их источники.
Процесс уточнения индивидуальных запросов предусматривает прохождение ряда этапов:
быстрое отождествление объекта поиска (документа и/или факта);
ясное понимание значения искомого документа и/или факта;
способность интерпретации (умение увидеть содержательные взаимосвязи источников);
ускоренное умозаключение;
синтезирование (соединение разрозненных сведений в единое целое);
умение правильно и быстро находить те документы и факты, которые отвечают задаче поиска.
При выборе энциклопедического издания его необходимо проанализировать по следующим признакам:
название
автор
место и год издания
тематика общая (универсальная), специальная, региональная.
объем (большая, малая, настольная)
структура: алфавитная, систематическая
научно-справочный аппарат
тип статей: обзоры, справки, толкование, отсылки.
наличие иллюстрированного материала
Трудности при ведении фактографического поиска: источник физически недоступен, пользователи недостаточно знают источники, отсутствие информации в источнике. Нередко приходится просматривать большие объемы текста. Нельзя сообщать сведения о населении, состоянии экономики, культуры по устаревшим изданиям.
Таким образом, существует несколько методов поиска информации, каждый из которых лучше всего использовать в определенной ситуации, например, при наличии определенных знаний в области размещения документов в базе стоит использовать фактографический поиск. В общем случае лучше воспользоваться адресным (из-за большого количества запросов и скорости отклика) и семантическим (из-за более высокой точности запроса по сравнению с адресным).