Поиск и просмотр документов

Поисковые системы различаются как функциональными возможностями, так и (естественно) языком формулировки запросов. Обычно язык запросов позволяет задавать поиск по: отдельным словам, отдельным фразам и сочетаниям слов, частям слов и их сочетаниям, нечетким шаблонам.
Существуют системы, производящие лингвистический анализ индексируемых документов и запросов и позволяющие автоматически расширять запрос синонимами интересующих слов и т.п.
Из существующих сегодня специализированных поисковых систем WWW наиболее мощной и перспективной является система AltaVista фирмы Digital.
Система AltaVista имеет возможности поиска по нечетким шаблонам в любых информационных массивах, а не только в тексте. Позволяет формулировать запросы с использованием логических выражений, указанием необходимой степени "близости" искомых шаблонов (например, слов) в документе.
Итак, наибольшие преимущества СУД проявляются при поиске документов и их просмотре, построенных на технологии Internet/intranet. Вы можете задать данные об искомом документе или слова из текста документа и, не заботясь об адресе его хранения, найти, просмотреть, послушать (если это аудиозапись) на своем компьютере или распечатать на принтере найденный документ (подборку документов), если Ваши полномочия позволяют это сделать.
Вам будет предоставлена возможность уточнить запрос или сделать его общим, если результаты поиска Вас не устраивают. Просмотр документа тоже понимается достаточно широко. Это может быть текст, рисунок, звуковая запись, видеофильм или презентационный ролик; можно заказывать просмотр связанных документов и, разделив экран компьютера на несколько окон, в каждом из них представить свой документ.
Очевидно, что для проведения такого поиска необходимо индексирование документов. Системы индексирования могут быть различными. Наиболее распространенными являются атрибутивные и полнотекстовые. Способ построения индексов (индексирование) в системе влияет на скорость и качество поиска.