Информационные системы - статьи


Методы и средства автоматизации учрежденческой деятельности - часть 3


Навигация упрощается

с помощью папок личного и коллективного пользования. Однако их поиск и фильтрация ограничены

лишь отбором и сортировкой по атрибутам

и тексту .

Специфический метод хранения реализован в пакете Lotus Notes в виде так называемой базы

документов, в состав которой входит как однотипная, так и разнотипная информация,

сохраняемая в одном файле. Документы допускают внутреннюю структуризацию на основе

формуляров путем выделения и добавления в них полей. Навигацию в базе

упрощает наличие страниц и категорий.

Многие современные системы в дополнение к файловой

системе используют библиотеки документов, содержащие в БД их карточки с

атрибутами и ключевыми словами.

Поиск и фильтрация производится по запросам на основе контекстного

поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе

индекса(Рис.2).


Рис.2. Классификация методов информационного поиска.

При использовании механизма четкого поиска (например, DOCS OPEN) в запросе

не должно быть орфографических ошибок, а в тексте документа - неточностей распознавания.

Морфологический разбор позволяет упростить формирование запросов и улучшить отбор информации.

Реализация на основе нейронных сетей и искусственного интеллекта технологии

нечеткого поиска по полному содержанию документа (например, технология адаптивного

распознавания образов APRP в пакете Excalibur EFS) не требует идентичности искомых фраз содержимому

файла и, кроме того, исключает потребность в

исправлении ошибок после распознавания текста.Результаты выборки при этом наилучшим

образом согласованы с терминами или фразами запроса пользователя.

Фирмы-производители реляционных СУБД (в частности ORACLE) проповедуют другие схемы

хранения - текстовые и универсальные базы данных (БД). При этом тексты документов

располагаются в символьных

полях переменной длины,а расширенные средства SQL-поиска формируют

смешанные запросы. Для хранения произвольной информации, в том числе

мультимедиа, используются поля бинарных объектов большой длины BLOB и/или




Начало  Назад  Вперед