Заказ работы

Заказать
Каталог тем
Каталог бесплатных ресурсов

Автоматическое индексирование, классифицирование, аннотирование и реферирование документов

Хранение и поиск информации всовременных информационных системах реализуется с помощью информационно-поисковыхсистем (ИПС).

         ИПС– это совокупность средств и методов, организованных в функциональную систему,выполняющую хранение и поиск информации.

         Документыи  информационные запросы вводятся в ИПСна естественном языке, а затем подвергаются индексированию, то естьпереводу на формализованный информационно-поисковый язык (ИПЯ). Послеэтого документ превращается в поисковый образ, а запрос – в поисковоепредписание. Основная проблема, возникающая при составлении поисковогообраза и поискового предписания, состоит в сжатии информации при сохраненииосновного смыслового содержания документа и запроса. Эта проблема относится ккатегории семантических и сводится, прежде всего, к построению искусственныхИПЯ.

         Необходимостьперехода от ЕЯ к ИПЯ возникает потому, что для успешного решения задачиинформационного поиска необходимо в идеале уметь:

·       от словесных формулировок запроса переходить куровню предметной области, представляющей интерес для автора запроса,

·       затем подниматься до уровня мышления

·       и снова возвращаться на уровень словесныхформулировок, то есть плана выражения.

Такой ход поиска представляетсобой чрезвычайно сложную задачу из-за того, что при этом необходимомоделировать сложные процессы отражения действительности сознанием человека.Учитывая это, задачу поиска решают, опуская некоторые уровни, а некоторыеупрощая. Одним из таких упрощений является переход от ЕЯ к ИПЯ.

         ИПЯ– это искусственная знаковая система, предназначенная для формального описаниядокументов и информационных запросов, представленных на естественном языке.

         Следуетотметить, что хотя реальные ИПЯ не гарантируют отсутствия потерь информации приудовлетворении информационного запроса и отсутствия поискового шума, переход отЕЯ к ИПЯ является необходимой составляющей ИПС. Как мы уже сказали, переводдокумента с ЕЯ на ИПЯ называется индексированием.



Размер файла: 34 Кбайт
Тип файла: doc (Mime Type: application/msword)
Заказ курсовой диплома или диссертации.

Горячая Линия


Вход для партнеров