Смекни!
smekni.com

Информационное обеспечение маркетинговой деятельности (стр. 6 из 16)

Предметная запись - это слово, словосочетание, фраза, которая уточняет предметный заголовок или подзаголовок. Предметная запись может обозначать как предметный подзаголовок, так и класс предметов на другом уровне иерархии.

Предметная рубрика - это совокупность предметного заголовка, подзаголовка и записи с указанием адреса или места хранения документа. Между предметными заголовка­ми, подзаголовками в АПК указываются синонимические, родо-видовые и ассоциативные отношения. К ассоциативным отношениям отнесены отношения вида: «часть-целое» «процесс-орудие», «процесс-материал», «материал-изделие» и др. Все виды отношений в АПК имеют свои пометы: синонимии «см.» (смотри); родо-видовые отношения между пред­метными заголовками фиксируются пометами «см.» (смотри) и "см. также"; парадигматические отношения между заголов­ками и входящими в них подзаголовками указывают путем сдвига подзаголовка на два знака вправо относительно заго­ловка; ассоциативные отношения имеют пометку «см. так­же».

Фасетные классификации. Среди существующих ин­формационно-поисковых языков особое место занимают фасетная или аналитико-синтетическая классификация. Этот вид классификации был предложен Ш.Р. Ранганатоном - «Классификация с двоеточием». Сущность метода разработ­ки фасетных классификаций состоит в том, что на основе анализа отрасли знания, техники, документов выделяют та­кие категории классов предметов, которые применяются в данной отрасли. Перечень категорий (классов предметов) на­зывают фасетами. Выделенные из документов термины, на­учные понятия распределяются по фасетам, в которых могут образовываться субфасеты. Термин, понятие, вошедший в субфасету, называют фокусом. Каждый фасет обозначается буквой, а субфасет - буквой фасета, а также номером.

Методика индексирования документов с использовани­ем фасетной классификации сводится к тому, что в результа­те анализа документа выделяют главную тему или предмет, которым присваивается буква фасета. Для детального описа­ния предмета из фасета берут столько фокусов, сколько их необходимо для полного и многоаспектного раскрытия со­держания. Использование фасетной классификации имеет ряд преимуществ перед иерархическими, классификациями. Фасетные классификации позволяют собирать в одном месте информационного массива все документы по предмету (теме), которые заиндексированы с учетом всего многообра­зия аспектов предмета.

Таким образом, фасетные классификации позволяют одновременно осуществлять многоаспектный поиск инфор­мации. Несмотря на значительные преимущества данной классификации перед иерархическими, фасетные классификации не нашли широкого распространения, потому что этот вид классификации обслуживает массивы документов по уз­ким тематическим, в лучшем случае, отраслевым направле­ниям.

Рубрикатор государственной автоматизированной сис­темы научно-технической информации - (ГАСНТИ). Нацио­нальные рубрикаторы разрабатываются в соответствии с «Положением о лингвистическом обеспечении национальных систем НТИ» и нормативно-техническими предписаниями Международного центра научно-технической информации (МЦНТИ 7-75).

Нормативно-методические документы о лингвистиче­ском обеспечении определяют не только разработку, но и эксплуатацию лингвистического обеспечения, а также авто­матизированную систему ведения информационно-поисковых языков, обеспечивающих справочно-информационное обслуживание сведениями о лингвистиче­ских средствах и поддержке их ядра в рабочем состоянии с учетом изменения во времени.

Ядро лингвистического обеспечения кроме рубрикатора включает базисные тезаурусы, перечни грамматических средств ИПЯ, а также таблицы соответствия рубрикатора с информационными классификациями, используемыми в сис­теме НТИ. Рубрикатор ГАСНТИ является важнейшим клас­сификационным языком в комплексе лингвистического обес­печения в автоматизированных системах НТИ.

Основное назначение рубрикатора ГАСНТИ - разделе­ние информационного потока на подмассивы, формирование справочно-информационных массивов на базе использования вычислительной техники, отражение наиболее важных аспек­тов документов и запросов.

Исходя из общих принципов рубрикации (индексиро­вания) документов многофункционального назначения руб­рикатора, который используется для формирования доку­ментальных фондов и информационных массивов, необхо­димо чтобы каждый документ, представляющий потенциаль­ный интерес с разных точек зрения, содержал в рубрикаторе соответствующие коды рубрик.

Таким образом, в каждом разделе рубрикатора присут­ствуют типовые коды рубрик. Как правило, список рубрик в рубрикаторе, описывающих содержание документов и запро­сов, значительно шире списка рубрик, используемых для ин­дексирования документов.

Каждый документ, который проходит семантическую обработку в соответствующих всероссийских центрах ин­формации, обязательно получает код или группу кодов руб­рикатора. На государственные центры научно-технической информации возложена ответственность за централизован­ное индексирование информационных документов, которые обрабатываются в них с использованием Рубрикатора.

В международных, специализированных и отраслевых автоматизированных информационных системах использует­ся целый комплекс информационно-поисковых языков.

Классификатор государственных стандартов (КГС). Входит в состав лингвистического обеспечения информаци­онных систем и принадлежит к одной из разновидностей ин­формационно-поисковых языков иерархического типа. Структура КГС включает собственно классификатор, пред­метный указатель, списки действующих государственных стандартов, технических условий на аттестованную продук­цию, а также действующих и утвержденных ГОСТов. Клас­сификатор представлен списком основных делений с их ин­дексами, а также списком классов и групп. Каждый раздел КГС разделен на классы. Раздел обозначается буквами, а классы арабскими цифрами, от нуля до девяти. Классы делят на группы и обозначают составным индексом раздела, класса и группы. Поиск стандартов в информационном массиве мо­жет осуществляться по номеру, по разделу, по классу и груп­пе.

Информационно-поисковые языки дескрипторного типа. В конце 60-х гг. получили широкое распространение инфор­мационно-поисковые языки дескрипторного типа. В основу построения дескрипторных ИПЯ положен принцип коорди­натного индексирования, который заключается в том, что центральная тема документа, запроса выражается в виде не­которого перечня множества слов и словосочетаний естест­венного языка, обычно являющихся именами простых клас­сов (предметов, процессов, явлений). Такие слова и словосо­четания, которые выделены из текста документов, запросов являются как бы координатами в некотором N-мерном про­странстве предметно-тематических признаков. Когда в поис­ковом предписании перечисляются слова и словосочетания, которые должны содержаться в поисковых образах поиско­вых документов, то как бы указываются координаты этих документов в данном N-мерном пространстве предметно-тематических признаков,

ИПЯ дескрипторного типа позволяют обеспечить глу­бину и полноту индексирования документов и тем самым осуществлять поиск не только пертинентных (полезных), но и релевантных документов, хранящихся в информационных массивах.

В словарный состав дескрипторного языка включается терминология не только отраслевая, но и терминология дру­гих тематических направлений. Формирование массива лек­сических единиц словаря проводится методом свободного индексирования документов и запросов. Отобранная терми­нология из документов и запросов дополняется терминами из тезаурусов научно-технических терминов, классификацион­ных таблиц УДК, ББК, справочников, учебников и др. Выде­ленные термины, научные понятия являются основой для разработки терминологических систем, которые служат соз­данию лексико-семантического перечня Дескрипторов и неде­скрипторов; систематического указателя дескрипторных об­ластей и групп; перечню дескрипторов по группам.

Основным достоинством дескрипторных языков являет­ся то, что они позволяют проводить эффективный поиск по любому, заранее не предусмотренному сочетанию признаков, кроме того, дескрипторные ИПЯ позволяют легко вводить новые термины и учитывать новые информационные по­требности. Дескрипторные ИПЯ обычно имеют небольшой по объему словарный состав. К недостаткам таких ИПЯ можно отнести:

• трудности, связанные с проведением информационного поиска по тематическим запросам;

• создание ИПЯ дескрипторного типа является трудоемким делом;

• применение ИПЯ требует специальных навыков.

Отраслевые, местные службы информации формируют свои справочно-информационные фонды не только по ос­новному профилю, но и родственным, смежным отраслям науки и техники. Для обслуживания такой коллекции доку­ментов от ИПЯ требуется универсальность. ИПЯ дескрип­торного типа такой универсальностью не обладают.

Структура ИПЯ: дескрипторная статья, дескрипторная группа, дескрипторное поле, дескрипторная область.

Дескрипторная статья включает заглавный дескриптор, синонимы, родовые дескрипторы, видовые дескрипторы, ас­социативные дескрипторы, аскрипторы.

Дескрипторную группу образуют лексические единицы - дескрипторы, объединенные в тематический подкласс.

Дескрипторное поле образуют дескрипторные области, т. е. области науки и техники.

По наполняемости дескрипторами дескрипторных групп, полей и областей можно судить об эффективности об­служивания ИПЯ дескрипторного типа коллекции докумен­тов.