Смекни!
smekni.com

Язык предметных рубрик: состав и области применения (стр. 1 из 3)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Нижнетагильская государственная социально-педагогическая академия

Исторический факультет

Контрольная работа

Язык предметных рубрик: состав и области применения

Исполнитель:

студентка группы 311 Д СГИ ОЗО

Шешукова М.Д.

Руководитель:

зав. кафедрой прикладной

информатики, к. п. н., доцент

Гуторова Л.Е.

г. Нижний Тагил 2008

Содержание

Введение

1. Понятие информационно-поискового языка

2. Формирование предметной рубрики

2.1 Структура предметной рубрики

2.2 Правила составления предметной рубрики

3. Область применения

Заключение

Список литературы

Введение

Сегодня, в век информатизации и компьютеризации информация является таким же ресурсом, как трудовые, материальные и энергетические. Информация - это разъяснение, осведомленность, изложение. Информация - ценнейший ресурс наряду с такими традиционными видами ресурсов, как нефть, газ, полезные ископаемые и другие.

Переход к информационному обществу XXI века породил беспрецедентный рост объемов и концентрации информации в глобальных компьютерных сетях. Это резко обострило проблему создания информационно-поисковых систем (ИПС) и их эффективного использования.

Информационно-поисковая система (ИПС) - это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации - текстов (документов) или данных (фактов) [1]. Информационно-поисквыми системами являются любые определенным образом организованные хранилища информации. Причем информационно-поисковые системы могут быть и неавтоматизированными. Главное - это целевая функция: хранение и поиск информации.

Важнейшим компонентом информационно-поисковых систем является информационно-поисковый язык. Информационно-поисковый язык - знаковая система, предназначенная для описания (путем индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска.

Человек, чтобы отобрать из массива документов нужные, должен прочитать или просмотреть их содержимое. Для ускорения и упрощения этой процедуры появились различные формы сокращенной записи содержания документов - аннотации, рефераты, каталоги. Но во всех этих случаях при отборе документов по их сокращенным описаниям используется естественный язык. Хорошо известны такие "недостатки" языковых знаков, как омонимия, синонимия, многозначность. Точное значение многих слов можно понять только в контексте. Это препятствует использованию естественного языка для фиксации и отождествления понятийной информации. Поэтому формальные системы, предназначенные для хранения документальной информации с целью последующего поиска, потребовали создания специальных информационных языков. Информационно-поисковые языки представляют собой знаковые системы со своим алфавитом, лексикой, грамматикой и правилами пользования. Все искусственные языки, так или иначе, создавались и создаются на основе естественных языков[2]. История автоматизированных информационно-поисковых систем исчисляется полувеком. Типичная ИПС первых лет - это человеко-машинная система, где анализ и описание содержания документов (индексирование) выполняется вручную, а поиски проводятся машиной. Первоначально основу ИПС составляли информационно-поисковые языки (ИПЯ), основным элементом которых являются дескрипторные словари и тезаурусы. Сегодня, однако, большинство работающих ИПС относится к классу вербальных систем бестезаурусного типа, когда индексационные термины выбираются непосредственно из текстов документов. Актуальность данной работы объясняется тем, что лавинообразный рост объемов электронной документальной информации, ее видовое, тематическое и языковое разнообразие являются как причиной кризиса современного информационного поиска, так и стимулом его совершенствования.

Целью данной работы является знакомство и понятие языка предметных рубрик.

1. Понятие информационно-поискового языка

Как было указано выше информационно-поисковый язык (ИПЯ) - это знаковая система, предназначенная для описания (путем индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска. Существует множество типов ИПЯ. Наиболее часто в качестве основания деления при классификации ИПЯ используют способ организации понятий. По способу организации понятий различают: предкоординируемые (классификационные) ИПЯ, посткоординируемые (дескрипторные) ИПЯ[3]. В свою очередь они делятся на различные типы. К числу таких ИПЯ принадлежит и язык предметных рубрик.

Язык предметных рубрик - это информационно-поисковый язык, предназначенный для индексации (частей) документов и информационных запросов посредством предметных рубрик[4].

Предметная рубрика - элемент ИПЯ, представляющий собой краткую формулировку темы на естественном языке.

Совокупность предметных рубрик и связанного с ними ссылочно-справочного аппарата предметного каталога или указателя образуют словарь предметных рубрик. При создании словаря предметных рубрик в него вводятся все синонимы и эквивалентные по смыслу выражения, возможные в естественном языке. Но для предметизации используется лишь один из смысловых вариантов - остальные исключаются с помощью отсылок, обозначаемых пометкой “см. запись”. Например, “аэропланы см. самолеты” - эта запись означает, что из двух возможных слов для предметизации разрешается использовать только термин “самолеты”. При разыскании синонимов могут помочь словари синонимов, толковые словари, терминологические и энциклопедические словари. Помимо лексических синонимов и эквивалентных по смыслу выражений можно отметить еще несколько видов синонимии, которую необходимо учитывать в языке предметных рубрик:

сокращенная и полная форма термина, выраженного словосочетанием. Например, “пластмассы" и “пластматические массы". В большинстве случаев используется полная форма термина

инверсированная и прямая форма лексической единицы. Например, “поршневые насосы” и “насосы поршневые”

возможные варианты написания имен и фамилий. Например: “Гашек Я. и Хашек Я."

наличие псевдонима. Например: “Горький М. - Пешков А.М."

Во всех перечисленных случаях необходимо сделать отсылку от отвергнутой формулировки к термину, используемому для предметизации литературы. Омонимичные слова разделяются в своих значениях и вводятся в язык предметных рубрик столько раз, сколько значений имеет омонимичное слово. Явления омонимии и полисемии слов (неоднозначность выражений) в языке предметных рубрик устраняются различными средствами:

1. Терминологическом совпадении наименований объектов содержание, собираемое в рубрике материалов уточняется путем пометок в скобках: “Колумбия (округ) ” и “Колумбия (республика) ”. В тех случаях, когда это возможно, омонимия устраняется с помощью указания отрасли: “Миксеры (радиотехника) ”, “Миксеры (бытовая) ”, “Миксеры (металлургические) ”. Точно также с помощью пометок разделяются значения многозначных слов “Информация (процесс) ”, “Информация (сведения) ", “Информация (философия) ”

2. К одному из значений многозначного слова подбирается термин-синоним, который с помощью отсылки вводится в качестве индексационного термина взамен отвергнутого. Например, “Библиография (наука) см. Библиографоведение”. При использовании отсылки каждое из значений термина может иногда не уточняться пометками. Например, “каталог см.1. библиотечный каталог;

2. промышленные каталоги” Отсылки могут быть сделаны и при помощи развернутой справки. Например, в списке предметных рубрик ИНИОН - “Здесь собирается литература об... Литература о... см. В рубрике”

3. Дается краткое определение понятия, выраженного заголовком предметной рубрики: “БЕРЕЗКА, хореографический ансамбль", “ДЖАВА, курорт”

4. Для развернутой формулировки лексической единицы используется словосочетания. Например, “мерительные пробки”, “пластическая масса”

5. К заголовку рубрики присоединяются подрубрики, которые уточняют контекст термина. Например, термин “клетка" требует уточнения, так как это может быть клетка для зверей, биологическая клетка и т.д. Присоединения подрубрик “деление” или “одеревенено” (“клетка - одеревенения”) делает термин заголовка однозначным. Если многозначное слово находится в подрубрике, то контекст всей рубрики определяет, какое оно имеет значение. Например, “труболинейное производство - центробежный способ - применение миксеров". В данном случае слово “миксер" не требует уточняющей пометки (металлург).

Лексическая единица - смысловое единство (простое и сложное понятия), выраженное одним словом или сочетанием слов, ни одно из которых не может быть отброшено без изменения смысла этого единства. Множество лексических единиц, включенное в словарь, называется словарным фондом или лексикой ИПЯ. В языке предметных рубрик лексические единицы называются заголовками. Следовательно, лексика языка предметных рубрик делится на две части: а) предметные заголовки (заголовки предметных рубрик); б) подзаголовки (подрубрики).

Предметный заголовок (или заголовок предметной рубрики) включает наименование основного предмета. Им может быть конкретное или абстрактное понятие, как единичное, так и общее.

Конкретное понятие отражает предмет. Например, “Солнце", “РГБ” или классификацию предметов. Например, “Каталоги”, “Библиотеки".