Смекни!
smekni.com

Методические рекомендации к изучению курса (стр. 11 из 16)

Коэффициент полноты (Р) определяют по формуле

Р =. 100,

где Р - число релевантных документов, найденных в процессе

поиска по данному запросу,

С - общее число документов в системе, о которых известно, что они релевантны определенному запросу.

Коэффициент точности поиска (Т) определяют по формуле

Т =. 100,

где Р - число релевантных документов, найденных при поиске по определенному запросу;

- общее число документов, выданных при поиске по определенному запросу

Кроме общих требований к проектированию АБС, обяза­тельными документами к техническому заданию на проектиро­вание кроме ТЭО должны прилагаться отдельно требования к информационному, лингвистическому, программному, техничес­кому, организационному обеспечению АБС.

Общие требования к содержанию документов по информа­ционному обеспечению регламентируются ГОСТом 24.205-80.

Принцип организации информационного обеспечения и требования к содержанию документов изложены в ГОСТе и определяются составом, структурой входного и выходного пото­ков документов, обоснованно выбранным носителем информации, на котором фиксируется запись, а также применяемыми метода- . ми контроля за подготовкой баз данных.

В раздел “Принципы организации информационного обес­печения" включают описания информационных массивов собствен­но создаваемых АБС, а также описания информационных масси­вов, получаемых в порядке взаимного обмена или же приобретае­мых по подписке, которые планируется адаптировать в системе.

В разделе "Состав и структура информационной базы" дол­жен быть приведен перечень всех баз данных, которые будут эксплуатироваться АБС. Для каждой базы данных должны быть описаны логическая структура базы данных, тип базы данных (библиографическое описание; БО + ключевые слова, БО + рефе­рат), виды документов, включаемых в базу данных, перечень как обязательных, так и факультативных элементов данных с ука­занием их общего количества, система классификации, использу­емая для идентификации документов (УДК, ББК, МКИ, Рубрика­тор ГАСНТИ и т.п.), наличие ссылочного аппарата и поискового образа.

В характеристике базы данных должен быть указан инфор­мационно—поисковый язык, с помощью которого осуществляется индексирование документов, а также сведения о кодировании сим­волов (алфавита), методах и плотности записи, условия поставки баз данных, виды справочно-информационного обслуживания, в ко­торых может быть использована эта база данных; список пакетов прикладных программ, с помощью которых осуществляются проце­дуры с базами данных. И, наконец, дается тип магнитной ленты, на которой записываются информация, и модель ЭВМ, реализующей систему.

описывая входной документальный поток, необходимо раз­делить его на виды:

а) разовые издания (книги), не относящиеся к видам перечисленным в пунктах в, ж;

б) сериальные издания, также не относящиеся к перечислен­ным в пунктах в, ж;

в) отчеты в научно-исследовательских работах;

г) диссертации;

д) патентные документы;

е) нормативно-технические документы;

ж) фирменные издания.

В общей характеристике базы данных должна быть при­ведена её тематика. Тематику эту можно представлять в виде набора кодов тематико-типологического плана формирования до­кументальных фондов, задаваемых шифрами (индексами) принятых систем классификации, которые используются для формирования и организации информационных массивов АБС. В качестве харак­теристики базы данных должен быть приведен перечень обяза­тельных и. факультативных элементов баз данных для каждого вида документов в соответствии с ГОСТом 7.19-79 или норма­тивно-техническим предписанием МЦНТИ "Структура записи для обмена библиографической информацией на магнитной ленте" (НТП МЦНТИ 1 - 82). Кроме перечня элементов описания, указывают их количество для каждого вида индексируемых документов, а также перечисляют схемы классификации (МКИ, ББК, УДК, Руб­рикатор ГАСНТИ, классификаторы и т.д.), которые используют в базах данных для систематизации информационных подмассивов.

Для баз данных не менее важное значение имеет указание на наличие ссылочного аппарата, например, адреса хранителя микрофиши, первичного документа. Обычно для поискового образа указывают наличие дескрипторов, ключевых слов, как правило, указывают среднее их число на документ. Для повышения резуль­тативности информационного поиска при индексировании докумен­тов используют указатели роли связи, а также логические множители. И поэтому в характеристике баз данных целесообразно указать используемые грамматические средства.

Система кодирования символов (алфавит), методы и плот­ность записи на магнитной ленте позволяют, судить о возможнос­ти адаптации баз данных в АБС и поэтому считается целесо­образным включение, и этих сведений. Немаловажное значение имеют объем, периодичность выпуска, а также формат и режимы поставки баз данных. При этом важно и указание на виды справочно-информационного обслуживания, которые могут быть организованы на базе данных (ИРИ, РП, РЖ, СИ, ДОР и т.д.). Из­вестно, что проблемы совместимости в АБС реализуют через математическое обеспечение модели ЭВМ, типы накопителей данных. Поэтому перечисленные выше характеристики являются обязательными.

В проектируемой АБС регионального значения ориентиру­ются на эксплуатацию баз данных, которые генерируют всесо­юзные, центральные отраслевые, а также региональные информа­ционные и библиотечные центры. Но бывают случаи, и нередко, когда базы данных готовят в автономных АБС. В этих случаях учитывают особенность функционирования АБС и эксплуатации баз данных. Поэтому к информационному обеспечению по разделу "Внемашинные информационные базы" приводится перечень доку­ментов, информационных сообщений, которые планируются для ввода в информационный массив АБС и требуют предварительной предмашинной обработки. В этом случае процедуру предмашинной обработки называют составлением-заполнением предмашинного рабочего листа,

В требованиях по информационному обеспечению предусматривается полное описание процессов сбора, обработки, хранения данных с указанием последовательности выполнения не только предмашинной, но и машинной обработки, включая операции по контролю заполнения ПРЛ, перфорированию (записи данных на носителе), выполненных с помощью, технических средств.

Существуют различные способы размещения и записи ин­формации. Например, в логической схеме баз данных можно ис­пользовать иерархическую структуру, представляющую собой сово­купность записей (данных), в которой каждая запись связана не более чем с одной записью более высокого уровня. Например, по Рубрикатору ГАСНТИ тематическая рубрика 00.01 - "Основопо­ложники марксизма-ленинизма" связана со всей родовой (выше­стоящей) тематической рубрикой ОО - 'общественные науки"; или тематическая рубрика 18,09— "история искусств" — с родовой рубрикой 18 - "искусство. Искусствоведение" и т.д.

В отличие от иерархической схемы расположения записей существует так называемая сетевая структура, в которой любая запись может быть связана с произвольным количеством других записей, находящихся на любом уровне иерархии. Например, в записях, представляющих собой таблицу.

Кроме перечисленных схем баз данных (иерархической и сетевой), используются реляционные логические схемы, в кото­рых структура баз данных представляет собой совокупность таблиц, отношений, каждое из которых есть несвязная совокуп­ность записей одного типа (например авторский указатель, пред­метный указатель, указатель источников). В любом случае струк­тура базы данных должна обеспечивать совместное использование данных с минимальным временем обращения к базе данных, с приемлемым информационным шумом (избыточностью), с минимальным объемом памяти ЭВМ.

Для удовлетворения все возрастающих потребностей на библиографическую и фактографическую информацию совершенно естественными будут такие условия, при которых АБС будет располагать значительным набором баз данных, призванных слу­жить для удовлетворения как тематических библиографических, так и фактографических запросов.

Таким образом, совокупность баз данных, на которых осуществляется комплексное информационное, справочно-библиографическое и библиотечное обслуживание, принято называть в АБС банком данных. На организацию и поддержание в рабочем состоянии банка данных распространяются требования ГОСТа 14,413-80 (Банк данных технологического назначения. Общие требования).

Требования к лингвистическом обеспечению АБС, В методических указаниях о требо­ваниях к содержанию и составлению технического задания на создание автоматизированных систем центра данных ГСССД РД 50-300-82 под лингвистическим обеспечением понимается сис­тема взаимосвязанных или совместно эксплуатируемых информа­ционно-поисковых языков, предназначенных, для индексирования документов, составления поисковых предписаний, организации распределенных баз данных, а также систематизации информаци­онных массивов. То множество информационно—поисковых языков, которые могут быть использованы и используются в АБС, объяс­няется тем, что каждый из применяемых ИПЯ обслуживает реше­ние определенных задач и выполняет различные функции, связан­ные с индексированием документов и запросов, поиском информа­ции, организацией информационных изданий типа РЖ, СИ, летописей. Поэтому выбор информационно-поисковых языков, в качестве лингвистического обеспечения АБС должен строиться на глубоком детальном анализе тех информационных задач и объектов, которые подлежат автоматизации. Заметим, что разработка универсальных ИПЯ для решения множества информационных задач неприемлема, И не только потому, что разработка ИПЯ - дорогостоящий про­цесс, но и потому, что задачи, решаемые в АБС, принадлежат к различным видам и требуют специфических лингвистических средств. В качестве показателей и критериев оценки информа­ционно-поисковых языков должны быть оценки по семантической силе, однозначности, компактности, небольшой стоимости, а также простоте овладения методами индексирования документов и запро­сов.