Смекни!
smekni.com

Аналитико-синтетическая переработка информации. Вторичные документы (стр. 1 из 15)

Аналитико-синтетическая переработка информации. Вторичные документы.

Современное общество предъявляет к профессионалу любой сферы деятельности высокие требования. Приходиться констатировать тот факт, что базовых знаний, получаемых в вузе, хватает на первые 3-5 лет профессиональной карьеры. По прошествии этого времени наибольшая часть полученной информации устаревает. Для того чтобы быть «на гребне волны», оставаться конкурентно способным работнику приходится постоянно обновлять знания в своей сфере деятельности, т.е. заниматься самообразованием. Процесс самообразования подразумевает самостоятельную работу человека по извлечению знаний из массива существующей информации, представленной как в книжном, так и в электронном вариантах. Данная проблема требует наличия ряда навыков и умений рациональной работы с информацией. К ключевым моментам относится навыки поиска источников информации, извлечение необходимой информации из найденных источников и ее переработка с целью дальнейшего использования. Все три перечисленных навыка тесно взаимосвязаны и требуют владения приемами свертывания (развертывания) информации.

В рамках прошлого занятия Вы познакомились со следующими понятиями: документ, первичный документ; рассмотрели структуру документального потока, виды и типы документов. Сегодня вы рассмотрим методы аналитико-синтетической переработки информации и получаемые в результате ее виды вторичных документов, Кроме того вы познакомитесь с государственной системой информации, которая занимается подготовкой библиографической информации.

Документальный поток – это множество взаимосвязанных документов разного типа, вида и на различных носителях. Документальный поток имеет сложную структуру и его удвоение носит лавинообразный характер. В настоящее время отдельному человеку не под силу отследить весь объем документов, выпускаемых по какой либо отрасли знаний. Еще с древнейших времен, как только собрание документов достигало сложно обозримой и управляемой величины (т.е. большого объема ), возникала необходимость его представления в сжатой форме. Тогда и стали появляться прототипы современных методов свертывания информации.

Свертывание информации – это методы представления информации в особой экономичной знаковой форме, которая способствует всестороннему и рациональному ее использованию.

Свертывание (развертывание) информации– изменение физического объема сообщения (документа) в результате его аналитико-синтетической переработки, сопровождающееся уменьшением (или увеличением) его информативности.

Например.
Синильная кислота, открытая во второй половине 18 века шведским ученым Шееле, - это сильный яд, представляющий собой бесцветную жидкость с резким запахом и неприятным вкусом, вызывающим во рту ощущение теплоты…
В результате процесса свертывания, получаем: синильная кислота – это яд.
Получилась короткая конструкция, но основной смысл выражения ясен.
В качестве одной из форм свертывания можно рассмотреть использование метафор:
Трудно даже перечислить все затронутые в книге вопросы: читатель как бы попадает на интеллектуальный пир, откуда он не уйдет голодным, хотя некоторые блюда ему, может быть, не придутся по вкусу. (М.В. Арапов)
Смысл этой метафоры: содержание книги многогранно.

Примерами высокого уровня обобщения больших фрагментов текстов могут служить заголовки и подзаголовки в документах, фразы в аннотациях, тезисы к докладам и тд.

Свертывание информации – мы имеем дело с текстом, сообщением, не ограничиваемым рамками определенного документа. Мы преобразуем текст тем или иным способом с целью уменьшения (или увеличения) его физического объема с оставлением в нем необходимых «смысловых вех», «следов».
При свертывании документа мы получаем новый документ (в общем случае вторичный). При свертывании документа из него могут быть извлечены отдельные фрагменты на «нулевом» уровне свертывания информации.
В сфере информационных коммуникаций с проблемой свертывания человечествостолкнулось на самых ранних этапах развития цивилизации, когда задумалось над тем, как коротко и ясно выражать свои мысли, чтобы «словам было тесно, а мыслям просторно». Первые формальные способы свертывания информации возникли с появлением первых организованных хранилищ памятников письменности (библиотек и архивов), и связанно это было со стремлением изыскать наиболее адекватные формы отражения состава фондов и содержания хранимых в них источников информации в каком-либо поисковом аппарате (от списков литературы на шумерской глиняной табличке и «Таблиц» Каллимаха до современных автоматизированных массивов информации).

Свертывание (развертывание) информации (документа) осуществляется методами, которые лежат в основе всех видов познавательной деятельности людей - анализа и синтеза.

АНАЛИЗ (от греч. «разложение») – метод научного исследования, состоящий в расчленении целого на составные элементы.
СИНТЕЗ (от греч. «соединение, сочетание») – метод исследования какого-либо явления в его единстве и взаимной связи частей; обобщение сведений в единое целое данных. Анализ и синтез, – операции взаимозависимые и взаимопереходящие.

В области информационной деятельности методы анализ/синтеза информации (документа) получили определение аналитическо-синтетической переработки (обработки).

Аналитико-синтетическая переработка (АСП)- преобразование текста (документа) в процессе его анализа и извлечение необходимой информации, а также оценка, сопоставление, обобщение (синтеза) и предоставление информации в виде, соответствующем запросу (потребности).

В результате обработки документ обеспечивается новыми качествами, способствующими его идентификации, поиску и распространению. При свертывании документа мы получаем новый документ. В идеальном случае задача свертывания документа сводиться к созданию ряда произвольных текстов, меньших по объему, чем исходный текст, при сохранении его основного содержания.

Различают шесть основных видов информационного свертывания:

- индексирование;

- библиографическое описание

- аннотирование;

- реферирование;

- конспектирование;

- обзорно-аналитическая деятельность.

Каждый из видов свертывания, в результате которого образуются самостоятельные ряды документов, отличается назначением, уровнем свертывания, применяемыми методами информационного анализа/синтеза. Однако все их объединяет единый принцип, сформулированный в «золотом правиле» коммуникации – эффективное общение возможно лишь на оптимальном уровне свертывания: ниже этого уровня (при излишнем свертывании) сообщение становится непонятным потребителю информации, при превышении этого уровня (излишней развернутости) – скучным, тривиальным, в результате чего степень восприятия сообщения снижается.

Самая высокая степень свернутости документа достигается при индексировании – описании содержания и формы документа средствами того или иного информационного языка.

Индексирование – процесс выражения содержания документа и (или) запроса на информационно поисковом языке (ИПЯ).

Появление первых систем, предназначенных для хранения документальнойинформации с возможностью ее поиска, т.е. библиотек, привело к необходимости создания особых информационно-поисковых языков, отличных от естественных языков. Эти языки призваны были исключить некоторые особенности естественного языка, которые могли затруднить поиск (например, многозначность, омонимию и т. д.). Создаваемые на базе естественных языков искусственные языки, оказались языками формализованными, но обладающими, как и естественные языки, своими алфавитом, лексикой, грамматикой.

ИПЯ – искусственный формализованный язык, создаваемый на основе естественного языка.

В результате индексирования документу присваивается поисковый образ документа (ПОД), а запросу – поисковый образ запроса (ПОЗ).

ПОД – поисковый образ, выражающий основное смысловое содержание документа.

ПОЗ - поисковый образ, выражающий основное смысловое содержание информационного запроса.

Назначение ПОЗ и ПОД состоит в следующем: в информационно-поисковых системах с целью определения (выделения) релевантных запросу документов обычно сравниваются, сопоставляются не сами документы с запросами, а их поисковые образы.

Информационно-поисковая система (ИПС) – предназначенная для информационного поиска совокупность информационно-поискового массива, информационно-поискового языка, правил его использования, критерия выдачи и технических средств.

Релевантность – формальное соответствие ПОД и ПОЗ.

Пертинентность – смысловое отношение между содержанием документа и информационной потребностью.

Чем более профессионально и детально составлены ПОД или ПОЗ, тем более вероятность подобрать источники информации пертинентные (по смыслу соответствующие) потребности.

Различают три основных принципа индексирования – классификация (систематизация), предметизация, координатное индексирование. Каждый вид индексирования реализуется с использованием специально разработанного ИПЯ.

Классификация (систематизация) – вид индексирования, при котором содержание документа и (или) запроса выражено классификационными индексами в соответствии с правилами какого-либо классификационного ИПЯ (классификационной системы). Процесс классификации (систематизации) представляет собой распределение документов по отраслям знаний. Внутри каждой отрасли происходит детализация по менее крупным, но уже расположенными в логически обоснованной последовательности наукам и областям практической деятельности. Например: арифметика, алгебра, геометрия – математические науки, а ботаника, зоология – биологические. Оба названных класса входят в более крупный блок – естественные науки. Классификационный принцип индексирования базируется на использовании специально разработанных таблиц классификации, с помощью которых каждому индексируемому документу присваивается тот или иной индекс (или несколько индексов) и обеспечивает возможность организации поиска по иерархическому признаку (от общего к частному, от целого к части, от рода к виду). Поиск по отраслям знания интернационален, так как организуется с помощью понятных всем цифровых обозначений – классификационных индексов – международных средств доступа к документам. К разряду наиболее распространенных в нашей стране иерархических классификационных систем относятся УДК (Универсальная десятичная классификация) и ББК (Библиотечно-библиографическая классификация).