Смекни!
smekni.com

доклада. В. Н. Баталин. «Из опыта оцифровки кинофотодокументов в ргакфд» (стр. 2 из 2)

В этом году началась работа по описанию фотодокументов для базы данных ИКАР с одновременным снабжением этих описаний отсканированными изображениями фотодокументов. Параллельно, компанией "Альт-Информ" была проведена успешная конвертация "макинтошевской" базы данных фотодокументов под программу ИКАР. В настоящее время база данных фотодокументов состоит из конвертированных 55.000 описаний и 12.000 изображений, и новых 22000 (июнь-проект) описаний с изображениями.

Уже сейчас можно сказать, что достаточно рискованное решение о конвертации "макинтошевской" базы данных фотодокументов себя оправдало и архив располагает теперь современной, удобной в эксплуатации, базой данных.

В свете уже имеющегося, более чем десятилетнего опыта создания в РГАКФД автоматизированных архивных технологий, я хотел бы остановиться, но лишь конспективно, из-за ограниченности времени, на некоторых вопросах.

Прежде всего это проблема осуществления тематической выборки документов. В РГАКФД это осуществляется, применительно к фотодокументам, с помощью цифровых индексов, которые разработаны в РГАКФД на основе "Схемы единой классификации документной информации в систематических каталогах государственных архивов СССР", но умещаются на 4 страницах. В Базе данных на кинодокументы также используется этот четырехстраничный классификатор, но темы расписываются в поле для ключевых слов и не в цифровом, а в расшифрованном понятийном виде. Но и в том и другом случае грамотно сформулировать необходимый тематический запрос может только архивист, или исследователь, имеющий перед собой этот классификатор - так было в старой "макинтошевской" базе данных фотодокументов, так и в существующей базе кинодокументов. В то же время, архивы должны будут разместить, рано или поздно, эти базы данных в Интернете - пользу от этого мы уже ощутили, разместив в Интернете базу данных по кинодокументам, в том числе, частично, и на английском языке. Поэтому пользователь Интернета должен, желательно, иметь возможность получить подсказку в виде перечня имеющихся в Базе тем. Другое дело, в каком виде - цифровом или буквенном, и как велик будет этот перечень, но в любом случае, он не должен быть так велик как СЕК, тем более, что Схемы единой классификации дореволюционного и советского периода имеют одинаковые индексы для совершенно различных понятий и, поэтому, не могут использоваться в Базах данных, например у нас в РГАКФД, хранящем документы с XIX-го века до наших дней. Необходимость возможности тематической выборки обусловлена и тем, что терминология имеет свойство устаревать, и понятия, всем широко известные в одну эпоху, забываются в другую (уже не все помнят, например, кто такие "двадцатипятитысячники"), поэтому нельзя ориентироваться в целом на возможность контекстного поиска информации. В новой базе данных фотодокументов эта проблема решена путем предлагаемого списка используемых в базе данных тем в соответствующей графе редактора поиска. Кстати, возможность подобной "подсказки" применена в редакторе поиска и для других, помимо тем, понятий. При разработке программного обеспечения баз данных следует также предусматривать возможность редактирования организованного в алфавитном порядке списка ключевых слов с целью исключения из него "информационного мусора" в виде слов с опечатками, лишних пробелов и т.п.

Упомянув Интернет, следует при этом отметить, что размещение документов в Интернете считается публикацией и подпадает под закон "Об авторском и других смежных правах", что, в первую очередь, касается фотодокументов. Поэтому следует предусмотреть или возможность программными средствами ограничить доступ к определенным документам, или же не размещать их в Интернете до истечения ограничительного срока. Естественно, речь идет об изображении фотодокументов, при этом качество изображений в размещенной в Интернете Базе данных не должно быть высоким, чтобы исключить несанкционированное использование изображений фотодокументов в полиграфических целях. В то же время, представляется желательным иметь в архиве цифровые копии фотодокументов с высоким разрешением, которые несли бы функцию страховых копий фотодокументов, а также позволяли бы, например, изготавливать по заказу на специализированных принтерах фотоотпечатки на фотобумаге, или же предоставлять заказчикам копии на цифровых носителях для полиграфических нужд. Это может быть особенно удобно при предоставлении копий цветных фотодокументов, так как процесс изготовления их традиционным фотохимическим способом трудоемок и дорог, и, например, в РГАКФД не осуществляется.

Само понятие страховой цифровой копии документа, в данном случае фотодокумента, обусловлено появлением аудиовизуальных документов изначально изготовленных на цифровых носителях и все большее количество издательств газет и журналов работают с фотографиями, снятыми цифровыми камерами. Соответственно и архивы уже ими комплектуются. При наличии у архива денег (и, к сожалению, немалых) можно, конечно, приобрести соответствующую технику и осуществлять вывод цифровых документов на 35-ти мм пленку и хранить эти пленки как страховые копии, но мне представляется это лишь данью традиции материальности, в физическом смысле, документов. Правда, в РГАКФД подобная технология применяется, но для осуществления компьютерной реставрации изображений фотодокументов.

Думается, что настала необходимость узаконить понятие "страховой цифровой копии документов", тем более, что все большее распространение получают электронные документы и электронные подписи.

Теоретически, цифровую информацию можно сколько угодно раз копировать без потери информации, другое дело, что долговременное хранение оцифрованных документов (любых, в том числе и баз данных) ставит проблему выбора носителя цифровой информации. Конечно, "только пирамиды вечны", но уже и сейчас существуют достаточно долговечные и недорогие носители (типа СD и DVD-дисков), будут появляться новые, поэтому необходимо будет лишь своевременно и в необходимом количестве осуществлять копирование информации.

При разработке программного обеспечения баз данных также желательно предусматривать возможность и пути их адаптации, в будущем, к новому программному обеспечению и новому компьютерному "железу" - с подобной проблемой мы впервые столкнулись после того, как был ликвидирован бывший кинофотофоноархив Российской федерации в г.Владимире и нам были переданы как кинофотодокументы, так и научно-справочный аппарат к ним, который включал и базы данных на кинофотодокументы, предназначенные для эксплуатации на 286-х моделях компьютеров - ни на чем ином эти базы данных работать не желали.

Еще большей проблемой была конвертация "макинтошевской" базы данных фотодокументов под программу ИКАР, о которой уже говорилось выше, и которую успешно осуществила С.-Петербургская фирма "Альт-Информ" (насколько мне известно, в мире еще никому не удавалось сделать подобное).

Следует также отметить, что взгляд на компьютерную информацию как нечто нематериальное и, следовательно, малонадежное, во многом тормозит внедрение компьютерных технологий, приводит к ненужному дублированию при проведении некоторых архивных работ (например, продолжение параллельного ведения компьютерных баз данных и традиционных каталогов).

Конечно, подобная ситуация на определенном этапе естественна, но рано или поздно от подобного дублирования придется отказываться, т.к оно приводит к нерациональному расходованию и так небольших трудовых и финансовых ресурсов архивов.

Но в любом случае, одной из важнейших задачей архивистов теперь становится постоянное изучение и внедрение современных технологий, без которых, чем дальше, тем больше, нам не обойтись.