Методы и средства офисной автоматизации для обработки информации (стр. 1 из 4)

2. Методы и средства офисной автоматизации для обработки информации.

Долгое время автоматизация учреждений в России осуществлялась в виде различного рода подсистем АСУ, основанных на базах данных (кадры, канцелярия, бухгалтерия, зарплата, контроль исполнения и др.) Не умоляя значимости этих подсистем, заметим, что они охватывали лишь до 15-20 % общего объема информации, циркулирующей в учреждении.

Нужды по электронной обработке документов удовлетворялись применением функциональных пакетов (редакторов текста и электронных таблиц) и интегрированных пакетов программ Microsoft Office, Perfect Office, Lotus Smart Suite. Эти средства оказались недостаточными для управления огромными потоками бумажных и электронных документов, циркулирующих как внутри одного предприятия, так и между ними. В целом такой подход грешил отсутствием комплексности в автоматизации делопроизводства и управления документооборотом.

В настоящее время развитие информационных технологий привело к появлению методов и средств, обеспечивающих интегрированные решения по автоматизации офиса, позволяющие автоматизировать ручные операции и поиск документов, автоматически передавать и отслеживать перемещение документов и контролировать выполнение поручений, связанных с документами.

Методы автоматизации офиса

Рассмотрим основные методы автоматизации офисной деятельности. Современные организации представляют собой совокупность подразделений, филиалов и отделов, обменивающихся между собой информацией и выполняющих отдельные части общей работы. Основными фазами жизни неструктурированной информации в офисе являются:

· ввод информации в систему,

· хранение, навигация, поиск и фильтрация документов,

· коллективная работа с документами,

· вывод информации из системы.

Существуют различные способы ввода информации в систему. Это, прежде всего, сканирование документов и сохранение их в виде графических образов. В системах первого поколения графические образы введенных документов идентифицируются с помощью ключевых слов для последующего поиска необходимой информации (например: система SoftSolutions). Позднее стала применяться технология оптического распознавания символов OCR (Optical Character Recognition). После сканирования и ввода документа в систему его графический образ "переводится" в текст, затем следует исправление ошибок распознавания.

При массовом ручном вводе однотипных документов используются электронные формы, которые обеспечивают структуризацию документа путем выделения частей текста и добавления полей (атрибутов), что позволяет упростить заполнение документов и выполнить необходимые вычисления. Информация в офис может поступать и путем импорта файлов с магнитных носителей или по телекоммуникациям (факсы, сообщения электронной почты и т.п.).

Ввод информации сопровождается классификацией документов путем задания атрибутов и ключевых слов, аннотированием их содержания. Для ускорения последующего контекстного поиска производится полнотекстовое индексирование документов.

Важное значение для организации эффективного управления неструктурированными документами имеют методы хранения информации, навигации, поиска и фильтрации документов.

Документы могут храниться просто в файловой системе, и при этом система каталогов служит средством группирования и навигации в хранилище документов. В современных ОС типа Windows 95 есть возможность задания длинных имен каталогов и файлов в качестве названий папок и документов, а также имеются соответствующие средства поиска файлов по их параметрам.

Ряд систем, основанных на электронной почте, хранят документы в почтовых ящиках в виде почтовых сообщений с присоединенными файлами. Навигация в хранилище упрощается с помощью вложенных папок личного и коллективного пользования. Однако в таких системах поиск и фильтрация ограничены лишь отбором и сортировкой документов по атрибутам и тексту почтового сообщения.

Специфический метод хранения реализован в пакете Lotus Notes в виде так называемой базы документов. База документов может хранить как однотипную так и разнотипную информацию в виде одного файла. Документы допускают внутреннюю структуризацию на основе формуляров путем выделения и добавления полей в документе. Навигацию в базе документов упрощает наличие страниц баз документов и категорий документов. Почтовые сообщения также хранятся в виде базы документов, файлы произвольного вида допускается присоединять к текстовым документам.

Многие современные системы электронных документов используют в дополнение к файловой системе так называемые библиотеки документов, содержащие в БД карточки документов с атрибутами и ключевыми словами. Для логической группировки документов применяются папки.
Поиск и фильтрация документов производится по запросам на основе контекстного поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе индекса. При использовании механизма четкого поиска (например, DOCS OPEN) в запросе не должно быть орфографических ошибок, а в тексте документа - ошибок распознавания.

Недавно на основе нейронных сетей и искусственного интеллекта реализована технология нечеткого поиска по полному содержанию документа (например, технология адаптивного распознавания образов APRP в пакете Excalibur EFS). Нечеткий поиск не требует полного соответствия искомых фраз с содержимым документов, кроме того, исключает потребность в исправлении ошибок после распознавания текста. Система поиска всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса.

Фирмы-производители реляционных СУБД (в частности ORACLE) проповедуют другие схемы хранения - текстовые и универсальные БД. Тексты документов хранятся в символьных полях переменной длины, расширенные средства SQL-поиска позволяют формировать смешанные запросы для поиска по атрибутам и контекстного поиска, а дополнительные функции обеспечивают обработку текста. Для хранения произвольной информации, в том числе мультимедиа, можно использовать поля бинарных объектов большой длины BLOB и/или гипертекст. СУБД, расширенные для поиска и обработки такой информации, образуют универсальные сервера БД. Другой способ хранения документов произвольного содержания реализуют объектно-ориентированные БД (например, Informix Illustra).

Феномен распределенного гипертекста составляет основу широко внедряемой Web- технологии. Хранилище информации представляет собой совокупность гипертекстовых страниц, распределенных по узлам сети Internet или корпоративной сети (Intranet). Каждая страница размещается в отдельном файле и представляет собой текст, размеченный с помощью языка HTML. Структуризация документа осуществляется путем форматирования, выделения полей, создания форм для диалогового заполнения документа и организацией внутренних гипертекстовых ссылок. Допускается создание гипермедиа включением любой мультимедиа-информации (растровая графика, аудио, видео). Навигация по хранилищу гипертекста осуществляется с помощью внешних гипертекстовых ссылок URL на документы, расположенные на различных узлах сети (Web-серверах). Кроме того, для определения местонахождения документов служит контекстный поиск. Для ускорения поиска информации в "паутине" применяются специальные программы-роботы, сканирующие Web- сервера и строящие некое подобие индекса. Использование гипертекста позволяет создать информационную инфраструктуру территориально распределенного офиса и упростить диалоговый интерфейс пользователя, что наиболее важно при разработке информационных приложений для руководителей.
Организация и автоматизация в офисе коллективной работы с документами строятся на технологиях groupware и workflow.

Технологии groupware ориентированы на небольшие рабочие группы, характеризуются поддержкой выполнения одной коллективной задачи и отсутствием структуризации в организации работ. Поддержка ограничивается обеспечением коллективного доступа к информации с помощью различных методов доступа:

· сетевой доступ к файлам и базе данных;

· локальная и глобальная электронная почта (включая конференции и дискуссии);

· терминальный доступ, пересылка файлов и электронная доска объявлений;

· просмотр и интерпретация гипертекста (гипермедиа).

Нужно отметить, что Web-технологии помимо гипертекстового протокола HTTP включают в себя ряд других методов доступа.

При коллективной работе важно наличие блокировок для разрешения конфликтов при совместном использовании ресурсов, санкционирование доступа по идентификаторам и паролям, защита информации с помощью прав доступа. Дополнительный уровень безопасности обеспечивается методами и средствами шифрации и электронной подписи.

Технологии класса workflow служат для автоматизации документооборота в средних и крупных офисах и для них характерно:

· поддержка многопользовательской работы с несколькими задачами одновременно;

· четкая структуризация выполнения работ по ролям и документам с контролем исполнения.

Деловой процесс формализуется как совокупность состояний и переходов, необходимых для описания взаимодействия, как минимум двух субъектов (в частном случае сотрудников предприятия) для достижения выполнения заранее заданного условия. Частным случаем такого взаимодействия является простая пересылка документа из точки в точку.
Одной из реализаций технологии workflow является так называемая "система графов", где каждый шаг представляет собой вектор и отражает движение задания, связанного с документом, или просто передвижения документа от одного субъекта к другому. При этом на человека, отвечающего за правильность функционирования схемы, ложится ответственность учета всевозможных непредвиденных (или отказных) ситуаций, которые могут возникнуть на пути движения документа. Другая реализация основывается на понятии "цикл" ("loop") или "стол". В этом случае подразумевается, что наименьшим элементом в схеме взаимодействия является цикл, учитывающий всю гамму взаимодействия между двумя произвольными субъектами. При этом система сама отслеживает замкнутость процесса и, в случае ошибки, указывает место некорректности с указанием ее причины, после чего прекращается генерация нового процесса.