Смекни!
smekni.com

Автоматизация работы в офисе (стр. 4 из 7)

Флажки панели «Показывать» определяют способ представления окна программы и открытых документов.

Панель «Цвета» позволяет определить цвета различных элементов документа. В нижней части окна можно задать дополнительные параметры.

2.7. Распознавание бланков

Важной особенностью программы FineReader является возможность распознавания бланков. Бланк представляет собой отформатированный документ, в специальные поля которого вносятся данные. Типичными примерами бланков являются анкеты. Формат бланка может быть достаточно вычурным и не напоминать ни книжную, ни журнальную страницу.

Особенность работы с бланками заключается в том, что приходится иметь дело с объемным пакетом документов одинаковою формата, заполненных разными людьми. В таких документах различается содержание заполненных полей, а стандартные заголовки не представляют интереса. Данные, полученные из набора бланков, обычно подлежат последующей обработке, например статистической. Для обработки бланков предназначено специальное приложение FineReader Forms.

Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Для этого служит команда «Сервис®Шаблоны». В открывшемся диалоговом окне «Шаблоны» можно создать новый шаблон или открыть для редактирования уже имеющийся.

В этом случае программа открывает окно «Редактор шаблонов» и дополнительное диалоговое окно «Параметры». В этом окне размещают блоки, соответствующие полям бланка и для каждого блока указывают тип содержащегося в нем значения. Блоки, содержащие данные, задаваемые пользователем, помечаются как экспортируемые. Данные могут записываться в текстовый файл или заноситься в базу данных в качестве записей.

Созданный шаблон используется на этапе сегментации. Сегментация в данном случае состоит не в реальном разбиении страницы на блоки, а в наложении шаблона. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещен бланк при сканировании.

Заключительный этап состоит в распознавании содержимого бланка. Результат представляется в виде формы, содержащей названия полей и их содержание. Последовательность распознанных бланков может быть сохранена в рамках единой базы данных для последующей обработки.

3. Автоматический перевод документов

Идея автоматического перевода текстов с одного языка на другой витает в воздухе со времени появления самых первых компьютеров. Если бы полноценный перевод был возможен, значительно упростилось бы общение между народами и обмен документами, но это очень сложная задача, о полном решении которой пока не приходится говорить.

Все упирается в объем переводимого текста. Компьютеризованный словарь вполне может справиться с переводом отдельных слов, особенно если он способен предложить несколько значений на выбор. Однако ситуация заметно усложняется, когда мы переходим к переводу целых фраз и, тем более, абзацев связного текста.

Для таких случаев надежного алгоритма перевода с одного языка на другой не существует. Это связано с тем, что каждая фраза языка имеет два уровня: синтаксический и смысловой. Синтаксический уровень определяет построение предложения, а смысловой – его содержание. Для правильного смыслового перевода необходимо принимать во внимание не только конкретную фразу, но и абзац или даже целую главу текста. Таким образом, рассчитывать на то, что при автоматическом переводе получится полноценный документ, нельзя.

Программы автоматического перевода рассчитаны, в первую очередь, на тех, кто совсем не знает соответствующего иностранного языка, но должен ознакомиться с содержанием документа хотя бы приблизительно. Кроме того, подобные программы позволяют готовить короткие сообщения электронной почты на иностранном языке. Такие сообщения трудно считать грамотными, но, скорее всего, корреспондент сумеет понять, что ему хотели сообщить.

Если нет никаких требований к качеству перевода текста с иностранного языка на русский, то программы автоматического перевода можно рассматривать как удобные средства получения простейшего черновика. Если подобные требования есть, то использовать подобные программы не рекомендуется. Квалифицированное редактирование текста, полученного автоматическим путем, обходится в несколько раз дороже, чем услуги специалистов-переводчиков.

3.1. Средства автоматического перевода

Программные средства автоматического перевода можно условно разбить на две основные категории. Первую категорию представляют компьютерные словари. Назначение компьютерных словарей то же, что и у обычных словарей: предоставить значение неизвестного слова.

Преимущество компьютерных словарей состоит в быстроте доступа и удобстве автоматического поиска значения выделенного слова. Автоматический словарь обычно предоставляет возможность перевода слова по нажатию выделенной комбинации клавиш.

Ко второй категории относятся программы, позволяющие выполнить автоматический перевод связного текста. Они принимают текст на одном языке (предположительно грамотный и не содержащий опечаток) и выдают текст на другом языке. В ходе работы программа использует обширные словари, наборы грамматических правил и другие средства, обеспечивающие наилучшее (с точки зрения программы) качество перевода. Словарь может содержать не только отдельные слова, но и типичные словосочетания.

Используя эти средства, программа анализирует грамматическую структуру предложений исходного текста, обнаруживает связи между словами и пытается построить верный перевод фразы на другом языке. Чем короче предложение, тем больше шансов на то, что такое преобразование будет правильным. В длинных предложениях и сложных грамматических конструкциях любая система перевода может давать сбои.

В Украине наиболее широкое распространение получили программы автоматического перевода с английского языка на русский, а также с русского на английский. Это объясняется ведущей ролью английского языка в сфере международного общения. Английский язык достаточно прост для изучения, однако его простота неожиданно создает дополнительные трудности для систем автоматического перевода. Дело в том, что одинаково написанные слова в английском языке часто относятся к разным частям речи. Это затрудняет грамматический анализ предложения и нередко приводит к возникновению грубых ошибок в автоматическом переводе.

3.1.1. Программа Promt98

Из систем автоматического перевода с русского языка на английский и наоборот наиболее распространены такие программы, как Socrat и Stylus. Stylus, вне всяких сомнений, обеспечивает более высокое качество и более высокую гибкость при переводе. Последняя версия программы Stylus сменила название и теперь называется Promt98.

Программа Promt98 предназначена для автоматического перевода текстов с английского языка на русский и с русского на английский. Она способна работать с документами в различных форматах, допускает немедленное редактирование и оригинала и перевода и может сохранить в нужном виде как оригинал, так и перевод.

Система Promt98 включает богатый набор как универсальных, так и специализированных словарей и содержит средства для управления их использованием. Перевод слов, которые не входят ни в один из словарей, можно определить самостоятельно и сохранить в пользовательском словаре. Кроме того, программа Promt98 позволяет указать правила работы с именами собственными и другими словами, не требующими перевода, например сокращениями.

Дополнительные возможности программы включают пакетный перевод файлов, быстрый перевод неформатированного текста, а также возможности синхронного перевода Web-страниц в Интернете. Эти средства реализованы как отдельные приложения.

3.2. Рабочее окно программы Promt98

После установки программы Promt98 в Главном меню появляются пункты, которые позволяют ее запустить. Дополнительно на панели индикации (на правом краю Панели задач) устанавливается значок для быстрого запуска программы. Щелчок правой кнопкой мыши на этом значке открывает меню, позволяющее запускать все приложения системы. Основная программа запускается при выборе пункта PROMT98.

Интерфейс Promt98 реализован в соответствии с требованиями операционной системы Windows9Х. После запуска программы на экране открывается окно приложения, которое содержит строку меню, ряд панелей инструментов и рабочую область.

Рабочая область окна приложения разбита на несколько подобластей. Две основные зоны содержат исходный текст и его перевод. Они располагаются непосредственно под панелями инструментов.

В нижней части окна приложения расположена информационная панель. Она содержит три вкладки, предназначенные для отображения и выбора используемых словарей, для ведения списка слов текущего документа, не знакомых программе, и для управления списком зарезервированных слов, не требующих перевода. Эту панель в случае необходимости можно убрать с экрана.

В верхней части окна приложения под строкой меню располагаются инструментальные панели. Панель инструментов «Основная» содержит кнопки для открытия и сохранения документов и для операций с буфером обмена. Здесь же находятся кнопки, позволяющие произвести проверку орфографии, контекстный поиск и замену слов, а также пересылку документа по электронной почте. Прочие кнопки этой панели служат для изменения представления документа в окне приложения.

Панель «Перевод» содержит элементы управления, используемые при выполнении перевода. С их помощью осуществляется работа со словарями, перевод всего текста или отдельных его фрагментов, выбор направления перевода (то есть, языков оригинала и перевода), а также резервирование отдельных слов и целых абзацев.