Смекни!
smekni.com

Информатика Базовый курс (стр. 148 из 188)

4. Дайте команду Файл • Новый Пакет.

5. Задайте имя пакета и место его размещения, после чего щелкните на кнопкеСоздать.

6. Щелкните на кнопке Сканировать, чтобы выполнить сканирование документа.

7. Щелкните на кнопке Распознать, чтобы программа выполнила сегментацию ираспознавание текста автоматически.

8. Щелкните на кнопке Проверить, чтобы начать проверку распознанного текста.

9. В диалоговом окне Проверка выбирайте необходимые действия для корректировки ошибок распознавания.

10.

Обращайте также внимание на ошибки, которые программа FineReader может пропустить: ошибки при распознавании знаков препинания, пропуски строк при низком качестве отсканированного текста, дефекты сканирования, которые не могут быть исправлены автоматически.

11.

Сохраните полученный документ.

И Мы научились улучшать качество электронного документа путем полуавтоматической обработки результатов распознавания. Мы также узнали, какие ошибки наиболее характерны для систем распознавания.

17.2. Автоматизированный перевод документов

К средствам автоматизации перевода можно отнести два вида программ: электронные словари и программы перевода. Электронные словари представляют собой средства для перевода отдельных слов, отображаемых на экране или имеющихся в документе. Удобство их использования состоит в возможности немедленно получить перевод неизвестного слова без поиска его в отдельном толстом томе. Программы перевода получают на входе текст, выполненный на одном языке, и выда-

ют текст на другом языке, то есть автоматизируют перевод текста.

Электронные словари удобны для профессиональных переводчиков, которые выполняют большую часть работы по переводу вручную. Их также могут использовать лица, в целом знающие иностранный язык, если надо не обеспечить перевод документа, а просто ознакомиться с его содержанием.

Надежный и качественный автоматический перевод документов с одного языка на другой (мы будем говорить в основном о переводе с английского на русский) пока остается недостижимым идеалом. Причин для этого множество, и главная из них состоит в том, что перевод текста не сводится к переводу отдельных лексических единиц. Преодолеть этот барьер современные программы автоматического перевода пока не могут.

Тем не менее, современные средства автоматизации перевода достигли того уровня, который позволяет эффективно использовать их на практике. Дело в том, что технический текст, в отличие от художественного, использует ограниченное число языковых конструкций и более ориентирован на однозначную интерпретацию.

17.2. Автоматизированный перевод документов

Среди используемых лексических единиц встречается большое число технических терминов, имеющих совершенно определенный смысл в рамках данной научной или технической дисциплины. Это значительно упрощает процесс перевода и позволяет в отдельных случаях автоматически получать текст, близкий к результату ручного подстрочного перевода.

Программы автоматического перевода имеет смысл использовать для перевода технических текстов в следующих случаях:

• при абсолютном незнании иностранного языка;

при необходимости получить перевод быстро, даже ценой снижения его качества (например, это относится к переводу Шей-документов);

• для перевода на иностранный язык (умения читать иноязычные тексты недостаточно, чтобы научиться объясняться на иностранном языке);

• для быстрого создания первоначального черновика («подстрочника»), исполь-зуемого в ходе подготовки полноценного перевода.

Работа с программой PROMT XT

Для автоматизированного перевода технических текстов можно, например, использовать разные программы семейства PROMT. Они позволяют переводить документы с английского языка на русский и с русского на английский. Чтобы обеспечить правильный перевод терминов, относящихся к определенной научной дисциплине, используют специализированные словари, в которых для слов, используемых как термины, предлагается в качестве перевода не «обиходное», а специальное значение.

Если необходимость в переводе документов возникает часто и обрабатывать приходится документы разных форматов, удобно использовать один из вариантов пакета PROMT XT. Если необходимость перевода возникает от случая к случаю и приходится иметь дела с неформатированными текстами (например, сообщениями электронной почты) и короткими отрывками, можно воспользоваться более простой программой X-Translator, которая также относится к семейству PRОМТ. В этом пособии мы рассмотрим работу с использованием пакета PROMT XT.

Если программа PROMT XT установлена на компьютере, для ее запуска можно использовать Главное меню (Пуск • Программы • PROMT XT Family • PROMT).

Одновременно для обработки может быть открыто несколько документов. Окна документов имеют необычный вид (рис. 17.5). Они разбиваются на три отдельные области: две из них предназначены для отображения оригинала текста и сформированного перевода, а третья представляет собой информационную панель, предназначенную для вывода информации о переводимом документе и специальных настройках.

Чтобы произвести перевод имеющегося документа с использованием заданных по умолчанию настроек, применяют следующий порядок действий.

1. Сначала необходимо открыть документ на языке оригинала (кнопка Открыть на панели инструментов Основная). Нужный документ выбирают в диалоговом окне Выберите документ. Формат открываемого файла выбирают в раскрывающемся списке Тип файлов.

500 Глава 17. Автоматизация обработки документов

Панель

исходного Панель Панель Панель текста _^ Основная Перевод перевода

Информационная панель

Рис. 17.5. Рабочее окно системы автоматизированного перевода PROMT XT

2.

После выбора файла появляется диалоговое окно Конвертировать файл. В немможно уточнить реальный формат документа, хранящегося в файле, если он не соответствует типу файла или когда тип файла может соответствовать нескольким разным форматам документа.

3.

Документ загружается и отображается в области исходного текста. При вертикальном разбиении окна документа эта область располагается слева. Если предполагается длительная работа над переводом текста, его сохраняют как документ программы PROMTXT(файл с расширением .STD).

4. Определение языков оригинала и перевода рассматривается как направление перевода. Чтобы выбрать направление перевода, используют кнопку Направление перевода на панели инструментов Перевод.

5. Чтобы перевести весь текст целиком, используют кнопку Перевести весь текстна панели инструментов Перевод. В ходе выполнения перевода на экране отображается диалоговое окно Перевод текста с индикатором хода работы. Перевод текста помещается (при вертикальном разбиении окна) в правую область. Для удобства последующего редактирования перевод снабжается цветовой разметкой: неизвестные программе слова подчеркиваются красным, а зарезервиро-


17.2. Автоматизированный перевод документов 501

ванные слова, которые не надо переводить, — зеленым. Другие типы маркировки и подчеркивания показывают, из какого словаря взят перевод указанного слова. Текст, помещенный в областях окна программы PROMT XT, можно редактировать (и оригинал, и перевод). Чтобы заново перевести отредактированный абзац, используют кнопку Перевести текущий абзац на панели инструментов Перевод. Текущий абзац — это абзац, в котором располагается текстовый курсор. Он выделяется голубой полосой вдоль левого края.

6. После того как работа с документом в программе PROMT XT завершена, его сохраняют в одном из общепринятых форматов. Для сохранения только оригинала (возможно, отредактированного) служит команда Файл • Сохранить • Исходный текст. Чтобы сохранить переведенный текст, применяют команду Файл • Сохранить • Перевод. В обоих случаях можно сохранять как содержимое документа, так и его элементы форматирования, сохраняющие, по возможности, оформление оригинала.

Чтобы продолжить работу с текстом позднее, удобнее сохранить его двуязычный вариант, так называемую билингву (Файл • Сохранить • Билингву как список абзацев или Билингву как таблицу). В первом случае сохраняется сплошной поток текста, причем абзацы оригинала и перевода чередуются. Во втором случае документ сохраняется как таблица с двумя столбцами. Каждая ячейка содержит один абзац, причем в левом столбце отображается оригинал, а в правом — соответствующий перевод.