Смекни!
smekni.com

Создание программы-переводчика текстов с английского на русский язык (стр. 1 из 3)

Министерство образования и науки Республики Казахстан

Карагандинский Государственный Технический Университет

Курсовая работа

По дисциплине:

«Лингвистическое обеспечение»

Тема:

«Создание программы-переводчика текстов с английского на русский язык»

2009


Содержание

Введение

1. Предпроектные исследования

2. Работа на тему «Бинарные деревья»

2.1 Техническое задание на разработку программы

2.2 Описание программы

2.3 Выводы по работе

2.4 Результаты работы программы

3. Работа на тему «Польская запись»

3.1 Техническое задание на разработку программы

3.2 Описание программы

3.3 Выводы по работе

3.4 Результаты работы программы

4. Работа на тему «Переводчик»

4.1 Техническое задание на разработку программы

4.2 Описание программы

4.3 Выводы по работе

4.4 Результаты работы программы

Заключение

Список использованных источников

Приложения

Введение

Целью выполнения данного курсового проекта является приобретение практических навыков в построении переводчиков; в разработке диалога САПР; в структурировании языков САПР; в области использования языков программирования и создания языков проектирования.

В задачи курсового проекта по дисциплине «Лингвистическое обеспечение» входит:

- получение знаний в области лингвистического обеспечения;

- изучение классификации языков САПР, структуры трансляторов, структуры диалога в САПР;

- развитие навыков программирования, полученных на предыдущих курсах;

- развитие системное мышление;

- написание программы, соответственно варианту задания.

В настоящее время все большее распространение приобретает английский язык, как язык международного значения. Поэтому ставится задача создания более совершенных переводчиков. Разработанный проект демонстрирует переводчик, работа с которым очень удобна для пользователя. Программа является очень актуальной на сегодняшний день, она способствует быстрому переводу различных текстовых документов и обработку большого количества информации, а также предоставляет возможность добавления новых слов в словарь.

1. Предпроектные исследования

Лингвистическое обеспечение – это совокупность всех языковых средств используемых в САПР, включая термины и определения, правил формализации естественного языка, методы сжатия и развертывания текстов, необходимых для выполнения автоматизированного проектирования.

Лингвистическое обеспечение автоматизированной системы – совокупность языковых средств, используемых в автоматизированных системах, а также правил формализации естественного языка в целях повышения эффективности машинной обработки информации.

Практика показала, что мощность и комфортность конкретной системы автоматизированного проектирования прямо и весьма существенно зависит от мощности ее лингвистического обеспечения. Возрастающая практическая значимость лингвистического обеспечения определяется такими причинами, как:

- огромные объемы текстов на естественном языке, циркулирующих в информационных системах;

- необходимость использования новых стратегий обработки информации с учетом семантических законов обыденного языка;

- потребность в гибком и тесном симбиозе человека и компьютерной системы;

- вовлечение в обработку многообразных скрытых знаний, экспликация которых возможна только на естественном языке.

В настоящее время искусственные языки, использующие для описания предметной области текстовое представление, широко применяются не только в программировании, но и в других областях. С их помощью описывается структура всевозможных документов, трехмерных виртуальных миров, графических интерфейсов пользователя и многих других объектов, используемых в моделях и в реальном мире. Для того, чтобы эти текстовые описания были корректно составлены, а затем правильно распознаны и интерпретированы, используются специальные методы их анализа и преобразования. В основе методов лежит теория языков и формальных грамматик, а также теория автоматов.

Несмотря на то, что к настоящему времени разработаны тысячи различных языков и их трансляторов, процесс создания новых приложений в этой области не прекращается. Это связано как с развитием технологии производства вычислительных систем, так и с необходимостью решения все более сложных прикладных задач. Элементы теории языков и формальных грамматик применимы и в других разнообразных областях, например, при описании структур данных, файлов, изображений, представленных не в текстовом, а двоичном формате.

Лингвистическое обеспечение состоит из совокупности трёх языков: входного, внутреннего и выходного.


2. Работа на тему «Бинарные деревья»

2.1 Техническое задание на разработку программы

Дана числовая последовательность. Отсортировать ее, используя обратный обход бинарного дерева в порядке возрастания.

2.2 Описание программы

Входной язык

Входной язык является средством взаимодействия пользователя с данной программой в ходе обработки исходных данных и формулировки проблемы.

Для данной программы исходными данными являются, числовая последовательность, необходимая для сортировки, которую пользователь вводит с клавиатуры.

Форма ввода для исходных данных приведены ниже (рисунок 1).

Рисунок 1 – Форма ввода данных для программы «Бинарные деревья»

Внутренний язык

Внутренний язык обычно скрыт от рядового пользователя, служит для представления и обработки информации, которая передаётся между различными подсистемами информационных систем. В качестве внутреннего языка был выбран Паскаль.

Это структурированный язык высокого уровня, который можно использовать для написания программ любого типа и размера. Разработка программ на Паскале включает в себя следующие действия: ввод и редактирование текста на языке программирования, трансляция и отладка программы. Для каждого этапа требуются специальные средства: редактор текстов, компилятор, включающий в себя компоновщик – для построения исполняемого компьютером программного модуля и отладчик – для отладки программы. Систему программирования Турбо Паскаль называют еще интегрированной средой программирования, так как она объединяет в себе все ранее разрозненные средства, используемые при разработке программ.

Широкой популярности Паскаля способствовали следующие причины:

· Благодаря компактности, удачному первоначальному описанию язык оказался достаточно легким для изучения.

· Он отражает фундаментальные концепции алгоритмов в легко воспринимаемой форме.

· Паскаль позволяет четко реализовывать идеи структурного программирования и осуществлять переход к объектно-ориентированному программированию (язык Турбо Паскаль предоставляет программисту все средства ООП: высокую степень структурированности, модульность, абстрактность и возможность повторного использования, которые встроены непосредственно в язык).

· Язык программирования позволил перейти к системам автоматической проверки правильности программ.

Паскаль – язык структурного программирования.

Для данной программы этот язык подходит больше всего, так как имеет возможность работы с динамическими структурами данных, т.е. с такими структурами данных, размер и конфигурация которых изменяются во времени исполнения программ. Для них выделение и очистка памяти происходит не на этапе трансляции, а в ходе выполнения самой программы. Для работы с динамическими величинами в Паскале предусмотрен специальный тип значений – ссылочный. Этот тип не относится ни к простым, ни к составным. Переменные ссылочного типа, или указатели, являются статическими переменными. Значением переменной ссылочного типа является адрес ячейки – места в памяти соответствующей динамической величины. Своё значение ссылочная переменная получает в процессе выполнения программы, в момент появления соответствующей динамической величины.

Выходной язык

Выходной язык обеспечивает оформление результатов программы в текстовом виде.

Для данной программы выходными данными являетсяпоследовательность чисел, отсортированная в порядке возрастания, используя обратный обход бинарного дерева. Форма выходной информации приведена ниже (рисунок 2).

Рисунок 2 – Форма выходных данных для программы «Бинарные деревья»

2.3 Выводы по работе

В данной работе были изучены алгоритмы сортировки методом прохождения бинарного дерева.

Деревом называется орграф для которого:

1. Существует узел, в который не входит ни одной дуги. Этот узел называется корнем.

2. В каждую вершину, кроме корня, входит одна дуга.

С точки зрения представления в памяти важно различать два типа деревьев: бинарные и сильноветвящиеся. В бинарном дереве из каждой вершины выходит не более двух дуг. В сильноветвящемся дереве количество дуг может быть произвольным.

Бинарное дерево является рекурсивной структурой, поскольку каждое его поддерево само является бинарным деревом и, следовательно, каждый его узел в свою очередь является корнем дерева.
Узел дерева, не имеющий потомков, называется листом.

Я считаю, что этот метод сортировки для данной работы является очень удобным и быстрым. Он позволяет значительно ускорить время поиска любого элемента. Программа позволяет сортировать с помощью бинарных деревьев последовательность чисел в порядке возрастания методом обратного обхода.

2.4 Результаты работы программы

Результаты работы программы представлены на рисунке 3. Листинг программы приведен в приложении А.

Рисунок 3 – Результаты работы программы «Бинарные деревья»