Смекни!
smekni.com

Искусственный интеллект (стр. 10 из 23)

употребление глаголов вторичной имперфективизации [Русский язык в его

функционировании].

Среди других теоретических работ следует отметить :

— исследования по аффиксации: изучение словообразовательного потенциала суффиксальных типов русских существительных [Каде], суффиксальной универбации и усечения в русском словообразовании

[Осипова Л.И.], возникновения новых аффиксов [Мамрак], сочетаемости пре-

фиксов в русском слове [Кузнецова], парадигматики и синтагматики русских

глагольных префиксов [Волохина и др.], суффиксоидов в современном английском языке [Бартков], словаря словообразовательных аффиксов в русском языке [Улуханов, 93];

— исследования словообразовательной мотивированности и ее связи с

производностью [Улуханов,92], мотивационного отношения “имя-глагол”

[Осипова М.А.], типов полисемии в производном слове и границ словообразова-

тельного гнезда [Ширшов, 96] ;

— работы по различным типам окказиональных способов словообразо- вания [Улуханов, 92];

— исследования по связи морфологического уровня с другими уровнями

языка: фонемным (морфемный или фонемный принцип русской орфографии)

[Моисеев,95], синтаксическим (синтаксическая деривация как проявление изоморфизма между словообразованием и синтаксисом) [ ], лексическим

(лексический состав русского языка со словообразовательной точки зрения

[Моисеев, 91], семантическим (границы словообразовательной семантики) [Улуханов,91], стилистическим (стилистические аспекты русского словообразования ) [Vinogradova];

— работы по диахронической морфологии русского словообразования [Улуханов, 92], диахронии словоизменения и словообразования русских существительных [Русский язык в его функционировании], развития категории

одушевленности в русском языке [Крысько].

Как и в каждой области знания, в морфологии немало интересных и спор-

ных проблем. Поскольку “словообразование постоянно балансирует в языке между системностью и беспорядком” [Пиотровский, 95], в литературе живо обсуждаются правомерность использования понятия усечения морфем [Добродомов], сложные случаи морфемики и словообразования [Шанский], пограничные случаи между словоизменением и словообразованием [Муравьева], лексикой и словообразованием [Глухих], морфемика в ее отношении к формообразованию [Герд, 94], проблемы трактовки групповой флексии [Плун-

гян,94].

С точки зрения историографии морфологии безусловный интерес представ-

ляет переписка Н.С.Трубецкого и Р.О.Якобсона о повелительном наклонении

русского глагола [Храковский, 94].

Типологические исследования по морфологии

Естественными и традиционными представляются работы по сопостави-

тельной морфологии русского языка с другими языками и прежде всего со сла-

вянскими, балканскими и балтийскими. Из огромного количества подобных

работ прежде всего следует отметить доклады российской делегации на X I Меж-

дународном съезде славистов в Братиславе (1993г.) [Земская и др., Нещименко,

], материалы научных конференций

и сборников, в которых среди прочих обсуждаются проблемы:

— сопоставительной славянской аспектологии [Смирнов];

— образно-экспрессивного употребления грамматических категорий [Ши-

рокова];

— словообразовательной интерференции в славянских языках [Джамбазов];

— морфологической типологии слова в разноструктурных языках, в том

числе в русском, английском, французском и испанском [Широкова,92];

— типологии грамматических категорий — в частности, категории лишитель-

ности в славянских и балканских языках [Иванов и др.], категории наклонения

в разных языках [Сабанеева];

— морфологические характеристики слов в “старославянском словаре” [Кры-

сько].

Как всегда, весьма разнообразны сопоставительные морфологические исследования по другим языкам: английскому [Биренбаум], малагасийскому [Коршунов], тагальскому [Шкарбан], чешскому [Стешковская], эвенскому

[Роббек], лезгинскому [Керимов], эскимосскому [Вахтин], вепсскому [Иткин],

догон [Плунгян, Plungian], дари [Островский].

Прикладные исследования по морфологии

Прикладная морфология, являясь составной частью компьютерной линг-

вистики, традиционно считается в ней наиболее исследованной областью,

в задачу которой входит:

— разработка морфологических процессоров — систем автоматического

морфологического анализа и синтеза слов, а также систем лемматизации — сведе-

ния словоформ к словарным словам;

— автоматизация морфологических исследований, предусматривающая про-

ведение ряда лингвистических работ с помощью ЭВМ для решения основной за-

дачи — разработки морфологических процессоров: использование СУБД для

составления морфологических словарей, проведения типологических исследо-ваний, моделирования морфологических явлений и т.д.

Следует отметить, что в настоящее время используются самые разнообраз-

ные автоматизированные системы обработки речи и текста, применяющие мор-

фологические процессоры: системы машинного перевода, коррекции и редакти-

рования текста, анализа и синтеза речи, информационного поиска (в особенности

полнотекстовые системы), автоматического реферирования, автоматические словари, экспертные системы и обучающие лингвистические автоматы. В указанных системах морфологические процессоры являются наиболее надеж-

ными и хорошо отработанными компонентами. В последних промышленных и коммерческих разработках хорошо зарекомендовали себя морфологические процессоры процедурного типа, работающие на базе словаря основ, — ср. сис-

темы автоматического морфологического анализа в СМП АСПЕРА [Королев,

91,95], MORSE [Пиотровский, 95], в автоматических корректорах WinОРФО [Ашманов, 95], автоматического морфологического синтеза в СМП СПРИНТ-2 [Тихомиров, 92], лемматизации русских слов [QUALICO-94].

Модификация морфологических процессоров в основном идет за счет

использования блока анализа слов, не содержащихся в словаре (“новых слов”),

которые традиционно анализируются на основе принципа морфологической аналогии, предполагающего сильную корреляционную зависимость между

грамматическими характеристиками слов и буквенным составом их концов.

Этот принцип давно и успешно используется в морфологических процессорах, разработанных Г.Г.Белоноговым. В 80-е годы киевскими лингвистами (В.И.Пе-

ребейнос, Т.А.Грязнухина, Н.П.Дарчук и др.) принцип аналогии был положен

в основу морфологических анализаторов русского языка, работающих без ка-

ких-либо словарей. Модификация этого подхода, также предполагающего ис-

ключение словарей для целей морфологического анализа или использование

их в минимальной степени, в последнее время была предпринята Г.Г.Белоно- говым для русского и некоторых других языков [Белоногов и др.,95], а также другими специалистами по вычислительной морфологии [Шереметьева и др., 96].

Широкое распространение персональных ЭВМ создает благоприятные

условия для автоматизации морфологических исследований — автоматического

формирования русского морфологического словаря по исходным массивам слов

и словосочетаний [Большаков,93], использования специализированных словарных

баз данных для анализа морфологии русского языка, автоматического типологи-

ческого анализа морфологии семитских языков [QUALICO-94], автоматического

формирования перечня структурных типов префиксов русских существительных

[Герд, 93], использования автоматизированной системы составления и ведения флективных классов русских существительных, прилагательных и глаголов, применяемых в морфологическом процессоре СМП АСПЕРА [Королев, 95],

моделирования морфологического анализа русских слов, содержащих суффик-

сы [Гельбух, 92].

В заключение напомним о том, что за последние несколько десятилетий

морфология переживала свои периоды взлетов и падений. В 60-е годы нашего

столетия определенный застой в морфологических исследованиях был вызван

бурным распространением структурного синтаксиса, а затем и семантики. Одна-

ко со временем развитие науки и требования жизни все расставили по своим ме-

стам, и в последние годы, как свидетельствует наш краткий обзор, теоретическая

и прикладная морфология вновь являются важным полигоном для лингвистичес-

кой теории и практики.

Обеспечение взаимодействия с ЭВМ на естественном языке (ЕЯ) является важнейшей задачей исследований по искусственному интеллекту (ИИ). Базы данных, пакеты прикладных программ и экспертные системы, основанные на ИИ, требуют оснащения их гибким интерфейсом для многочисленных пользователей, не желающих общаться с компьютером на искусственном языке. В то время как многие фундаментальные проблемы в области обработки ЕЯ (Natural Language Processing, NLP) еще не решены, прикладные системы могут оснащаться интерфейсом, понимающем ЕЯ при определенных ограничениях.

Существуют два вида и, следовательно, две концепции обработки естественного языка:

для отдельных предложений;

для ведения интерактивного диалога.

Природа обработки естественного языка

Обработка естественного языка - это формулирование и исследование компьютерно-эффективных механизмов для обеспечения коммуникации с ЭВМ на ЕЯ. Объектами исследований являются:

собственно естественные языки;

использование ЕЯ как в коммуникации между людьми, так и в коммуникации человека с ЭВМ.

Задача исследований - создание компьютерно-эффективных моделей коммуникации на ЕЯ. Именно такая постановка задачи отличает NLP от задач традиционной лингвистики и других дисциплин, изучающих ЕЯ, и позволяет отнести ее к области ИИ. Проблемой NLP занимаются две дисциплины: лингвистика и когнитивная психология.

Традиционно лингвисты занимались созданием формальных, общих, структурных моделей ЕЯ, и поэтому отдавали предпочтение тем из них, которые позволяли извлекать как можно больше языковых закономерностей и делать обобщения. Практически никакого внимания не уделялось вопросу о пригодности моделей с точки зрения компьютерной эффективности их применения. Таким образом, оказалось, что лингвистические модели, характеризуя собственно язык, не рассматривали механизмы его порождения и распознавания. Хорошим примером тому служит порождающая грамматика Хомского, которая оказалась абсолютно непригодной на практике в качестве основы для компьютерного распознавания ЕЯ.