Лингвистическое обеспечение искусственного интеллекта (стр. 5 из 7)

Принципы интерпретации

Большая часть информации неоднозначна. Но, тем не менее, в подавляющем большинстве случаев человек успешно (верно) интерпретирует высказывания. Появляется вопрос: каковы же принципы, которыми пользуется человек, интерпретируя высказывания? В поисках ответа было предложено довольно большое число кандидатов на звание «ведущего» принципа. Вот только некоторые из них:

Наиболее почтенное место занимает «принцип Фреге» (принцип композиционности). В обобщенном виде он формулируется так: значение целого предложения есть функция от значений его частей. Для поверхностной структуры предложения этот принцип, взятый буквально, не совсем справедлив: достаточно проследить его действие в случае синтаксической неоднозначности. В концепции «компонентного анализа» предложения этот принцип действителен только для «исходной синтаксической структуры» предложения; именно на этом принципе и основана работа «правил семантической проекции» в такой концепции семантики [Katz, Fodor 1963]. Даже при такой трактовке, тем не менее, указанный принцип наталкивается на трудность, связанную с интерпретацией цитат.

Принцип минимальной интерпретации [Th.R.Hofmann 1979,] относится к другой стороне вопроса: каждое предложение интерпретируется таким образом, чтобы добавить по возможности меньший объем новой информации, т.е. чтобы максимальным было ее пересечение с предыдущим контекстом (речь не идет о тех случаях, когда вводится новый сюжет, фокус контраста и т.п.). Этот принцип справедлив для прямого толкования предложения, а не для вытекающих из предложения следствий.

Другой количественный принцип – «модифицированная бритва Оккама» [P.Grice 1978]: при интерпретации смыслы выражения не должны множиться больше необходимости. В частности, множество контекстнообусловленных значений («суппозиций») слов в предложении должно быть ровно в той степени широким, какая определяется необходимостью интерпретации; выход за пределы минимума допускается только тогда, когда предложению трудно иначе приписать осмысленную интерпретацию.

Принцип идентифицируемости [K.Stenning 1980] может рассматриваться как связанный с предыдущими двумя; он формулируется так: к интерпретации целого, по мере поступления новых языковых выражений, необходимо добавлять такой минимум, который логически не противоречит самому высказыванию. Аналогичен этому принципу, не обращен на контекст, «принцип локальной интерпретации»: интерпретатор не должен конструировать (а точнее, оценивать) контекст более крупный, чем тот, который ему необходим для получения какой-либо интерпретации. Так, если Джону говорят: Закрой дверь, – то он поймет, что речь идет о ближайшей двери, а не о той, которая находится в соседнем доме на третьем этаже. Такой принцип можно в райках ОЕЯ связать с требованием о минимальной работе анализатора.

Принцип аналогии [Ö.Dahl 1976], взятый с точки зрения интерпретатора, может быть сформулирован так: имей в виду, что говорящий стремится упоминать только те вещи, которые изменились, а о тех, которые остаюсь без изменения, обычно умалчивает.

Наконец, «принцип обычности» можно сформулировать так: если нет никаких для этого оснований, не подозревай, что у интерпретируемых слов имеется какой-либо еще дополнительный, скрытый смысл.

Вычислительная лингвистика

Что же такое «теория лингвистических вычислений»? Это дисциплина, занимающаяся коммуникативными процессами в наиболее абстрактном виде. В ее функции входит установление общего вида и общих принципов построения процессоров естественного языка, доказательство теорем относительно равносильности или неравносильности двух различных формальных грамматик одного и того же языка и т.п. Видимо, именно к теории лингвистических вычислений относится круг задач, традиционно относимый к ведению математической лингвистики, а также к моделированию общения с ЭВМ на естественном языке. Другая же часть теории лингвистических вычислений связана с наиболее глубинными процессами обработки информации человеком и их моделированием на ЭВМ.

Предметом «вычислительной лингвистики» является разработка и применение систем обработки естественного языка в качестве части более крупных систем, например, промышленных информационно-поисковых систем. Задача таких систем – поиск информации в базе данных и автоматическое пополнение базы данных. Другое, смежное направление – построение систем, решающих задачи, сформулированные на естественном языке.

К информационным задачам вычислительной лингвистики относятся:

1. Автоматическое установление по конкретному тексту тех правил и единиц данного языка, которые участвовали в построении этого текста (при этом соответствующая система использует свою базу данных о грамматике и единицах языка). В расширенной формулировке речь здесь идет о том, чтобы установить по конкретному образцу речи (тексту) все те законы логического вывода (в широком смысле) и все те аксиомы («элементарные пропозиции»), которые придают речи осмысленность и делают ее правильным текстом на данном языке.

2. Установление информационных связей, которые имеются между двумя образцами текстов (например, между запросом к информационной системе и информацией, хранимой в системе, или информацией, заданной в виде текста). Так, в запросе может содержаться задание выяснить, описывается ли в тексте искомое приспособление для выполнения конкретных работ.

В обоих случаях требуется установить связи между различными образцами речи. Решение этой задачи связано с представлением и использованием знаний при оперировании речью. Каково же место вычислительной лингвистики в «искусственном интеллекте»?

Р. Шенк указывает, что вычислительная лингвистика – это «проблема наделения машин способностью общаться с человеком на естественном языке. Наш метод состоит в том, чтобы попытаться понять, как люди общаются друг с другом, и исследовать эти процессы». Н. Черконе пишет: «Вычислительная лингвистика должна построить общую теорию понимания естественного языка в качестве основы для таких программ ЭВМ, которые понимают естественный язык».

По мнению Томпсона, теоретическая вычислительная лингвистика представляет собой попытку охарактеризовать природу языка с точки зрения «лингвистических вычислений» – процедур над речью, аналогичных тем, которые выполняются по ходу собственно вычислительных работ. В американской вычислительной лингвистике на сегодняшний день было предложено несколько концепций теоретической вычислительной лингвистики: «функциональная грамматика» М.Кея [M.Kay 1979], «когнитивная грамматика» [Lakoff, Thompson 1975], «лексическая функциональная грамматика» [J.Bresnan ed. 1982] и др.

Обработка естественного языка (ОЕЯ)

Область построения систем, обрабатывающих (или «перерабатыващих») естественный язык, точнее было бы назвать переработкой речи (текстов) на естественных языках. Эта область, в том виде, какой она приобрела в последние годы, занята построением и проверкой концепций (и технических их воплощений) общения с ЭВМ на естественном языке. В частности, сюда относится задача построения таких программ для ЭВМ, которые позволяют организовать диалог с ЭВМ. В отличие от задачи «распознавания устной речи», где решается проблема акустического распознавания сигналов, ОЕЯ занимается операциями более абстрактного, более символического порядка: операциями над значениями и логическим выводом, необходимыми для распознавания речи.

Объектом ОЕЯ обычно считается текст. В системе же, претендующей на перспективность, ставится задача не просто распознать этот текст, а выяснить те обычно скрытые движущие силы, которые его сформировали. Напомним, что текст в его становлении называют дискурсом.

Система обработки текста, по Фридману, решает две проблемы: 1) выясняет истоки информации, из которой «композиционным» путем может быть выведена конкретная семантическая информация для каждого отдельного предложения текста (т.е. выявляет семантику предложения исходя из структуры целого текста), и 2) устанавливает роль и функции этой информации высокого порядка в рамках целого дискурса.

Вообще говоря, система ОЕЯ должна: а) планировать высказывания, необходимые для достижения конкретных коммуникативных целей, что находится в зависимости от знаний, мнений и намерений пользователей такой системы, и б) распознавать в высказываниях пользователя те планы, которые могут быть сообщены в результате нескольких высказываний или которые, по замыслу пользователя, могут быть логически выведены из презумпций общающихся сторон (человека и ЭВМ). Один из возможных путей достижения этого – следующий цикл:

1. Рассмотреть текущее высказывание (предложение).

2. Основываясь на наклонении этого предложения (повествовательное, вопросительное, повелительное), приписать эффект высказывания намерению пользователя.

3. Используя алгоритмы распознавания, а также базу общих презумпций, вывести, если это возможно, каким образом наблюдаемые действия укладываются в план достижения цели, которую, как ожидается, преследует пользователь. Если этот план не может быть однозначно выявлен, выработать цель системы, направленную на вскрытие цели пользователя.

4. Выработать задачи системы для тех целей, которые пользователь намеревался активизировать в системе.

5. Используя частные (т.е. не общие) презумпции, определить препятствия, которые могут помешать осуществлению планов пользователя, а также пункты, в которых пользователю потребуется помощь.

6. Принять отрицания для некоторых из препятствий в качестве целей системы.

7. Пользуясь частными презумпциями, построить план достижений целей системы, особенно целей для преодоления препятствий для пользователя. В зависимости от этих целей план может включать в себя такие коммуникативные действия, как вопросы, проясняющие намерения пользователя.