Смекни!
smekni.com

К проблеме разработки психолингвистической модели синхронного перевода (стр. 1 из 2)

Н.В. Андреева

Рассматриваются современные психолингвистические подходы к описанию когнитивных процессов обработки лингвистической информации на уровне восприятия и порождения речи. Подчеркивается необходимость проведения более глубоких исследований проблемы в связи с тем, что данные процессы являются основными для синхронного перевода и их дальнейшее изучение будет способствовать разработке технологий подготовки переводчиков-синхронистов.

Одной из основных задач психолингвистики является описание способности переводчика синхронно переводить звучащую речь с одного языка в соответствующую форму на другом языке. Эта когнитивная способность является одним из наиболее сложных видов обработки лингвистической информации (language processing). Однако в самой психолингвистике процессу синхронного перевода не уделяется должного внимания, что, вероятно, связано со сложностями проведения эмпирических исследований указанного процесса. Данная проблема представляется актуальной в связи с необходимостью оптимизации процесса подготовки лингвистов-переводчиков и, в частности, синхронных переводчиков.

Процесс синхронного перевода включает в себя два параллельных процесса: восприятие речи на языке оригинала и ее порождение на целевом языке. Рассмотрим основные характеристики этих двух процессов с точки зрения психолингвистики. Прежде чем перейти к описанию восприятия речи в процессе синхронного перевода, необходимо отметить, что в настоящее время учеными еще не выработано целостной модели, где характеризовались бы все этапы — от сенсорного восприятия поступающего сигнала до этапа порождения дискурса на языке перевода. В психолингвистической литературе мы находим детальное описание отдельных компонентов восприятия звучащей на языке оригинала речи. Итак, процесс восприятия речи состоит из следующих основных стадий:

1) сегментация и классификация поступающего сенсорного стимула;

2) обработка на уровне лексикона, включающая в себя распознавание отдельных лексических единиц и обработку информации, непосредственно связанной с ними;

3) пропозициональная (сентенциальная) обработка, или извлечение и сочетание синтаксической информации по отдельным словам и их порядку, для создания синтаксической репрезентации, а также интеграция этой репрезентации со смысловой информацией и картиной мира с целью интерпретации смысла на уровне предложения;

4) обработка поступающей информации на уровне дискурса, т. е. интеграция интерпретаций нескольких последовательных предложений для создания репрезентации дискурса.

Остановимся более подробно на характеристике каждой из указанных выше стадий. На начальной стадии сенсорная информация классифицируется (происходит процесс декомпозиции) для создания ряда последовательных, более абстрактных (слуховых, фонетических, фонологических) репрезентаций [12]. Несмотря на то что речевой сигнал, достигающий слуха воспринимающего, непрерывный и переменный, он воспринимается как состоящий из дискретных и отдельных единиц. На стадии обработки лексикона вновь создаваемая репрезентация соотносится с ментальным лексиконом слушающего. Происходит наложение вновь поступающих лексических репрезентаций на уже существующие с тем, что бы выбрать наиболее соответствующие друг другу. Этот процесс отбора включает в себя активацию целого ряда лексических соответствий, и лишь затем отбор самого слова [9]. Только после того, как определен соответствующий лексический компонент, появляется релевантная семантическая и синтаксическая информация, соотносимая с данным словом.

Процесс восприятия звучащей речи на уровне предложения может быть, в свою очередь, разбит на несколько стадий: извлечение синтаксической структуры и создание семантических репрезентаций предложения; интерпретация этих репрезентаций в свете предшествующего лингвистического контекста; сохранение релевантной информации в долговременной памяти. Синтаксический анализ [4] представляет собой создание внутренней репрезентации предложения на основе информации, которую несут синтаксические и морфосинтаксические ассоциации каждого слова, особенно функциональных слов и их порядка. Поскольку предложения очень часто имеют смысл только в определенных лингвистических контекстах, знание фоновой (прагматической) информации, стоящей за речевым актом, используется для инферирования смысла предложения. Последним шагом в выявлении коммуникативного намерения говорящего является обработка информации, поступающей на уровне дискурса. Предполагается, что слушающий использует целый ряд стратегий для распознавания поступающего дискурса. Результатом применения этих стратегий является репрезентация дискурса в памяти в иерархической форме. В процессе восприятия дискурса слушающий постоянно находится в процессе инференции для усиления когерентности и полноты высказывания [13].

Важной задачей в характеристике восприятия речи является описание процесса обработки единиц восприятия на каждом лингвистическом уровне анализа. Значительное количество исследований посвящено данной проблеме на уровне декомпозиции поступающего сенсорного стимула и синтаксического анализа [3]. Кратко рассмотрим последний уровень, так как он иллюстрирует многие аспекты, связанные с единицами восприятия. Вопрос объема единиц обработки информации, поступающей на уровне синтаксиса, обсуждается психолингвистами уже много лет. Здесь можно выделить две противоположные точки зрения. Согласно первой анализ синтаксической структуры предложения начинается непосредственно в момент распознавания первого слова высказывания. По другой точке зрения процесс обработки на уровне синтаксиса представляет собой продолжительные дискретности (скачки), когда лексическая информация, ассоциируемая с каждым поступающим словом, пассивно аккумулируется до тех пор, пока не будет достигнута определенная синтаксически релевантная точка в предложении. Только после этого начинается синтаксический анализ. Согласно данной позиции существуют клаузальные единицы обработки информации, и эта точка зрения берет свое начало в генеративной грамматике, в соответствии с положениям которой предполагаемые трансформации могут касаться только более крупных отрезков лексического материала.

Проблема обработки синтаксической информации усложняется тем, что предложения по своей структуре могут быть крайне неопределенны, и, следовательно, для любой короткой цепочки слов существуют несколько структурных альтернативных описаний (например, “flying planes can be dangerous”). В данном случае слушающий (синхронный переводчик), пойдя по пути непосредственного оформления последовательно воспринимаемых лексических единиц в синтаксические структуры, может в результате провести ошибочный структурный анализ, который потребует исправления на более поздней стадии. Такой повторный анализ в ситуации синхронного перевода чрезвычайно проблематичен. С другой стороны, если слушающий задерживает процесс синтаксической обработки информации на длительный период времени, он может избежать некорректных структур, однако при этом может возникнуть проблема нехватки возможностей памяти для удержания всей неструктурированной информации. Доминирующей точкой зрения по данному вопросу является та, согласно которой анализ лексически-кодированной семантической и синтаксической информации начинается непосредственно в момент распознавания первых слов сообщения — в силу, прежде всего, ограниченности ресурсов обработки информации.

Вопросы, касающиеся природы (дискретной или каскадной) единицы, возникающей в результате обработки поступающей лингвистической информации, также стали предметом внимания психолингвистов, особенно на стадии обработки лексикона. На уровне распознавания слова можно выделить две противоположные точки зрения. Сторонники дискретного подхода считают, что слушающий сначала идентифицирует и локализует (активирует) соответствующую лексическую единицу на основе ее формальных характеристик, и только после этого ему становится доступной семантическая и синтаксическая информация, соотносимая с конкретной лексической единицей [10]. Согласно альтернативной точке зрения, которая подтверждается некоторыми эмпирическими данными, лемматическая информация, соответствующая более чем одной потенциальной лексической единице, появляется еще до того, как происходит идентификация слова и передается на пропозициональный уровень обработки для соответствующей оценки [11].

Рассмотрим далее результаты некоторых исследований процесса речепорождения, релевантные для синхронного перевода. Как указывают разработчики современных моделей порождения речи [2; 6], «перевод мысли в речь» сопровождается несколькими промежуточными уровнями обработки информации. В большинстве моделей порождения речи выделяются, по крайней мере, следующие основные уровни:

1) стадия подготовки так называемого довербального (preverbal) сообщения, которое становится основой для непосредственных процессов когнитивно-лингвистической формулировки; это довербальное сообщение может рассматриваться как нелингвистическая репрезентация, состоящая из концептов и их соответствующих ролей (агент, тема, реципиент);

2) процессы грамматического кодирования, которые определяют синтаксическую структуру будущего высказывания;

3) фонологическое кодирование, или создание фонологической формы высказывания;

4) произнесение высказывания.

Параллельно с грамматическим и фонологическим кодированием происходит процесс извлечения лексических единиц из ментального лексикона. Этот процесс состоит, в свою очередь, из двух компонентов — выбор леммы и извлечение конкретной словоформы. Леммы выступают в качестве строительного материала для грамматического кодирования высказывания. В процессе извлечения словоформы говорящий определяет ее фонологические сегменты и метрическую рамку. Метрические рамки комбинируются, образуя фонологические слова, а фонологические сегменты сочетаются с метрической рамкой фонологического слова [7]. На основе такого понимания фонологического кодирования можно сделать два вывода. Первый: фонологическая форма слова не извлекается говорящим как некая законченная единица, она выстраивается из более мелких единиц — фонем. Так называемые оговорки служат подтверждением данного утверждения (например, “heft lemisphere” вместо “left hemisphere”). Второй вывод состоит в том, что слогоделение происходит на более позднем этапе. Иными словами, силлабическая структура слов не извлекается непосредственно из ментального лексикона. Она определяется тогда, когда извлеченные фонологические сегменты связываются с метрической рамкой фонологического слова [7].