Смекни!
smekni.com

Створення синтезатора мови (стр. 1 из 2)

ЗМІСТ

ВСТУП

1. МЕТОДИ СИНТЕЗУ МОВИ

1.1 Повний синтез мови за правилами

1.2 Синтез фонемами

2. АНАЛІЗ ЗАВДАННЯ

2.1 Якість звуку

2.2 Підбір фонем

3. СИНТЕЗУВАННЯ МОВИ

3.1 Обробка тексту

3.2 Генерація проміжків між фонемами

3.3 Згладжування звуку

3.4 Обробка вихідного звуку

3.5 Аналіз результатів синтезування

4. ІНСТРУКЦІЯ КОРИСТУВАЧА

4.1 Опис головного вікна програми

4.2 Відтворення мови

4.3 Модифікація мови

4.4 Збереження мови

СИСТЕМНІ ВИМОГИ

ВИСНОВОК

СПИСОК ЛІТЕРАТУРИ


ВСТУП

У теперішній час в багатьох сферах застосовуються синтезатори мови, зокрема й російської теж. Найчастіше такі синтезатори обмежуються набором певних слів, враз чи пропозиції. Але іноді потрібно синтезувати мову по довільному, заздалегідь не відомому тексту. Останніх налічується не так вже й багато і голоси, якими вони говорять дуже сильно обмежені за різноманітністю. Створення такого синтезатора досить складне завдання, притому складність особливо не залежить від мови, на якому повинна говорити програма. Найпростішим із способів синтезі мови по довільному текстом - є синтез з фонем. У ході виконання роботи буде використаний саме цей метод. На жаль він не дає високої якості мови, але менш витративши за часом реалізації, ніж інші. Так само він видає мову, яка задовольняє вимогам чіткості.


1. МЕТОДИ СИНТЕЗУ МОВИ

1.1 Повний синтез мови за правилами

Повний синтез мови за правилами (або синтез по друкарському тексту) забезпечує управління всіма параметрами мовного сигналу і, таким чином, може генерувати мову по заздалегідь невідомому тексту. В цьому випадку параметри, отримані при аналізі мовного сигналу, зберігаються в пам'яті так само, як і правила з'єднання звуків в слова і фрази. Синтез реалізується шляхом моделювання мовного тракту, застосування аналогової або цифрової техніки. Причому в процесі синтезування значення параметрів і правила з'єднання фонем вводять послідовно через певний часовий інтервал, наприклад 5-10 мс. Метод синтезу мови по друкарському тексту (синтез по правилах) базується на запрограмованому знанні акустичних і лінгвістичних обмежень і не використовує безпосередньо елементів людської мови. У системах, заснованих на цьому способі синтезу, виділяється два підходи. Перший підхід направлений на побудову моделі мовотворчої системи людини, він відомий під назвою артикуляторного синтеза. Другий підхід — формантний синтез за правилами. Розбірливість і натуральність таких синтезаторів може бути доведена до величин, порівнянних з характеристиками природної мови.

1.2 Синтез фонемами

Синтез мови по правилах з використанням попередніх відрізань природної мови, що запам'ятали, — це різновид синтезу мови по правилах, яка набула поширення у зв'язку з появою можливостей маніпулювання мовним сигналом в оцифрованій формі. Залежно від розміру початкових елементів синтезу виділяються наступні види синтезу:

· мікросегментний (мікрохвильовий);

· аллофонічний;

· дифонний;

· напівскладовий;

· складовий;

синтез з одиниць довільного розміру.

Зазвичай як такі елементи використовуються напівсклади — сегменти, що містять половину згідного і половину що примикає до нього голосного. При цьому можна синтезувати мову по заздалегідь не заданому тексту, але важко управляти інтонаційними характеристиками. Якість такого синтезу не відповідає якості природної мови, оскільки на границях зшивання дифонів часто виникають спотворення. Компіляція мови із заздалегідь записаних словоформ також не вирішує проблеми високоякісного синтезу довільних повідомлень, оскільки акустичні і просодичні (тривалість і інтонація) характеристики слів змінюються залежно від типу фрази і місця слова у фразі. Це положення не міняється навіть при використанні великих об'ємів пам'яті для зберігання словоформ.


2. АНАЛІЗ ЗАВДАННЯ

2.1 Якість звуку

Так як використовуваний метод не дає високої якості мови, то й сенсу використовувати високоякісний звук сенсу немає. Тому для запису фонем буде використано нижче якість звуку. Амплітуда - 8біт, а частота 8кГц. Це якість звуку для телефонної розмови.

2.2 Підбір фонем

Для російської мови виділяють наступні фонеми а э и о у ы п п' б б' м м' ф ф' в в' т т' д д' н н' с с' з з' р р' л л' ш ж щ җ ц ч й к к' г г' х х'. Але виділені фонеми є деякою абстракцією і не можуть в даному виді застосуються для синтезу мови.

У ході експериментів було встановлено, що звучання відрізків слів, де після голосної стоїть приголосна, досить задовільно. Однак при зворотному порядку всі інакше - одна приголосна може звучати як інша, а може бути взагалі не чутно. У деяких випадках допомагає метод з'єднання звуків, де між стиками вставляється згенерований звук, що враховує закінчення попереднього і початку наступного. Про цьому методі буде докладно розказано в пункті 3.2. Для інших сполучень такий підхід не дав бажаного результату і було ухвалено рішення записати всі можливі поєднання. У результаті ми отримали фонеми зазначені в таблиці 1. Фонеми закінчуються на знак "!" Знаходяться в кінці слів і є більш дзвінкими, ніж їх звичайні аналоги (без закінчень). Знак "_" в кінці назви фонеми означає, що вона м'якша, ніж аналог без закінчення і йде переважно перед голосними.


Таблиця 1 – Фонеми

А - - - - - - - - - - -
Е - - - - - - - - - - -
Ё - - - - - - - - - - -
И - - - - - - - - - - -
О - - - - - - - - - - -
У - - - - - - - - - - -
Ы - - - - - - - - - - -
Э - - - - - - - - - - -
Ю - - - - - - - - - - -
Я - - - - - - - - - - -
Б - ба бе бё би бо бу бы бэ бю бя
В - ва ве вё ви во ву вы вэ вю вя
Г Г! - - - - - - - - - -
Д Д! - - - - - - - - - -
Ж - - - - - - - - - - -
З З_ - - - - - - - - - -
Й - - - - - - - - - - -
К К_ - - - - - - - - - -
Л Л_ ла ле лё ли ло лу лы лэ лю ля
М - ма ме мё ми мо му мы мэ мю мя
Н - - - - - - - - - - -
П П_ - - - - - - - - - -
Р Р_ - - - - - - - - - -
С С_ - - - - - су - - - -
Т Т_ - - - - - - - - - -
Ф Ф_ фа фе фё фи фо фу фы фэ фю Фя
Х Х_ - - - - - - - - - -
Ц - - - - - - - - - - -
Ч - - - - - - - - - - -
Ш - - - - - - - - - - -

3. СИНТЕЗУВАННЯ МОВИ

3.1 Обробка тексту

Перш ніж приступити до синтезування мови, необхідно визначити які фонеми, де і в якому порядку повинні відтворюється. Для цього спочатку текст розбивається на окремі слова, а слова потім на фонеми. Коли ми маємо список фонем, між фонемами приголосна-голосна вставляється згенерованих послідовність. Метод генерації описаний в пункті 3.2. Потім все слово згладжується, для придушення клацань, які виникають при різких перепадах значення сигналу. Метод згладжування описаний в пункті 3.3. Повна схема алгоритму наведена у додатку А.

3.2 Генерація проміжків між фонемами

Для генерації послідовності береться остання частина лівої фонеми довго рівний періоду повторення схожих ділянок у звуці. А так само початок правою за тим же принципом. Потім генеруються п'ять ділянок, які плавно перетікають з лівої фонеми в праву. Тобто перший ділянка дуже схожий на ліву фонему, третій щось середнє між лівою і правою, а п'ятий дуже схожий на праву. Фактично фонеми частково накладаються один на одного. На малюнках 3.1, 3.2, 3.3 відображує графічне представлення цих звуків. Як видно з малюнка 3.3, згенерованих частина сильно виділяється різкими переходами, що призводить до клацанням під час відтворення звуку.