Смекни!
smekni.com

Лінгвістична база даних українських художніх порівнянь (стр. 1 из 2)

УДК: 811.161.2'374.7:004

Маковецька-Гудзь Ю.А.

Аспірант Інституту філології КНУ імені Тараса Шевченка

Лінгвістична база даних українських художніх порівнянь

Інститут філології Київського національного університету імені Тараса Шевченка

Стаття присвячена проблемі конструювання лінгвістичної бази даних художніх порівнянь. Визначено мету створення лінгвістичної бази даних – укладання електронного словника художніх порівнянь українського поетичного мовлення другої половини ХХ століття. Описано методику створення бази даних та етапи її проектування. Розглянуто проблеми, пов’язані з параметризацією бази даних. Визначено типи лінгвістичних моделей порівнянь: граматичні та лексико-семантичні. Описується методика визначення та опису моделей порівнянь.

Ключові слова: лінгвістична база даних, художнє порівняння, суб'єкт порівняння, об’єкт порівняння, електронний словник, модель.

Makovetska-GudzYu.A.

The linguistic database of Ukrainian similes

The article concerns the problem of forming the linguistic database of similes. Besides, it is defined the main aim of creating the linguistic database to be the base of electronic dictionary of similes of Ukrainian poetical language of the second part of XX century. The author described the methodology projecting the linguistic database and described stages of creating the database. The author pointed on the problems, which connected with parameterization the database. It is defined the types of linguistic patterns, such as grammatical and lexical-semantic. The author outlined the technique of creating and analyzing of patterns of the similes.

Key words: linguistic database, simile, subject, object, electronic dictionary, pattern.


Комп’ютерні технології представлення лінгвістичних даних дозволяють по-новому розглянути взаємозв’язки лінгвістичних одиниць, виявити раніше невідомі закономірності. Використання формалізованих, певним чином упорядкованих лінгвістичних одиниць може дати поштовх до нових типологічних, компаративних та інших досліджень, про що свідчать сучасні лінгвістичні дослідження, в яких все частіше використовуються великі масиви даних – корпуси текстів, бази даних з різних розділів лінгвістики та ін.

Ефективним способом упорядкування мовних одиниць є лінгвістичні бази даних (ЛБД). Вони використовуються для забезпечення функціонування різних автоматизованих систем, що пов’язані з обробкою тексту (машинний переклад) та мовлення (інформаційні, навчальні системи аналізу людського мовлення). ЛБД забезпечують автоматизацію лексикографічної діяльності масового та спеціального призначення, тобто підготовку словників різних типів (навчальних, перекладних, тлумачних та ін.) [3]. Стратегія створення надійних ЛБД спрямована на їхнє багаторазове різноаспектне використання, тобто обробку мовних об’єктів, які подані в таких базах даних, за різними параметрами та типами інформації.

У зв’язку з тим, що на сьогодні найефективнішим способом укладання різноманітних електронних словників є використання баз даних, було створено ЛБД художніх порівнянь з метою подальшого укладання Електронного словника художніх порівнянь. Такий об’єкт дослідження було обрано невипадково, адже у зв’язку з великим інтересом до вивчення тропів виникає необхідність у створенні словника, що дозволяв би користувачеві у найбільш зручний спосіб отримати потрібну інформацію про мовну одиницю.

Мета статті – поетапний розгляд конструювання ЛБД художніх порівнянь та способів заповнення її структур лінгвістичними даними. Для вирішення поставленої мети потрібно було: а) проаналізувати загальні технології створення ЛБД; б) визначити технології для оптимальної організації баз даних для дослідження художніх порівнянь; в) визначити параметри для аналізу художніх порівнянь.

ЛБД художніх порівнянь була створена на основі українських поетичних текстів письменників другої половини ХХ століття. Матеріалом для неї послужив "Частотний словник сучасної української поетичної мови", представлений в мережі Інтернет лабораторією комп’ютерної лінгвістики Київського національного університету імені Тараса Шевченка на порталі www.mova.info. З нього було взято основний масив порівнянь, а потім додатково опрацьовувалися тексти, за допомогою яких було уточнено ширший контекст для порівняння. Для опрацювання було обрано порівняння з поезій Юрія Андруховича, Світлани Йовенко, Миколи Вінграновського, Івана Драча, Оксани Забужко, Ліни Костенко, Бориса Олійника, Івана Малковича, Дмитра Павличка та Василя Стуса (загалом 10 поетів). З поезій цих авторів відібрано близько двох тисяч художніх порівнянь.

При параметризації порівнянь виникали проблеми різного характеру. По-перше, для опрацювання відбиралися тільки ті порівняння, у яких порівнюються предмети, події чи явища. Морфологічно складники порівняння представлені такими частинами мови: іменники, займенники, особова форма дієслова та субстантивовані прикметники. Другою проблемою була недостатність контексту, яка вирішилася після додаткового опрацювання першоджерел. По-третє, до аналізу було залучено лише художні порівняння. Художнє порівняння словесний вираз, у якому зіставлення предметів відбувається на основі однієї, найвиразнішої з точки зору автора, ознаки, а всі інші не беруться до уваги [5, 359-360]. Це індивідуально-авторське порівняння, що вживається у художньому творі.

ЛБД художніх порівнянь передбачає такі етапи конструювання:

1) Визначення мети створення БД [2]. Як було зазначено, ЛБД створювалася для укладання електронного словника художніх порівнянь. База даних, як об’єкт створений у середовищі Microsoft Access, є найкращою основою для програмування програми словника.

2) Визначення структури БД у вигляді базової та додаткових таблиць. Для лінгвістичного аналізу порівнянь потрібна базова таблиця, яка б містила усю необхідну та достатню інформацію про кожен троп. Тобто у ній повинні бути такі дані: порівняння, його складники та їхні характеристики. Окрім цього, зважаючи на специфіку матеріалу, вважаємо, що необхідними допоміжними таблицями повинні бути: "частина мови", "моделі" та "концепти синоптичної схеми".

3)

Визначення необхідних полів у базовій таблиці. Оскільки для аналізу порівнянь важливими є характеристики їх складників – суб’єкта та об’єкта необхідно ввести такі поля: частина мови суб’єкта та об’єкта; когнітивна ознака, на основі якої порівнюються предмети; тезаурусний характер суб’єкта та об’єкта, який встановлюється через зв'язок лексико-семантичних варіантів (ЛСВ), що їх виражають, з концептами синоптичної схеми; структура та модель порівняння. Крім того, базова таблиця повинна містити поле з порівнянням та поле із зазначенням автора порівняння (див. мал.1).

Мал. 1. ЛДБ художніх порівнянь

4) Визначення індивідуального значення для кожного поля таблиці. Значення поля таблиці може бути текстовим, логічним, числовим, поле МЕМО (пам'яті), гіперпосилання та інші. Оскільки ми працюємо з текстовою інформацією, то значення майже всіх полів визначається як текстове. Для поля з порівнянням у контексті технологічно необхідним є логічне значення, тому що використання такого значення дозволяє в одне поле додавати розгорнені порівняння у контексті. Поля, в яких вказується інформація про приналежність ЛСВ до концептів синоптичної схеми є числовими, оскільки вони пов'язуються із додатковою таблицею. Такий тип подавання інформації є простішим для створення програми електронного словника.

5) Додавання даних та створення інших об'єктів для оперування в БД. Додавання даних робиться вручну. Для простоти користування створюються додаткові об’єкти у вигляді таблиць (див. п.2) та форми Microsoft Access. Формаєосновним засобом організації інтерфейсу користувача в додатках Microsoft Access. Вона полегшує виведення та редагування даних, а також спрощує роботу з об’єктами БД.

6) Визначення зв'язків між таблицями та об'єктами БД. Перш за все базова таблиця зв’язується з формою для зручності користування. Також необхідним є зв'язок базової таблиці з додатковими: концепти синоптичної схеми та частина мови, з яких безпосередньо береться необхідна інформація.

7) Використання засобів аналізу у Microsoft Access. Засоби аналізу Microsoft Access дозволяють швидко відсортувати необхідний матеріал за встановленими критеріями та отримати кількісні дані.

Робота з базою даних передбачала заповнення її структурних частин відповідною лінгвістичною інформацією. Основна робота була пов’язана з встановленням різних типів моделей порівнянь.

Моделюванням порівнянь займалися А. Вежбицька, С.В. Ткачов, Л. М'яснянкіна та ін.. Так, польська дослідниця Анна Вежбицька [1, с.144] подає кілька можливих моделей: А (таке саме), як В; А схоже на В; А нагадує В; А має форму В та ін. Виходячи з цих моделей, можна говорити про те, що підстановка замість А чи В будь-якого ЛСВ, утворює порівняння. Виникають запитання: чи буде таке порівняння семантично коректним (правильним) і чи буде воно художнім. Проблема семантичної коректності порівняння вирішується на основі лексико-семантичних моделей порівнянь, а проблема з художністю порівняння – на основі його зв’язку з контекстом.

Моделюванням порівнянь в аспекті граматичної формалізації займався С.В. Ткачов. Він вважає, що моделі порівняння можуть бути будь-які, наприклад: «V+як+N («Жию, як статок»), Adj+як+N («Горки, як полин») або синтаксично ускладнені: Adj+як+Adj+N («Дробни, як маково заренко»), або синтаксично спрощені N+як+N («Хлів (чисті,) як апатика»)» [7, 7]. Ці моделі побудовані на основі логічних та народних порівнянь.

Розглянувши вищевказані приклади моделей порівнянь, можна говорити про два види моделей: морфологічну – за частиномовною приналежністю складників (С.В. Ткачов) та синтаксичну – за способами зв’язків у реченні, до якого входить порівняння: сполучникові чи безсполучникові.

Окрім цих двох, є ще третій тип моделей – лексико-семантичні. Наприклад, Л. М'яснянкіна на основі творчості М. Шолохова, за приналежністю компонентів порівняння до різних семантичних полів виокремлює такі семантичні моделі порівнянь: людина-людина, людина-тварина, людина-природа, людина-предмет, предмет-предмет, тварина-тварина, людина-вогонь, предмет-явище природи, предмет-тварина, тварина-людина, тварина-предмет [6]. Таким чином, маючи такі моделі, можна утворити нескінченну кількість порівнянь.