Моделі мультиграничної сегментації зображень (стр. 2 из 6)

Структура дисертації. Дисертація складається зі вступу, чотирьох розділів, висновків, списку використаних джерел та додатку. Повний обсяг дисертації становить 146сторінок; обсяг основного тексту 121 сторінка; 43 рисунка; 7 таблиць; список використаних джерел, що включає 139 найменувань та займає 15 сторінок; додаток на 5 сторінках.

основний зміст роботи

У вступі обґрунтовано актуальність теми, сформульовано мету та задачі дослідження, розкрито наукову та практичну цінність отриманих результатів. Наведено відомості про публікації та апробацію роботи.

У першому розділі проведено аналіз стану й тенденцій розвитку методів сегментації зображень, основною метою яких є виділення областей поля зору, що характеризує значущі об’єкти сцен, а у кінцевому результаті – перетворення растрової візуальної інформації в деяку семантичну конструкцію.

Встановлено, що підходи до сегментації можуть розглядатися з різних позицій – локальні й глобальні методи можуть класифікуватися як порогові просторові, спектральні, гістограмні, текстурні тощо. За математичними моделями, що використовуються, в залежності від виду й обсягу апріорної інформації алгоритми розділяються на детерміновані й статистичні, а в останній час активно розвиваються моделі, які враховують неадекватність і недостовірність інформації, яку отримують із зображення, її надмірність, і в той же час дефіцит, стосовно проблемно-орієнтованої області.

Показано, що сьогодні найбільш поширені: адаптовані алгоритми кластеризації; гістограмні методи; алгоритми на основі пошуку контурних препаратів; методи нарощування областей; алгоритми, які базуються на функціях рівня; методи побудови розбиття графів; різні модифікації перетворень водорозділів; методи, які базуються на моделях або навчаючих вибірках; алгоритми на основі штучних нейронних мереж та інтерактивні алгоритми розміток областей і, головне, всі їх існуючі комбінації. На основі аналізу переваг і недоліків зазначених методів і алгоритмів визначено, що, як і раніше, порогові (просте порогове обмеження, просторово-адаптивні пороги, інтервальні пороги, квазіпорогова обробка, мультиграничні алгоритми) методи можуть забезпечувати у низці прикладних задач потрібну якість сегментації. Методи порогової обробки, незважаючи на їхні недоліки, відіграють досить істотну роль у задачах сегментації зображень. Як першопричину потрібно вказати їхні інтуїтивно зрозумілі властивості та простоту обчислювальних моделей. Проте методи граничної обробки потребують свого розвитку в плані розробки моделей, які забезпечують у деякому розумінні універсальні підходи до аналізу просторів зображень або ознак.

Стосовно інтерактивної та автоматичної обробки візуальної інформації акцент переноситься на розв’язання задачі ліквідації семантичного конфлікту, тобто результати обробки зображень алгоритмів низького рівня, що орієнтовані на обробку зображень як двомірних полів, не завжди придатні для тематичної інтерпретації навіть у конкретних предметних областях. Для усунення цього недоліку необхідно вміти отримувати та трансформувати дані в прийнятну форму, зокрема находити компроміс між недостатньою та надмірною сегментацією. Таким чином, одним із напрямків, які мають теоретичний інтерес та практичну значущість, є моделювання півтонових та/або кольорових зображень на основі зв’язків покриттів (розбиттів) області значень та покриттів (розбиттів) носія.

На основі проведеного аналізу зроблено висновок щодо актуальності створення моделей сегментації на основі багаторівневого представлення зображень за допомогою бінарних відношень ліній рівня та вивчення операцій, які забезпечують адаптацію часткової мультиграничної сегментації до розв’язання задач синтаксичної, семантичної, якісної та кількісної інтерпретації зображень.

У другому розділі запропоновано нові мультиграничні моделі взаємозв’язку результатів сегментації з вихідним зображенням, в основу яких покладено систему відношень, що враховує подібність яскравісних характеристик (ознак). Властивості цих відношень забезпечують ефективну алгоритмізацію сегментації, що в кінцевому результаті надає достовірні дані для етапу інтелектуального аналізу зображень та дозволяє запропонувати нові методи, які враховують просторові властивості.

У полі зору відеодатчика (прямокутної фінітної області

) аналізуються цифрові форми подання зображень, тобто функція розподілу яскравості

набуває тільки повнозначних числових значення у вузлах сітки розміру

. Для спрощення запису (з урахуванням построкової розгортки) носій зображення представлений множиною

, де

. Тоді зображення

при довільному законі квантування з

рівнями визначається множиною

Розглянемо покриття

діапазону значень

, де

. Функція

і покриття

індукують на

бінарне відношення, яке є відношенням толерантності.

(1)

де

З іншого боку, відношення

реалізує багатозначні відображення з

, які продукують ліві та праві суміжні класи:

– клас образів елемента

;

– клас прообразів елемента

Система класів толерантності утворює покриття множини

. Довільне покриття

названо правильним, якщо й тільки якщо для будь-яких його двох елементів

виконуються відношення

Твердження 1. Класи толерантності утворюють правильне покриття множини

Довільне покриття

скінченної множини

названо впорядковано зв’язним, якщо існує індексація, при якій у будь-якому представнику покриття втримуються тільки занумеровані підряд (без пропусків) елементи, тобто

. Довільна трійка

різних елементів множини

із заданим на ній покриттям

названа транзитивним триплетом, якщо будь-яка пара точок лежить хоча б у одному елементі покриття.