Анализ и сжатие изображений с использованием математической 3d морфологии (стр. 1 из 2)

АНАЛИЗ И СЖАТИЕ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ МАТЕМАТИЧЕСКОЙ 3D МОРФОЛОГИИ

Штаба М.В., аспирант

Ростовский государственный строительный университет

e-mail: max@shtaba.ru

1. ВВЕДЕНИЕ

Проблема сжатия информации была, есть и всегда будет актуальной. При известных современных методах, чем больше эффективность сжатия – больше задержка. В каждом конкретном случае выбирается то или иное компромиссное решение. Известно, что для корректной передачи цвета требуется 16 миллионов оттенков (8 бит на каждую из трех цветовых компонент). Таким образом, для описания картинки на экране, содержащей 575 линий по 720 пикселей, требуется 1,240 Мбайта. Для передачи такой информации по B-каналу ISDN, если не используется сжатие, потребуется около 2,5 минут. Эта цифра помогает понять актуальность проблемы сжатия графической информации [1].

2. МАТЕМАТИЧЕСКАЯ 3-D МОРФОЛОГИЯ В ОБРАБОТКЕ И СЖАТИИ ИЗОБРАЖЕНИЙ

Одной из фундаментальных проблем анализа изображений является создание адекватного математического описания изображений, передающего их содержание, смысл. Иными словами, это описание должно отражать лишь существенные (с точки зрения решаемой задачи) особенности изображения, и не зависеть от несущественных деталей. Методы морфологического анализа являются, таким образом, шагом на пути решения проблемы описания семантики изображений [2].

В основе методов морфологического анализа лежит математическое понятие формы. Под формой изображения понимается максимальный инвариант преобразований изображения, которым оно подвергается при изменении условий наблюдения, изменении параметров регистрирующей аппаратуры и др. [3]

Поясним понятие формы изображения сначала на простом примере.

Все представленные на рис.1 изображения имеют одну и ту же форму (в обычном понимании) и отличаются лишь условиями регистрации. Формально каждое изображение можно задать как функцию:

определенную на поле зрения X и принимающую два значения: С₁ и С₂ на его подмножествах А₁– "единице" и А₂ – "фоне" соответственно,

– индикаторная функция:

причем множества А₁ и А₂ не пересекаются [4].

Рис. 1. Примеры изображений «единицы», сравнимых по форме

Отсюда следует, что каждое, отдельно взятое подмножество, может быть обработано независимо от остальных, при этом его цвет не имеет значения, имеет значение только форма – семантика изображения. Количество же этих слоев-подмножеств может быть довольно большим и нести в себе значительный объем информации.

Основой интеллектуального анализа изображений в данной работе является подход Харалика (Haralick) и Шапиро (Shapiro), интерпретирующий цветное изображение как поверхность в 3-х мерном пространстве. 2-мерное Эвклидово пространство ε²это естественная область для плоскостного описания формы множеством точек, а также третье измерение z – глубина цвета [5,6].

3. ПРАКТИЧЕСКИЕ АСПЕКТЫ ПРИМЕНЕНИЯ ПРЕДЛАГАЕМОЙ КОНЦЕПЦИИ И АЛГОРИТМА

Основное преимущество предлагаемого алгоритма и построение новой концепции в работе с изображениями заключается в особенности разбиения на различные информационные слои – подмножества, а также отсутствие жесткой привязки к палитре цветов. То есть изображение, состоящее из двух цветов, красного и синего, фактически будет рассмотрено, как монохромное. А каждое из подмножеств имеет свой смысл, что имеет огромное практическое значение.

Предлагаемый алгоритм не является универсальным и показывает хорошие результаты в узких сферах применения. Например, в картографии и разработке геоинформационных систем, с использованием данного алгоритма можно получить растровое изображение хорошего качества, при этом достаточно хорошо сжимаемое при хранении и передаче. В частности при использовании в геоинформационных системах крупных баз данных, особенно если они физически распределены по различным серверам и данные передаются через Интернет, то объемы информации имеют огромное значение. Основное же преимущество заключается в том, что предложенный алгоритм позволяет хранить закодированное цельное изображение местности, однако по запросу пользователя через канал связи возможно передать не громоздкие общие данные, или даже не просто фрагмент изображения, но также интересующие пользователя области и регионы, политические, физические и другие, которые отмечены определенным цветом, а значит выделены в особое подмножество и выполнить такой запрос не составит труда. Экономия времени на передаче данных очевидна, за счет исключения информации не нужной пользователю. Подобные же функции могут быть востребованы и в других сферах, таких как медицина, криминалистика и другие.

4. АЛГОРИТМ ОБРАБОТКИ И СЖАТИЯ ИЗОБРАЖЕНИЙ

Используя указанный подход можно сформулировать суть предлагаемого анализа, обработки и кодирования изображения, которая заключается в разложении его на цветовые слои – подмножества, путем выделения формы объектов, и кодировании каждого из этих слоев независимо друг от друга в бинарном режиме. Для адекватного анализа цвета в работе рассматриваются три цветовых компоненты: красный, зеленый и синий независимо друг от друга.

4.1. Обработка цветов и кодирование подмножеств

Алгоритм кодирования выполняется в два прохода:

1. Первый проход. Анализ изображения, обработка цветов.

a. Выделение цветов.

b. Интеллектуальное прореживание, устранение неразличимых оттенков.

c. Определение количества подмножеств – N.

2. Второй проход. Кодирование.

a. Представление двумерных множеств, как одномерные.

b. Определение принадлежности пикселя к соответствующему подмножеству.

c. Послойное кодирование подмножеств с учетом анализа очередного пикселя, для экономии объема.

d. Запись в файл блоков кода переменной длины.

На первой стадии производится анализ изображения. Выбираются имеющиеся на изображении цвета, при этом производится прореживание цветов по каждой из трех цветовых компонент для отсеивания неразличимых, неинформативных полутонов. После завершения этой стадии результирующее количество цветов является количеством подмножеств, подготавливаемых для кодирования.

Исходя из вышесказанного, мы получаем незакодированное изображение, описываемое как набор подмножеств, описывающих форму объектов:

где:

здесь

это не измененное множество, то есть это те цвета, которые мы видим на изображении, та же точно форма и эти множества друг от друга независимы.

На рис.2 отражены 4 представления набора пикселей(сверху вниз): привычное представление в цвете; срез поверхности точек в 3-D пространстве

(по функции top-surface) [5]; срез объемной фигуры, отражающей структуру изображения(функция Umbra) [5]; собственный способ представления

, повышающий эффективность кодирования. Измененные множества отмечаются как

и работать с ними можно также, как и с любыми другими множествами, но они зависят от других слоев, которые должны прорисовываться сверху, поскольку суть представления в том, что если одни цветовые слои включают в себя другие, то нет необходимости запоминать несущественные элементы в более низших слоях, которые в дальнейшем будут затерты более высшими. Таким образом, достигается дополнительное сжатие, отраженное в разнице между последними двумя представлениями. То есть отличие слоя

от слоя

в пропущенных, сэкономленных пикселях будет нивелировано слоем

, который впоследствии затрет несущественную разницу.

Рис.2. Разбиение изображения на цветовые слои, срез 3D поверхности

кодируется в последовательность значений – чередующееся количество прозрачных и заполненных пикселей, для каждого, уже измененного, подмножества

, которые теперь зависят от последующего слоя. Вследствие чего получаем новые значения

. Кроме того, выделяется цвет фона, который не кодируется, а является инверсией к сумме всех подмножеств. При этом коды сгруппированных пикселей могут быть достаточно громоздки, и они должны быть объединены с другой информацией об изображении: данные о цветах, ширине и высоте изображения и т.п.

С учетом вышеуказанных требований была предложена структура кодировки (Рис.3). Где Блоки «0:0, 0:1 и т.д.» – это количество чередующихся сгруппированных заполненных либо пустых пикселей, по принципу «есть цвет – нет цвета».