Дискретизация и квантование изображений (стр. 9 из 16)

После того как установлено, что основной принцип сжатия в пространстве преобразований заключается в избирательном сохранении коэффициентов разложения, задача создания системы сжатия изображений может показаться нетрудной. Сложность построения подобных схем кодирования обусловлена необходимостью сравнения свойств операторов различных преобразований и создания методов выбора коэффициентов преобразования, которые следует оставить. Кроме того, задача усложняется квантованием выбранных коэффициентов и кодированием квантованных чисел. Ниже приведены краткие результаты исследований, посвященных этим вопросам.

Был исследован ряд алгоритмов быстрого преобразования, таких, как преобразования Фурье, Адамара, Xaapa [32], слэнт - преобразование [33], косинусное преобразование [34], преобразование по дискретно - линейному базису [35]. Все алгоритмы сравнивались по эффективности сжатия с преобразованием Карунена - Лоэва (оптимальным). Для выявления оптимального алгоритма необходимо сравнивать все преобразования в одинаковых условиях - при одном и том же входном изображении и одинаковых параметрах схем выбора, квантования и кодирования коэффициентов. Этого не было сделано, но приводимые в литературе данные позволяют сделать следующие выводы.

1. Ни один из алгоритмов быстрого преобразования не обеспечивает оптимальной эффективности сжатия изображения, какая получается (при использовании преобразования Карунена - Лоэва.

2. По таким критериям качества, как средняя квадратическая ошибка, ближайшим к преобразованию Карунена - Лоэва, оказывается слэнт - преобразование, а за ним следуют по порядку преобразования Фурье, Адамара и Хаара, причем сравнение выполнялось для изображений небольшого формата, например 16

16 или 32

32 отсчета.

3. Разница между наилучшими показателями слэнт - преобразования и наихудшими показателями преобразования Xaapa (как по субъективным, так и по объективным критериям) невелика.

Коэффициенты преобразования, которые необходимо сохранить и передать, можно выбрать двумя способами. При пороговой дискретизации устанавливается некоторый уровень (определяемый, как правило, на основе полной средней квадратической ошибки), и коэффициенты, его превышающие, сохраняются для передачи, я все остальные отбрасываются. При зонной дискретизации в пространстве преобразований размещается маска (трафарет) и элементы, попавшие в нее, сохраняются, а остальные отбрасываются. Операции, выполняемые в ходе преобразования, обычно упорядочиваются в соответствии с некоторым обобщенным индексом (частотой или порядком базисной функции), и коэффициенты преобразования выстраиваются в ряд в порядке увеличения сложности (т.е. числа колебаний на единицу длины) базисных векторов, причем энергия изображения концентрируется в области низких частот или малых порядков. Следовательно, зонная дискретизация эквивалентна обобщенной низкочастотной фильтрации изображения. Пороговая дискретизация, напротив, позволяет выделить значительные коэффициенты преобразования, расположенные где-либо в пространстве преобразований. В результате оказалось, что пороговая дискретизация при одинаковом числе отброшенных коэффициентов дает более высокое качество восстановленного изображения, чем зонная дискретизация. К сожалению, в схемах с пороговой дискретизацией вместе с каждым отсчетом необходимо передавать и его местоположение в пространстве преобразований. По этой причине объем передаваемой информации может заметно возрасти, если положения отсчетов передаются простыми кодами. Однако коды с переменной длиной дают возможность передать адрес при небольшом увеличении числа разрядов кода [32].

Отсчеты, выбранные из пространства преобразований, необходимо квантовать. К сожалению, обычно они имеют гораздо больший динамический диапазон, чем исходные отсчеты в пространстве преобразований, что подтверждает, например, опыт работы с преобразованием Фурье. Такое явление наводит на мысль об использовании чисел с переменной разрядностью, зависящей от значения коэффициента, но это значительно усложняет процесс обработки. Кроме того, для создания устройства квантования, дающего минимальный шум квантования, необходимо знать плотность вероятности значений отсчетов. Исследования плотности вероятности отсчетов в пространстве преобразований [32, 33] показали, что наилучший компромисс между простотой и точностью обеспечивает квантование, основанное на гауссовской плотности, при фиксированной разрядности отсчетов. В этом случае удается получить высококачественные восстановленные изображения, если число уровней квантования составляет всего 64 (6 разрядов) [32]. По-видимому, это связано с тем, что операторы преобразований линейны и дают взвешенные суммы, а сумма произвольных случайных величин распределена по закону, близкому к гауссовскому.

Способ кодирования коэффициентов разложении зависит от примененного алгоритма выборка коэффициентов. Как уже отмечалось, при пороговой дискретизации необходимо, чтобы код содержал адрес отсчета в пространстве преобразования, причем на каждый отсчет отводится фиксированное число разрядов кодовой комбинации. При зонной дискретизации используется низкочастотный характер изображения, т.е. тот факт, что коэффициенты разложения, соответствующие низким частотам (или малым порядкам базисных векторов), имеют большую величину, чем высокочастотные коэффициенты. Этим можно воспользоваться, уменьшая число разрядов кода, отводимых на отсчет, по мере перехода от низких частот к высоким [33]. Информацию о положении отсчетов передавать не нужно, поскольку форма зоны известна, а порядок выбора и передачи отсчетов .внутри зоны может быть зафиксирован.

В целом сокращение избыточности путем обработки в пространстве преобразований (т.е. преобразование, выбор коэффициентов, их квантование и кодирование) позволяет получить хорошие результаты. На рис. 4.10 сравниваются несколько разных преобразований. Изображения на рис. 4.9 и 4.10 состоят из 256

256 точек, представленных 8-разрядными числами. Нетрудно видеть, что сжатие путем обработки в пространстве преобразований дает лучшие результаты, чем сжатие методом ДИКМ.

4.3.4. Другие аспекты задачи сокращения избыточности

видеоинформации

Поскольку часто изображения состоят из многих последовательно появляющихся кадров (как, например, в телевидении) и изображение от кадра к кадру меняется мало, то в будущем, по видимому, больше внимания будет уделяться межкадровому сжатию (в отличие от внутрикадрового). Как отмечалось ранее, схемы межкадрового сжатия методом ДИКМ уже изучались. Оказалось, что комбинация внутрикадрового и межкадрового кодирования (в тех случаях, где это возможно сделать) может привести к уменьшению объема передаваемой информации в 30—50 раз.

Интерес к цветным изображениям возрастает; уже проводились опыты по сокращению их избыточности методом ДИКМ и методом преобразования [33, 36]. Методы сжатия аналогичны рассмотренным выше, но их реализация усложняется из-за наличия трех цветовых сигналов.

В последнее время созданы гибридные системы сжатия. В них для сжатия по одной координате (обычно по строкам дискретизованного изображения, или по горизонтали) используется схема с преобразованием, а по другой координате (по столбцам, или по вертикали) - схема с ДИКМ. В результате получается более простая система ( bней не требуются двумерные преобразования), но дающая такую же или лучшую эффективность кодирования, чем системы с ДИКМ или с преобразованием [20].

Отметим, наконец, что все рассмотренные выше схемы не являются адаптивными, т.е. в них не изменяются в зависимости от свойств изображения распределение кодовых разрядов, расположение уровней квантования и т.д. Тешер [37] показал, что за счет адаптивности можно дополнительно повысить эффективность кодирования изображений. При одинаковом качестве восстановленного непрерывного изображения ему удалось сократить объем передаваемой информации почти вдвое по сравнению с другими системами.

4.4. Повышение резкости изображений

Задача любой системы, формирующей изображение, состоит в создании резкого, чистого изображения, свободного от искажений. Это не всегда возможно сделать. Во-первых, каждая реальная система формирования изображений обладает определенными ограниченными возможностями; импульсный отклик реальной системы имеет конечную ширину, что приводит к неизбежному снижению разрешающей способности. Если на изображении необходимо выделять важные детали, размер которых близок к ширине импульсного отклика, то необходимо бороться с потерями разрешения. Так, например, с межпланетных космических аппаратов приходят снимки замечательного качества (особенно, если учесть, откуда они получены), но ученые, изучающие планеты, всегда пытаются увидеть на них элементы поверхности планеты, искаженные в силу ограниченного разрешения фотокамер. Во-вторых, изображения могут быть испорчены из-за неудачного стечения обстоятельств. Можно принять все меры предосторожности, чтобы получить высококачественные снимки, но какая-то часть их окажется испорченной либо за счет движения объекта или камеры, либо из-за плохой фокусировки и т.д. Среди плохих снимков всегда находятся столь важные или настолько редкие, что стоит пытаться их исправить. Устранение искажений относится к задачам повышения резкости (или восстановления ) изображений.