Смекни!
smekni.com

Видеоконференции в сети INTERNET (стр. 6 из 15)

3. Большая пространственная корреляция изображения в целом: предсказание первого низкочастотного коэффициента преобразования в блоке 8х8 (среднее значение всего блока).

4.Статистика появления синтаксических элементов в наиболее вероятном кодируемом потоке: оптимальное кодирование векторов движения, коэффициентов ДКП, типов макроблоков и пр.

5.Разряженная матрица квантованных коэффициентов ДКП: кодирование повторяющихся нулевых элементов с обозначением конца блока.

6.Пространственное маскирование: степень квантования макроблока.

7.Кодирование участков с учетом содержания сцены: степень квантования макроблока.

8.Адаптация к локальным характеристикам изображения: кодирование блоков, тип макроблока, адаптивное квантование.

9.Постоянный размер шага при адаптивном квантовании: новая степень квантования устанавливается только специальным типом макроблока и не передается по умолчанию.

10.Временная избыточность: прямые и обратные векторы движения на уровне макроблоков 16х16 точек.

11.Кодирование ошибки предсказаний макроблоков с учетом восприятия: адаптивное квантование и квантование коэффициентов преобразования.

12.Малая ошибка предсказания: для макроблока может быть сигнализировано отсутствие ошибки.

13.Тонкое кодирование ошибки предсказания на уровне макроблоков: каждый из блоков внутри макроблока может быть кодирован или пропущен.

14.Векторы движения - медленное движение фрагмента изображения со сложным рисунком: предсказание векторов движения.

15.Появления и исчезновения: прямое и обратное предсказание в B- фреймах.

16.Точность межкадрового предсказания: билинейно интерполированные (фильтрованные) разности блоков. В реальном мире движения объектов от кадра к кадру редко попадают на границы точек. Интерполяция позволяет выяснить настоящее положение объекта, зачастую увеличивая эффективность сжатия на 1 дБ.

17.Ограниченная активность движения в P- фреймах: пропущенные макроблоки. Когда вектор движения и ошибка предсказания нулевые. Пропущенные макроблоки очень желательны в кодированном потоке, поскольку не занимают битов, кроме как в заголовке следующего макроблока.

18.Компланарное движение в B- фреймах : пропущенные макроблоки. Когда вектор движения тот же, а ошибка предсказания нулевая.

Стандарт MPEG-2 [10] полностью перекрывает стандарт MPEG-1 и содержит новые, более строгие нормы, ориентированные на требования телевизионного вещания. Например, он поддерживает чересстрочную развертку, как в аналоговом телевидении. Широкое распространение стандарта MPEG-2 способно привести к цифровой революции в области видео, которую давно ожидают и которая будет сравнима с цифровой революцией в области аудио, свершившейся в последнее десятилетие.

Хорошие рыночные перспективы имеются у всех описанных выше стандартов: JPEG, H.261 и MPEG.

Так, формат JPEG лучше всего применять для неподвижных изображений, а также для видеомонтажа, если требуется высокая точность монтажа отдельных кадров. Стандарт MPEG годится для видеопродукции, потребитель которой ждет качества изображения, сравнимого с качеством изображения на бытовой аналоговой видеокассете: компьютерных обучающих материалов, игр, кинофильмов на CD, а также видео по требованию (video on demand). Для на сегодняшний день чаще всего используется стандарт H.261, так как для них не требуется видеоизображения очень высокого качества.

Стандарт Cell

Компания Sun Microsystems предложила свой стандарт компрессии видеоизображения -- Cell. Существуют два метода компрессии по этому стандарту: CellA и CellB. Метод CellA требует большей вычислительной мощности для компрессии/декомпрессии сигнала, чем метод CellB. Поэтому в системах видеоконференций, требующих работы видео в реальном времени, используется метод CellB. В этом методе изображение делится на 4х4 группы пикселов, называемых ячейками (cell). В основу алгоритма компрессии положен метод BTC (Block Truncation Coding). 16 пикселов в каждой ячейке преобразуются в 16-битовую маску цветности и две 8-битовых маски интенсивности, поэтому для кодировки 384 битов требуются всего 32 бита. Это означает степень сжатия 12:1. Преимущество метода Cell заключается в том, что в процессе декомпрессии можно использовать графические примитивы Windows-подобных систем. Такие примитивы выполняются аппаратно стандартными графическими акселераторами, что позволяет пользоваться аппаратной декомпрессией, используя стандартное оборудование, уже установленное в компьютере.

Стандарт NV

Подразделение PARC компании Xerox предложило метод компресии NV (Network Video). Метод используется чаще всего в системах телеконференций, работающих в Internet. На первом шаге алгоритма текущее изображение сравнивается с предыдущим и выделяются области, в которых произошли значимые изменения. Компрессии и последующей пересылке подвергаются только эти области. В зависимости от того, что является лимитирующим фактором -- полоса пропускания канала связи или вычислительная мощность оборудования, для компрессии используются либо преобразование Фурье, либо преобразование Гаара. После квантования преобразованного изображения достигается степень сжатия до 20:1.

Стандарт CU-SeeMe

В экспериментальной системе видеоконференций CU-SeeMe, разработанной в Корнуэлльском университете, входное изображение представляется 16 градациями серого цвета с 4 битами на пиксел. Изображение разбивается на блоки пикселов общим количеством 8х8. Кадр сравнивается с предыдущим, и пересылаются только блоки, в которых произошли значимые изменения. Компрессия этих блоков происходит по алгоритму сжатия без потерь, разработанному специально для системы CU-SeeMe. С учетом возможных потерь данных в канале связи периодически пересылаются и неизменившиеся блоки. Степень сжатия изображения составляет 1,7:1. Алгоритм компрессии изначально был разработан для аппаратно-программной платформы Macintosh. Он работает с восемью 4-битными пикселами как 32-битными словами. Для системы CU-SeeMe минимальная пропускная способность канала связи должна быть не ниже 80 Кбит/с.

Стандарт Indeo

Фирма Intel разработала метод компрессии/декомпрессии Indeo. В основе метода лежит расчет изображения текущего кадра по данным предыдущего. Передача кадра происходит только в том случае, если расчетные значения значимо отличаются от реальных. Компрессия осуществляется по методу 8х8 FST (Fast Slant Transform), в котором используются только алгебраические операции сложения и вычитания. Степень сжатия в методе Indeo составляет 1,7:1.

Стандарты компрессии/декомпрессии аудиосигнала

Методы ИКМ

Некоторые стандарты компрессии аудиосигнала основаны на технологии оцифровки звука, называемой импульсно-кодовой модуляцией или ИКМ [4](PCM, pulse code modulation). Аналоговый звуковой сигнал дискретизируется по времени и квантуется по амплитуде. Чем большее количество бит используется для квантования по амплитуде, тем более высококачественным будет воспроизведение звука. Если использовать логарифмический шаг квантования, то звук, квантованный 8 битами, будет соответствовать по качеству звуку, квантованному 14 битами с равномерным шагом. При этом степень сжатия сигнала составит 1,75:1. Известны два метода логарифмического квантования: A-law PCM и mu-law PCM. Mu-law PCM используется в США и Японии на цифровых линиях связи ISDN. В других странах на линиях ISDN используется метод A-law PCM. Оба метода вошли в рекомендацию стандарта G.711 ITU-TSS и требуют минимальной пропускной способности канала не ниже 64 Кбит/с.

В методе импульсно-кодовой модуляции при временной дискретизации аудиосигнала соседние по времени аудиоимпульсы кодируются независимо друг от друга. Но, как правило, амплитуду каждого импульса можно предсказать с большой долей вероятности, используя значение амплитуды предыдущего импульса. В методе адаптивной дифференциальной импульсно-кодовой модуляции ADPCM (Adaptive Differential Pulse Code Modulation) рассчитывается разница между амплитудой каждого импульса и его рассчитанным по предыдущему импульсу значением. Для кодировки такой разницы требуется всего 4 бита, поэтому в методе ADPCM степень компрессии аудиосигнала составляет 2:1. ITU-TSS рекомендует несколько стандартов, основанных на методе ADPCM -- G.721, G.722, G.723, G.726, G.727. В методе G.722 используется "двухуровневый" ADPCM (Sub-Band ADPCM) со степенью дискретизации 16 КГц, 14 бит на кодировку разницы сигналов. Метод предназначен для пропускной способности канала не ниже 64 Кбит/с.

Компрессия/декомпрессия голоса

Для кодировки только человеческого голоса могут использоваться некоторые специальные методы. При кодировании методом линейного предсказания LPC (Linear Predictive Coding) реальная речь накладывается на аналитическую модель голосового тракта. По каналу связи передаются только "параметры наилучшего совпадения", которые при декодировании используются для генерации синтетического голоса, близкого по звучанию к оригиналу. Для LPC-кодировки требуется полоса пропускания не ниже 2,4 Кбит/с. Развитие метода LPC, метод линейного предсказания с возбуждением кодов CELP (Code Excited Linear Prediction), использует такую же аналитическую модель голосового тракта, как и в методе LPC. Но в методе CELP рассчитываются отклонения между исходной речью и аналитической моделью. По каналам связи передаются параметры модели и отклонения. Отклонения представлены как индикаторы. Индикаторы заносятся в общую книгу кодов, которая доступна кодировщику и декодировщику. Дополнительные данные в виде индикаторов позволяют добиться декодированного сигнала более высокого качества, чем при простой кодировке LPC. CELP требует пропускной способности канала не ниже 4,8 Кбит/с. В качестве стандарта G.728 ITU-SS предложен метод LD-CELP (Low Delay CELP), для которого требуется полоса пропускания не менее 16 Кбит/с. Метод LD-CELP требует большой вычислительной мощности и специальных аппаратных средств.

Глава 2. Технические требования на абонентское устройство конференц связи

п. 2.1. Выбор структуры и форматов данных в системе видеоконференций

Идея создания Internet была предложения в связи с необходимостью построения коммуникационной отказоустойчивой сети, которая могла бы продолжить операции, если даже большая часть ее стала не доступной для работы . Решение состояло с том, чтобы создать сеть , где информационные пакеты могли бы передаваться от одного узла к другому без какого-либо централизованного контроля. Если основная часть сети не работает, пакеты самостоятельно передвигалась бы по доступным узлам до тех пор, пока не попадут в точку своего назначения. Кроме того сеть должна быть устойчива к возможным ошибкам при передаче пакетов.