Смекни!
smekni.com

Запись голоса через микрофон на компьютер (стр. 5 из 18)

1.2.1. Важнейшие параметры звуковых карт

Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. Число различных моделей звуковых карт составляет несколько десятков. А если учитывать еще и различные версии одних и тех же устройств, то при покупке карты приходится выбирать почти из сотни наименований. Для наших же целей подходят многие, но не все модели. Не всякая звуковая карта способна на большее, чем озвучивание компьютерных игр. Конечно, принадлежность звуковой карты к продукции известных фирм является веской причиной того, что именно ее следует выбрать, это скажется в дальнейшем на надежности работы. Но не у всех наших читателей имеется возможность неограниченного выбора. Тем важней понимать сущность и значение нескольких основных параметров звуковой карты. К таким параметрам относятся, в первую очередь:

^ метод синтеза музыкальных звуков, реализованный в синтезаторе зву ковой карты;

> разрядность АЦП/ЦАП звуковой карты;

> диапазон частот дискретизации.

О методах синтеза музыкальных звуков мы достаточно подробно рассказывали в [63]. В современных звуковых картах по-прежнему применяется частотный синтез звуков (FM-синтез), но это делается в основном в целях обеспечения поддержки старых игр. Основным методом синтеза в настоящее время является волновой метод, или, как его еще называют, метод волновых таблиц (WT-синтез).

Возможно, это несколько субъективно, и кто-то с нами не согласится, но после первого же сравнения звучания MIDI-инструментов в FM- и WT-вариан-тах мы безоговорочно решили для себя, что FM-инструменты не стоят того, чтобы тратить на них время. Поэтому дальше речь пойдет только о WT-синте-заторах звуковых карт.

Разрядность звуковой карты существенно влияет на качество звука. Однако перед тем как перейти к более детальному обсуждению этого вопроса, следует пояснить, что речь идет о разрядности АЦП и ЦАП. Звуковые карты двойного назначения имеют в своем составе одновременно два функционально независимых узла: WT-синтезатор и устройство оцифровки звуковых сигналов, поступающих с внешнего источника. В каждый из узлов входит как минимум по одному ЦАП. В устройстве оцифровки, кроме того, имеется АЦП. В недавнем прошлом прямое указание на разрядность звуковой карты содержалось в ее названии в виде числа 16. Тем самым изготовители подчеркивали, что в их продукции качество цифрового звука как бы соответствует качеству звука лазерного проигрывателя, а не какой-нибудь там 8-битной карты. В дальнейшем 16 разрядов в ЦАП/АЦП стали нормой, а числа «32» или «64» в названиях стали означать совсем другое — максимальное количество одновременно звучащих голосов синтезатора звуковой карты (полифонию).

Некоторые высококачественные звуковые карты оборудованы 18-битными и даже 20-битными ЦАП/АЦП. Звуковые редакторы, работая с любыми звуковыми картами, в том числе и 16-битными, в процессе преобразований отсчетов сигнала используют арифметику с разрядностью двоичного представления числа, превышающей 16. Это позволяет уменьшить погрешность, накапливающуюся в процессе выполнения сложных алгоритмов обработки, которая в противном случае проявлялась бы как искажение звука.

Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования, в свою очередь, зависит от разрядности АЦП/ЦАП. Погреш-

ности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования. Шум квантования (рис. 1.12, в) представляет собой разность соответствующих значений реального (рис. 1.12, а)и квантованного по уровню (рис. 1.12, б) сигналов.

Из рис. 1.12 видно, что в случае превышения сигналом значения самого верхнего уровня квантования («старшего» кванта), а так же в случае, когда значение сигнала оказывается меньше нижнего уровня квантования («младшего» кванта), т. е. при ограничении сигнала, возникают искажения (рис. 1.12, д), более заметные по сравнению с шумом квантования. Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу: значения сигнала должны располагаться между уровнями, соответствующими младшему и старшему квантам.


При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет ниже.

В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего кванта (на рис. 1.12 — это числа 6 и 1). Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант. Разумеется, если при записи уже имело место ограничение амплитуды, то нормализация не избавит сигнал от искажения.

Для нормированного сигнала относительная величина максимальной погрешности квантования равна 1/N, где N — число уровней квантования. Этой же величиной, представленной в логарифмических единицах (децибелах), оценивается уровень шумов квантования АЦП звуковой карты. Уровень шумов квантования определяется по формуле: Д = 201д(1/1\1).ДлятрехразрядногоАЦП (см. рис. 1.12) N=8, иД= — 18 дБ; для восьмиразрядного—М==256,Д= —48дБ;

для шестнадцатиразрядного — N=65 536, Д= —96 дБ; для восемнадцатиразрядного АЦП N=262 144, Д= — 108 дБ; и для двадцатиразрядного АЦП N= 1 648 576, Д= — 120дБ. Эти цифры наглядно демонстрируют, что с ростом разрядности АЦП шум квантования уменьшается. Приемлемым считается 16-разрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП нецелесообразно, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схем компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем —96дБ.

Однако увеличение разрядности АЦП обусловлено еще одним фактором — стремлением расширить его динамический диапазон. Мы уже говорили о динамическом диапазоне звука. Динамический диапазон некоторого устройства обработки может быть определен выражением D=201g(Smax/S,nin), где S^ax и Smin — максимальное и минимальное значения сигнала, который может быть преобразован в цифровую форму без искажения и потери информации. Вы уже, наверное, догадались, что минимальный сигнал не может быть меньше, чем напряжение, соответствующее одному кванту, а максимальный — не должен превышать величины напряжения, соответствующего N квантам. Поэтому выражение для динамического диапазона АЦП звуковой карты примет вид:

D=201g(N). Ведь можно считать, что Smax=kN, aS,nm=kl, ^ek — некоторый постоянный коэффициент пропорциональности, учитывающий соответствие электрических величин (тока или напряжения) номерам уровней квантования. Сравнивая выражения для Д и D, становится ясно, что при одинаковой разрядности АЦП эти величины будут отличаться лишь знаками.

Поэтому динамический диапазон для 16-разрядного АЦП составляет 96 дБ, для 18-разрядного— 108 дБ, для 20-разрядного— 120 дБ. Иными словами, для записи звучания некоторого источника звука, динамический диапазон которого составляет 120 дБ, требуется двадцатиразрядный АЦП. Если такого нет, а имеется только шестнадцатиразрядный, то динамический диапазон звука должен быть сжат на 24 дБ: со 120 дБ до 96 дБ.

В принципе, существуют методы и устройства сжатия (компрессии) динамического диапазона звука, и мы еще будем говорить о них. Но то, что они проделывают со звуком, как ни смягчай формулировки, все равно искажает его. Именно поэтому так важно для оцифровки звука использовать АЦП, имеющий максимальное количество разрядов. Владелец 16-битной звуковой карты может еще раз взглянуть на табл. 1.1. с тем, чтобы убедиться в отсутствии особых причин для расстройства: динамические диапазоны большинства источников звука вполне соответствуют динамическому диапазону такой звуковой карты. Кроме того, 18-битное или 20-битное представление сигнала применяется только на этапе обработки звука. Конечная аудиопродукция (CD и DAT) реализуется в 16-битном формате.

После того как мы немного разобрались с разрядностью звуковой карты, пришло время поговорить о частоте дискретизации.

В процессе работы АЦП происходит не только квантование сигнала по уровню, но и его дискретизация во времени. Сигнал, непрерывно изменяющийся во времени, заменяют рядом отсчетов этого сигнала. Обычно отсчеты сигнала берутся через одинаковые промежутки времени. Интуитивно ясно, что если отсчеты отстоят друг от друга на слишком большие интервалы, то при дискретизации может произойти потеря информации: если важные изменения сигнала произойдут не в те моменты, когда были взяты отсчеты, они могут быть «пропущены» преобразователем. Получается, что отсчеты следует брать с максимальной частотой. Естественным пределом служит быстродействие преобразователя. Кроме того, чем больше отсчетов приходится на единицу времени, тем больший размер памяти необходим для хранения информации.

Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое в отечественной научно-технической литературе принято называть теоремой Котельникова [Котельников В.А. Теория потенциальной помехоустойчивости.— М., Госэнергоиздат, 1956].