Смекни!
smekni.com

Управление звуковой картой компьютера (стр. 12 из 22)

Подробнее с работой преобразователей форматов ознакомимся на примере следующей прграммы:

AWave

(Разработчик - FMJ-Software . Последняя выпущенная версия - 5.3).

Мощный конвертор с оконным интерфейсом под Win32. Поддерживается более 330 различных форматов звуковых файлов, инструментов и банков синтезтаторов и трекеров.

Содержит встроенный редактор инструментов: раскладка по клавиатуре, режимы звукоизвлечения, точки зацикливания семпла (loops), параметры генераторов огибающих, LFO, фильтров и эффект-процессора, а также простой встроенный редактор оцифровок с функциями монтажа и настройки циклов. Звучание семплов может быть прослушано на выбранном аудиоустройстве (поддерживается DirectSound).

Описания инструмента и оцифровки могут быть из синтезатора получены по MIDI посредством SDS (Sample Dump Standard), а также переданы обратно в синтезатор.

Предоставляется функция пакетной обработки (Batch Conversion) для множественной обработки файлов без вмешательства пользователя.

12. Считыватели звуковых дорожек с компакт-дисков

Служат для прямого считывания звуковой информации с компакт-диска в цифровом формате посредством привода CD-ROM. В отличие от записи посредством звукового адаптера, при котором происходит двойное промежуточное преобразование - в ЦАП проигрывателя и в АЦП адаптера, переносят цифровое представление звука с дорожки на жесткий диск точно и без потерь.

Для точного (без потери качества) чтения звуковых дорожек вся компьютерная система должна удовлетворять ряду условий:

* Привод CD-ROM должен поддерживать функцию прямого чтения звуковых дорожек (команды Read Long, Read Raw Sectors)

* Функция прямого чтения в приводе должна быть реализована корректно - то есть без изменений передавать считанную с дорожки звуковую информацию драйверу привода, а также обеспечивать точное позиционирование на нужный звуковой кадр (сектор). Большинство приводов при чтении "промахивается" мимо нужного кадра, что требует специальных программных мер восстановления данных

* Драйвер привода и служба управления CD-ROM в операционной системе должны поддерживать операции прямого чтения и буферизацию данных

* Программа считывания должна корректно выполнять все необходимые для работы функции

Основной элемент правильной системы, пригодной для считывания звуковых дорожек, - сам привод CD-ROM. При условии выбора подходящего привода (Panasonic CR-584 и выше; Pioneer DR-511, 502S; Sony CDU-711, 811; Samsung 2030, 2430, 3230; Teac 532) остальное обычно не представляет особых проблем.

Программный метод корректной стыковки прочитанных участков с чьей-то легкой руки получил название Jitter Correction, в то время как Jitter - совершенно посторонний термин из области фазовых характеристик сигнала. Более правильно было бы называть этот метод коррекцией ошибок позиционирования.

Прямое чтение дорожек получило устоявшееся жаргонное название Grab (grabbing).

Подробнее с работой считывателей звуковых дорожек с компакт-дисков ознакомимся на примере следующей прграммы:

WinDAC

(Разработчик - Christoph Schmelnik . Последняя выпущенная версия - 1.49).

Удобная и надежная программа. Поддерживет несколько приводов CD-ROM, для каждого из которых можно задать режимы работы.

Копирование может выполняться в трех режимах:

* Normal - чередующиеся чтение с CD и запись на HDD

* Burst - перекрывающиеся чтение и запись, приводит к ошибкам на некорректных приводах и драйверах

* Sector Synchronisation - чтение с CD "внахлест", когда очередная операция читает несколько секторов, уже прочитанных предыдущей. Такой режим позволяет правильно состыковать прочитанные порции секторов в том случае, когда привод не может точно позиционироваться на заданный сектор

Поддерживается два вида операций копирования: Track - одна или несколько дорожек целиком, и Range - заданный диапазон звуковых кадров в пределах всего диска. Во втором случае предлагается удобная возможность прослушивания фрагмента с коррекцией его начального и конечного участков.

Программа умеет работать с файлом CDPLAYER.INI, в котором стандартный Windows CD Player хранит названия и содержание дисков. При копировании WinDAC может присваивать файлам названия дорожек диска, а также помещать их в каталоги, соответствующие названиям дисков.

При создании файла может использоваться любой системный ACM Codec, так что при использовании хорошего привода, не сбивающегося при прерывистом чтении, возможно прямое преобразование в нужный формат - MP3, ADPCM и др. Поддерживаются также подключаемые модули (plugins) для преобразования выходных форматов и пакеты внешних команд (scripts) для дополнительной обработки полученных файлов.

Дополнительно предоставляются функции простого CD-проигрывателя.

13. Психоакустические компрессоры

Сжимают цифровое представление звуковой фонограммы примерно на порядок посредством так называемого кодирования воспринимаемого, или распознаваемого (perceptual coding). Из психоакустических исследований известно, что отчетливо слухом воспринимаются лишь достаточно яркие и обособленные частотные компоненты, если же из нескольких тонов близкой высоты один имеет значительно большую интенсивность, то он маскирует для слуха менее интенсивные, находящиеся рядом с ним. При удалении маскируемых компонентов подавляющее большинство слушателей, особенно при воспроизведении на аппаратуре среднего класса, не замечает различий с исходным сигналом. Объем маскируемых компонентов весьма значителен, вдобавок при сжатии применяется адаптивное экономичное кодирование. Благодаря всему этому современные компрессоры уменьшают объем звуковых данных примерно на порядок без явно ощутимой потери качества звучания.

В отношении сжатых этими методами фонограмм применяется понятие скорости битового потока (bitrate), достаточной для воспроизведения сжатой фонограммы. Скорость потока является относительным показателем степени сохранения качества звучания при сжатии - на высоких скоростях оно обычно выше, чем на низких, однако во многом это зависит от глубины и точности анализа исходной фонограммы.

Наибольшее распространение получил метод Audio MPEG-1 Layer 3, именуемый чаще всего MPEG-3 или MP3. Менее популярны форматы MPEG-2 AAC (Advanced Audio Coding), VQF (Vector Quantization Format) и MPEG-4.

Надо заметить, что при оценке качества сжатых фонограмм допустимо исключительно тестовое прослушивание. Поскольку эти методы сжатия ориентированы только на человеческое восприятие, никакие объективные показатели - полоса частот, амплитудные, частотные, фазовые и иные характеристики не могут служить критериями качества преобразования.

Подробнее с работой псиакустических компрессоров ознакомимся на примере следующих прграмм:

1. BladeEnc

(Разработчик - Tord Jansson Последняя выпущенная версия - 0.82).

Небольшой и достаточно качественный компрессор с запуском из командной строки, один из самых скоростных. Существует под множество платформ и ОС: x86, Alpha, M68k, Windows 95/98/NT, Linux, Solaris, SCO и др.

Поддерживает скорости от 32 до 320 Кбит/с и частоты дискретизации 32, 44,1 и 48 кГц. Входной и выходной файлы могут быть стандартными потоками StdIn и StdOut.

Для удобства использования BladeEnc создано несколько оконных графических интерфейсов под Windows 95/NT - AutoBlade, BEShell, BFree, BladeBatch и т.п. Процессор BladeEnc выпускается также в виде независимого DLL-модуля (plugin), который может подключаться к другим программам обработки звука.

Автор рекомендует применять BladeEnc при скоростях потока 160 Кбит/с и выше, признавая, что при низких скоростях более высокое качество обеспечивают продукты Fraunhofer IIS.

2. SoundVQ Encoder

(Разработчик - Yamaha . Последняя выпущенная версия - 2.54 b4).

Компрессор в формат VQF. При скорости потока 96 Кбит/с обеспечивает качество звучания, примерно равное хорошему компрессору MP3 при скорости потока 128 Кбит/с (степень сжатия около 1:14). При меньших скоростях обеспечивается сжатие до 20 раз.

Поддерживаются входные форматы от 8 кГц/8 разрядов/моно до 44,1 кГц/16 разрядов/стерео.

В состав входит пакетный процессор SoundVQ Batch Encoder для групповой обработки файлов.

14. Проигрыватели

Задачей проигрывателя является простое воспроизведение звукового или музыкального потока. Можно выделить четыре основных класса проигрывателей:

* Auduo - для воспроизведения аудиофайлов. Сюда относятся простые проигрыватели форматов WAV, VOC, AU, а также сжатых потоковых форматов - MP3/VQF/AAC, ADPCM, GSM и т.п.

* MIDI - для воспроизведения MIDI-файлов. В функцию проигрывателя входит только объединение виртуальных "дорожек" файла и отправка MIDI-событий на заданный MIDI-порт. Собственно интерпретацией данных занимается MIDI-устройство - аппаратный или программный синтезатор.

* Трекерные - для воспроизведения трекерных модулей. Такой проигрыватель фактически содержит в себе всю звуковую систему трекера для интерпретации нот и команд модуля.

* Сетевые - для воспроизведения широковещательных сетевых потоков в реальном времени. При помощи специальных протоколов (RealAudio, AudioActive, StreamWorks, NetShow) организуются вещательные серверы, которые в реальном времени передают звуковую и видеоинформацию всем подключившимся к серверу клиентам. В задачу сетевого проигрывателя входит расшифровка сжатого формата звука и его воспроизведение через аудиопорт.

Существуют универсальные проигрыватели, сочетающие в себе свойства нескольких классов.

Расшифровка и интерпретация проигрываемого файла может выполняться как самим проигрывателем, так и системными службами или подключаемыми модулями (plugins). Если результирующий звук создается и выводится самим проигрывателем, возможна его обработка (акцентировка басов, расширение стереоэффекта, эквалайзер) и индикация (осциллограмма, спектрограмма).

Многие проигрыватели поддерживают список проигрываемых файлов (playlist).

Полезной функцией ряда MIDI-проигрывателей является посылка команды инициализации синтезатора в режимах GM, GS или XG перед проигрыванием файла, так как многие MIDI-файлы не содержат таких команд ни в начале, ни в конце, из-за чего состояние синтезатора может стать неопределенным.