Смекни!
smekni.com

Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки (стр. 1 из 8)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ

РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ

РАДИОТЕХНИКИ ЭЛЕКТРОНИКИ И АВТОМАТИКИ

(ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

Курсовая работа по информатике

Тема :

Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки.

Студент Чистяков И.А.

Группа ОТО 4-04

Преподователь Андрианова Е. Г.

Работа допущена к защите_____________________________

Курсовая работа защищена с оценкой ___________________

Москва 2005

Содержание

1.Введение………………………………………………………………..3

2. Часть первая, теоретическая……..………………………………..3

А. Теория цифрового звука……………………………….……3

Б. Оцифровка звука и его хранение на цифровом носителе.7

В. Как сохранить оцифрованный звук?..................................11

Г. Преимущества и недостатки цифрового звука………….14

Д. К вопросу об обработке звука……………..……………….17

Е. Аппаратура………………………………………..…………18

Ж. Программное обеспечение………………………….……..22

3.Часть вторая: больше практическая……………..…………………25

1. Подключение проигрывателя к компьютеру…..……….25

2. Настройка возможностей звуковой карты……..………..26

3. Реставрация……………………………………….…………26

4. Подготовка файлов…………………………………………32

5. Разделение файла wave на отдельные композиции........32

6. Перспективы и проблематика……………………………33

7. Глоссарий терминов……………………………………….34

1.Введение

В последнее время возможности мультимедийного оборудования претерпели значительный рост, и этой области уделяется достаточное количество внимания, но все же рядовой пользователь никак не может составить себе четкого представления о том, какие возможности скрывает его железный друг в области воспроизведения звука, писка, шумов, бинаруальных волн и т.д. Все ограничивается воспроизведением криков и взрывов в играх и фильмах (благо технический прогресс докатился уже до такого уровня) и прослушивания домашней фонотеки (или уже пора придумать другое название, что-нибудь типа «цифротеки»?).

Попробуем в данном труде разобраться в основных аспектах данной проблемы. Поговорим немного об анатомии, теории цифрового звука и что можно извлечь из старой виниловой пластинки и аудиокассеты.

Что именно мы знаем о звуковых возможностях компьютера, кроме того, что в нашем домашнем компьютере установлена звуковая плата и две колонки? К сожалению, вероятно из-за недостаточности литературы или по каким-либо другим причинам, но пользователь, чаще всего, не знаком ни с чем, кроме встроенного в Windows микшера аудио входов/выходов и Recorder’а. Для того чтобы узнать что же умеет компьютер в области звука, нужно только поинтересоваться и перед вами откроются возможности, о которых вы, может быть, даже не догадывались. И все это не так сложно, как может показаться на первый взгляд.

2.Часть первая: больше теоретическая.

Все процессы записи, обработки и воспроизведения звука так или иначе работают на один орган, которым мы воспринимаем звуки - ухо. Две штуки :). Без понимания того, что мы слышим, что нам важно, а что нет, в чем причина тех или иных музыкальных закономерностей - без этих и других мелочей невозможно спроектировать хорошую аудио аппаратуру, нельзя эффективно сжать или обработать звук. То, что здесь описано - лишь самые основы.

Снаружи мы видим так называемое внешнее ухо. Ничего особенного нас тут не интересует. Затем идет канал - примерно 0.5 см в диаметре и около 3 см в длину. Далее - барабанная перепонка, к которой присоединены кости - среднее ухо. Эти косточки передают вибрацию барабанной перепонки далее - на другую перепонку, во внутреннее ухо - трубку с жидкостью, около 0.2 мм диаметром и еще целых 3-4 см длинной, закрученная как улитка. Смысл наличия среднего уха в том, что колебания воздуха слишком слабы, чтобы напрямую колебать жидкость, и среднее ухо вместе с барабанной перепонкой и перепонкой внутреннего уха составляют гидравлический усилитель - площадь барабанной перепонки во много раз больше перепонки внутреннего уха, поэтому давление (которое равно F/S) усиливается в десятки раз.

Во внутреннем ухе по всей его длине натянута некая штука, напоминающая струну - еще одна вытянутая мембрана, жесткая к началу уха и мягкая к концу. Определенный участок этой мембраны колеблется в своём диапазоне, низкие частоты - в мягком участке ближе к концу, самые высокие - в самом начале. Вдоль этой мембраны расположены нервы, которые воспринимают колебания и передают их в мозг, используя два принципа:

Первый - ударный принцип. Поскольку нервы еще способны передавать колебания (бинарные импульсы) с частотой до 400-450 Гц, именно этот принцип влоб используется в области низкочастотного слуха. Там сложно иначе - колебания мембраны слишком сильны и затрагивают слишком много нервов. Ударный принцип немного расширяется до примерно 4 кГц с помощью трюка - несколько (до десяти) нервов ударяют в разных фазах, складывая свою пропускную способность. Этот способ хорош тем, что мозг воспринимает информацию более полно - с одной стороны, мы всё таки имеем легкое частотное разделение, а с другой - можем еще смотреть сами колебания, их форму и особенности, а не просто частотный спектр. Этот принцип продлен на самую важную для нас часть - спектр человеческого голоса. Да и вообще, до 4 кГц находится вся наиболее важная для нас информация.

Ну и второй принцип - просто местоположение возбуждаемого нерва, применяется для звуков более 4 кГц. Тут уже кроме факта нас вообще ничего не волнует - ни фаза, ни скважность.. Голый спектр.

Таким образом, в области высоких частот мы имеем чисто спектральный слух не очень высокого разрешения, а для частот близких к человеческому голосу - более полный, основанный не только на разделении спектра, а еще и на дополнительном анализе информации самим мозгом, давая более полную стерео - картину, например. Об этом - ниже.

Основное восприятие звука происходит в диапазоне 1 - 4 кГц, в этом же диапазоне заключено человеческий голос (да и звуки, издаваемые большинством важных нам процессов в природе). Корректная передача этого частотного отрезка - первое условие естественности звучания.

О чувствительности (по мощности и частотной)

Теперь о децибелах. Вкратце - аддитивная относительная логарифмическая мера громкости (мощности) звука, наиболее хорошо отражающая человеческое восприятие громкости, и в то же время достаточно просто вычисляемая.

В акустике принято измерять громкость в дБ SPL (Sound Power Level - не знаю как это звучит у нас). Ноль этой шкалы находится примерно на минимальном звуке, который слышит человек. Соответственно отсчет ведется в положительную сторону. Человек может осмысленно слышать звуки громкостью примерно до 120 дБ SPL. При 140 дБ ощущается сильная боль, при 150 дБ наступает повреждение ушей. Нормальный разговор - примерно 60 - 70 дБ SPL. Далее в этом разделе при упоминании дБ подразумевается дБ от нуля по SPL.

Чувствительность уха к разным частотам очень сильно различна. Максимальна чувствительность в районе 1 - 4 кГц, основные тона человеческого голоса. Звук 3 кГц - это и есть тот звук, который слышен при 0 дБ. Чувствительность сильно падает в обе стороны - например для звука в 100 Гц нам нужно уже целых 40 дБ (в 100 раз большая амплитуда колебаний), для 10 кГц - 20 дБ. Обычно мы можем сказать, что два звука отличаются по громкости, при разнице примерно в 1 дБ. Несмотря на это, 1 дБ - это скорее много, чем мало. Просто у нас очень сильно компрессированное, выровненное восприятие громкости. Зато весь диапазон - 120 дБ - воистину огромен, по амплитуде это миллионы раз!

Кстати, увеличение амплитуды в два раза соответствует увеличению громкости на 6 дБ. Внимание! не путайте: 12 дБ - в 4 раза, но разница 18 дБ - уже 8 раз! а не 6, как могло подуматься. дБ - логарифмическая мера)

Аналогична по свойствам и спектральная чувствительность. Мы можем сказать, что два звука (простых тона) отличаются по частоте, если разница между ними составляет около 0.3% в районе 3 кГц, а в районе 100 Гц требуется различие уже на 4%! Для справки - частоты нот (если брать вместе с полутонами, то есть две соседние клавиши фортепьяно, включая черные) отличаются на примерно 6%.

В общем, в районе 1 - 4 кГц чувствительность уха по всем параметрам максимальна, и составляет не так уж и много, если брать не логарифмированные значения, с которыми приходится работать цифровой технике. Примите на заметку - многое из того, что происходит в цифровой обработке звука, может выглядеть ужасно в цифрах, и при этом звучать неотличимо от оригинала.

В цифровой обработке понятие дБ считается от нуля и вниз, в область отрицательных значений. Ноль - максимальный уровень, представимый цифровой схемой.

А. Собственно говоря, о самой цифре.

Некоторые факты и понятия, без которых тяжело обойтись.

В соответствии с теорией математика Фурье, звуковую волну можно представить в виде спектра входящих в нее частот.

Частотные составляющие спектра - это синусоидальные колебания (так называемые чистые тона), каждое из которых имеет свою собственную амплитуду и частоту. Таким образом, любое, даже самое сложное по форме колебание (например, человеческий голос), можно представить суммой простейших синусоидальных колебаний определенных частот и амплитуд. И наоборот, сгенерировав различные колебания и наложив их друг на друга (смикшировав, смешав), можно получить различные звуки.

Справочка: человеческий слуховой аппарат/мозг способен различать частотные составляющие звука в пределах от 20 Гц до ~20 КГц (верхняя граница может колебаться в зависимости от возраста и других факторов). Кроме того, нижняя граница сильно колеблется в зависимости от интенсивности звучания.