Итак, каким же образом можно описать аналоговый аудио сигнал в цифровой форме? Реальный аудио сигнал – это сложное по форме колебание, некая сложная зависимость амплитуды звуковой волны от времени. На рис. 2 представлен график реальной звуковой волны.
Рис.2. Изображение реальной звуковой волны
Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел. Поступим следующим образом. Будем измерять напряжение через равные промежутки времени и записывать полученные значения в память компьютера. Этот процесс называется дискретизацией (или оцифровкой).
Преобразование аналогового звукового сигнала в цифровой вид называется аналогово-цифровым преобразованием или оцифровкой. Процесс такого преобразования заключается в:
· осуществлении замеров величины амплитуды аналогового сигнала с некоторым временным шагом – дискретизация,
· последующей записи полученных значений амплитуды в численном виде – квантование.
Процесс дискретизации по времени - это процесс получения мгновенных значений преобразуемого аналогового сигнала с определенным временным шагом, называемым шагом дискретизации.
Чем выше частота дискретизации (т. е. количество отсчетов за секунду) и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук. Но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.
Количество осуществляемых в одну секунду замеров величины сигнала называют частотой дискретизации или частотой выборки, или частотой сэмплирования (от англ. « sampling» – «выборка»).Очевидно, что чем меньше шаг дискретизации, тем выше частота дискретизации (то есть, тем чаще регистрируются значения амплитуды), и, значит, тем более точное представление о сигнале мы получаем.
Ухо человека не замечает ступенчатость полученного сигнала. Тут можно провести следующую аналогию. Каждый человек смотрел в кинотеатре фильмы, и перед его глазами на экране шло непрерывное, плавное действие: Но ведь на самом-то деле кинолента представляет собой серию неподвижных, дискретных изображений, которые прокручиваются с высокой скоростью 24 кадра в секунду. Поскольку человеческим глазам свойственна некоторая инерционность, то их легко обмануть, чем необычайно ловко пользуются кинематографисты. Наши уши тоже в какой-то степени не идеальны, и их можно обмануть подобным образом, представляя непрерывный аналоговый сигнал в виде последовательности быстро сменяющихся мгновенных значений напряжения. Только в отличие от киноленты смена «звукового кадра» происходит в тысячи раз быстрее. Для полной маскировки ступенчатости сигнала применяются фильтры нижних частот, сглаживающие форму волны.
Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс называется квантованием по амплитуде. Говоря более формальным языком, квантование по амплитуде – это процесс замены реальных (измеренных) значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Квантование значений сигнала привносит в спектр сигнала дополнительную помеху, называемую шумом квантования или шумом дробления. Шумом (ошибкой) квантования называют сигнал, составляющий разницу между восстановленным цифровым и исходным аудио сигналами. Эта разница образуется в результате округления измеренных значений сигнала. При этом выполняется следующая закономерность: чем выше разрядность квантования, тем ниже уровень шума квантования (поскольку тем на меньшее значение требуется округлять каждое измеренное значение сигнала). Природа шума квантования такова, что ширина спектральной области, в которой он простирается, пропорциональна значению частоты дискретизации.
Рис. 3. Процесс оцифровки звукового сигнала
Устройство, выполняющее оцифровку называют аналого-цифровым преобразователем (АЦП). Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит цифро-аналоговый преобразователь (ЦАП), а затем сгладить получившийся ступенчатый сигнал.
Рис.4. Процесс кодирования и декодирования звуковой волны
Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами.
В современное время все упирается в вычислительную мощность современной цифровой техники. С возрастанием точности оцифровки одновременно возрастает скорость потока цифровых данных, увеличивается вычислительная нагрузка на процессор и требуется повышенный объем памяти для хранения цифровых отчетов. Имеются и серьезные схемотехнические трудности. Вместе со стремительным ростом компьютерных технологий становится возможным применять более высокие частоты дискретизации и разрядность. Цифровой звук широко применяется в современной звукозаписывающей индустрии благодаря хорошему качеству звучания, высокой помехозащищенности и удобству хранения и архивирования материала.
В настоящее время при записи звука в мультимедийных технологиях применяются частоты 8, 11, 22 и 44 кГц. Так, частота дискретизации 44 килогерца означает, что одна секунда непрерывного звучания заменяется набором из сорокачетырех тысяч отдельных отсчетов сигнала. Чем выше частота дискретизации, тем лучше качество оцифрованного звука.
Как отмечалось выше, каждый отдельный отсчет можно описать некоторой совокупностью чисел, которые затем можно представить в виде некоторого двоичного кода. Качество преобразования звука в цифровую форму определяется не только частотой дискретизации, но и количеством битов памяти, отводимых на запись кода одного отсчета. Этот параметр принято называть разрядностью преобразования.
Методов сжатия (форматов), а также программ реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3),MPEG-2 AAC (advancedaudiocoding), OggVorbis, WindowsMediaAudio(WMA),TwinVQ (VQF), MPEGPlus, TAC, и прочие.В настоящее время обычно используется разрядность 8,16 и 24 бит.
На описанных выше принципах основывается формат WAV (от WAVeform-audio – волновая форма аудио) кодирования звука. Получить запись звука в этом формате можно от подключаемых к компьютеру микрофона, проигрывателя, магнитофона, телевизора и других стандартно используемых устройств работы со звуком. Однако формат WAV требует очень много памяти. Так, при записи стереофонического звука с частотой дискретизации 44 килогерца и разрядностью 16 бит – параметрами, дающими хорошее качество звучания, – на одну минуту записи требуется около десяти миллионов байтов памяти.
Кроме волнового формата WAV, для записи звука широко применяется формат с названием MIDI (Musical Instruments Digital Interface – цифровой интерфейс музыкальных инструментов). Фактически этот формат представляет собой набор инструкций, команд так называемого музыкального синтезатора – устройства, которое имитирует звучание реальных музыкальных инструментов. Команды синтезатора фактически являются указаниями на высоту ноты, длительность ее звучания, тип имитируемого музыкального инструмента и т. д. Таким образом, последовательность команд синтезатора представляет собой нечто вроде нотной записи музыкальной мелодии. Получить запись звука в формате MIDI можно только от специальных электромузыкальных инструментов, которые поддерживают интерфейс MIDI. Формат MIDI обеспечивает высокое качество звука и требует значительно меньше памяти, чем формат WAV.
Наиболее распространенный формат – MPEG-1 Layer III (всем известный MP3). Формат завоевал свою популярность совершенно заслуженно – это был первый распространенный кодек, который достиг столь высокого уровня компрессии при отличном качестве звучания. Сегодня этому кодеку имеется множество альтернатив, но выбор остается за пользователем. Преимущества MP3 – широкая распространенность и достаточно высокое качество кодирования,которое объективно улучшается благодаря разработкам различных кодеров MP3 энтузиастами. Мощная альтернатива MP3 – кодек MicrosoftWindowsMediaAudio (Файлы .WMA и .ASF). По различным тестам этот кодек показывает себя от «как MP3» до «заметно хуже MP3» на средних битрейтах, и, «лучше MP3» на низких битрейтах.На сегодня совершенно очевидно лишь одно – цифровые технологии находятся лишь в начале своего пути, и нам еще только предстоит понять, что значит их повсеместное внедрение совместно с миниатюризацией, наращиванием вычислительных мощностей и объемов памяти.
Совершенно ясно, что цифровые технологии очень скоро завоюют новые, еще не захваченные рубежи, и что от повсеместного применения этих технологий никуда не деться. Опасаться этого процесса можно, но сопротивляться ему бесполезно.
Цифровые же технологии пока еще очень молоды, и только это позволяет «аналогу» еще оставаться на плаву. Достаточно быстрое развитие и постоянное удешевление цифровых устройств дает основание утверждать, что совсем скоро «цифра» полностью вытеснит аналоговые методы записи и обработки информации. Только представьте себе, как развитие этих технологий может повлиять на окружающий нас мир! Все это лишь укрепляет мысли о том, что путь не близок, и что самое интересное нам еще только предстоит увидеть.
Список использованной литературы
1. http://sdo.uspi.ru/mathem&inform/lek8/lek_8.htm
2. kunegin.narod.ru
3. Сергей Арзуманов. Секреты гитарного звука, Москва, 2003.
4. Симонович С.В. и др. Информатика. Базовый курс,«Питер», 2000.