В настоящее время звуковая информация является неотъемлемой частью любой мультимедиа системы. В связи с этим возникает проблема хранения звуковых данных. До появления цифровой техники звук хранился в виде, наиболее близком к природному: в виде аналоговых колебаний, записанных на магнитный носитель или виниловый диск. Однако, несмотря на то, что этот способ хранения наиболее точно передает все свойства звука, проблемы хранения и передачи делают невозможным использование этого способа в мультимедиа системах. Возникает необходимость хранения звуковой информации в цифровом виде.
При работе со звуком важно знать не только основные возможности программ, используемых при создании звуковых мультимедиа компонентов, но и основные форматы и параметры цифрового звука. Немаловажную роль при работе со звуком играет понимание процессов преобразования аналогового звука в цифровую форму.
Звуковая информация представляет собой совокупность колебаний звуковой частоты – от 20Гц до 20кГц
Рис.1. Звуковая информация
Наиболее очевидным способом хранения звука в цифровой форме является дискретизация по времени и амплитуде. При этом непрерывный сигнал представляется как последовательность отсчетов, идущих через фиксированные интервалы времени (рис. 2).
Рис.2. Дискретизация по времени и амплитуде
Такое представление называется также импульсно-кодовая модуляция (PulseCodeModulation, PCM). На качество преобразованного звука влияют два параметра: частота дискретизации (samplingrate), и разрядность дискретизации (samplesize). Частота дискретизации показывает, как часто измеряется амплитуда сигнала, а разрядность дискретизации – число битов, используемых для хранения каждого отсчета. Чем выше эти два параметра, тем ближе оцифрованный сигнал будет к исходному аналоговому, в то же время, будет увеличиваться объем данных, кодирующих этот сигнал, и, соответственно, требуемая пропускная способность канала связи. Возникает задача сжатия оцифрованного звука.
- стандарт CD-audio: 44,1 кГц, 16 бит;
- стандарт DVD: 96 кГц, 24 бит.
Формат аудиофайла представляет собой спецификацию, описывающую структуру, в которой аудиоданные хранятся в файле. Существование множества звуковых форматов обусловлено множеством областей применения звуковых данных, например, для воспроизведения в CD-приводе, для хранения музыки или звуковых эффектов в видео играх, для записи саундтреков к видеоклипам или для загрузки через Internet.
Рассмотрим некоторые форматы для хранения аудиоданных.
Формат MicrosoftWave
Формат Wave является форматом для операционной системы Windows. Формат поддерживает множество различных типов аудиоданных, в том числе 8- и 16-битные, моно и стерео. Имеет поддержку большого количества схем сжатия, включая множество вариантов ADPCM через MicrosoftACM (AudioCompressionManager). Файлы в формате Wave имеют расширение wav.
Формат WindowsMediaAudio
Это специальный формат, позволяющий создавать потоковые аудиофайлы для передачи через Internet, поддерживает видеоданные. Является форматом для операционной системы Windows. Формат WindowsMediaAudio содержит собственные сложные функции сжатия, позволяющие передавать аудиоданные через Internet в режиме реального времени. Файлы WindowsMedia имеют расширения wma и asf.
Формат MPEGAudio (MP3)
Формат MPEGAudio использует математические и акустические алгоритмы компрессирования звука, что позволяет во много раз уменьшить количество памяти, занимаемое аудиофайлом, с некоторой потерей качества. Поддерживается практически всеми операционными системами при наличии специализированных программных проигрывателей. Файлы в формате MPEGAudio имеют расширение mp3.
Качество сжатого аудио во многом определяется тем, насколько качественно была осуществлена первичная запись дикторского голоса и как записывалось музыкальное сопровождение.
Общая характеристика программно-аппаратного комплекса записи звука DegidesignSession 8
Session 8 - комплексная цифровая студия, объединяющая вместе цифровую запись звука, MIDI, аналоговый микшер и систему коммутации. Работает на базе компьютера PC. Полный комплект состоит из двух плат (Core System) - основная занимает 16-битный ISA слот, и на ней расположен цифровой процессор (DSP) + SCSI-2 контроллер, вторая 8-битная ISA плата служит как порт с внешним разъемом для подключения звукового интерфейса ввода/вывода (I/O Interface). Комплекс оснащен программным обеспечением с одноименным названием «Session 8» версии 2.5, разработанным под операционную систему MicrosoftWindows 95. Поддерживается объем дискового пространства более 2 Гбайт; введены многочисленные автоматизированные функции для редактирования звука.
Для микширования Session 8 располагает двумя режимами: внешний, для использования с автономным микшером, и внутренний, полностью цифровой. Во внутреннем режиме работа идет с «виртуальным» микшером на экране монитора. Цифровые параметрические эквалайзеры позволяют работать без каких-либо качественных потерь, присущих аналоговым агрегатам.
Другой особенностью Session 8 является режим программной коммутации (routing) входов. Входы можно распределять с помощью простого и удобного графического интерфейса, а также можно назначать эффекты на каналы (компрессоры, гейты и т.д.). С помощью этой функции можно обойтись без аппаратного переназначения каналов записи, что позволяет избежать потери времени на коммутацию проводов.
Благодаря наличию стандартного WAV драйвера Session 8 работает и с другими программными продуктами, включая Cakewalk, Cubase, Sound Froge, Cool Edit и т.п.
Для компьютерной обработки аудиоинформации существует множество программ и различных программных фильтров, качество обработки определяется профессионализмом персонала и стоимостью программно-аппаратных комплексов.
Описание типового технологического процесса производства звуковых компонентов.
Можно выделить несколько основных этапов технологической цепочки подготовки звукового мультимедиа компонента:
- запись;
- обработка записанного материала:
a) удаление шумов;
b) монтаж фонограммы в соответствии с техническим заданием.
Монтаж фонограммы предполагает удаление избыточных пауз, сборку речевой фонограммы из нескольких дублей, корректировку оговорок диктора или удаление ненужных музыкальных тем, а также иные действия, предусмотренные техническим заданием;
c) частотная обработка, применение эффектов;
d) выравнивание уровня громкости.
- контрольное прослушивание и сохранение аудиофайла в формате, указанном в техническом задании.
Контрольное прослушивание производится с целью выявления технического брака, ошибок монтажа и проверки соответствия параметров фонограммы техническому заданию.
При создании синхронного саундтрека к видеоряду технологическая цепочка выглядит иначе:
- подготовка исходных материалов:
a) запись и обработка фонограммы дикторского текста;
b) подбор музыкальных фрагментов для фонового сопровождения;
c) подбор звуковых эффектов.
- монтаж саундтрека:
a) предварительное синхронное озвучивание эффектами;
b) монтаж фонограммы дикторского текста;
c) компилирование музыкального саундтрека;
d) мастеринг – сведение фонограмм звуковых эффектов, с записью дикторского текста и музыкального саундтрека.
- контрольное прослушивание и сохранение данных:
a) Контрольное прослушивание (просмотр);
b) сохранение саундтрека в студийном формате (MicrosoftWAVE, PCM (Uncompressed), 16 bit, 44.1 kHz, mono/stereo);
c) сохранение видеофайла в требуемом формате.
Техническое задание
Пример выполнения записи и обработки звукового сопровождения для видеоролика
Озвучить видео ролик, представленный файлом lions.mpg.
Дикторский текст:
«Лев – это очень крупный, могучего телосложения зверь. Его самцы достигают в длину 180 – 240 сантиметров, не считая хвоста. Масса льва от 180 до 227 килограммов. Голова чрезвычайно массивная с довольно длинной мордой. Лапы невысокие, очень сильные. Весьма характерна сильно развитая у взрослых самцов длинная грива, покрывающая шею, плечи и грудь, тогда как на всем остальном теле шерсть короткая буровато-желтая. В отличие от других крупных хищников, львы встречаются не только в одиночку и парами, но и крупными группами – так называемыми прайдами. В прайд обычно входят один-два взрослых самца, несколько взрослых львиц и молодые звери. Добычей им служат различные антилопы, зебры и другие копытные средней величины вплоть до молодых слонов, носорогов, бегемотов, а также домашнего скота»
Формат фонограммы: MPEG, 16 bit, 44.1 kHz, mono.
Саундтрек должен содержать звуки природы, совпадающие с событиями в сюжете; закадровый дикторский текст. В фонограмме дикторского текста должны быть удалены избыточные паузы между словами.
Параметры фонограммы дикторского текста: пиковый уровень громкости 0 dB, GraphicEQ срез НЧ ниже 160 Hz, DynamicsGraphicCompressorSoftkneecompressor/gate (-24 dBthreshold).
Параметры фонограммы звуковых эффектов: средний уровень громкости –28 dB.
После запуска программы сконфигурируем сессию.
Сессия – это проектный файл программы Session 8, в котором хранятся сведения о коммутации каналов, список файлов, записанных в этой сессии.
Необходимо подключить микрофон к микрофонному входу аудио интерфейса Session 8. Затем нужно запустить программную оболочку Session 8 и в ней назначить программный канал, соответствующий входу, куда подключен микрофон. Назначение каналов приведено на рисунке 3.1.
Рис. 3.1
Затем необходимо настроить оборудование, т.е. найти такое положение микрофона, в котором микрофон улавливает минимум электрических и прочих шумов. Также необходимо установить уровень чувствительности канала. Эти настройки влияют на уровень громкости записи.