Технологии мультимедия (стр. 2 из 6)

Здесь намеренно делается акцент на звуковых платах фирмы Creative. В то время она выпускала безусловный мэйнстрим, а полупрофессиональные и профессиональные карты от GravisUltrasound, VoyetraTurtleBeach и других производителей хоть и обладали целым рядом уникальных характеристик, но не определяли развитие отрасли в целом. Это было прерогативой Creative, так как, по большому счету, конкурентов на потребительском рынке у нее не было. В результате случился застой, длившийся целых четыре (!) года (1994-1998). В этот период даже новые модели аудиокарт являлись лишь модернизацией старых. Наиболее показательна в этом отношении AWE64 по отношению к AWE32. Возможно, такое положение продолжалось бы и дольше, но назрел переход на шину PCI и 3D-звук.

Все звуковые платы SB вплоть до AWE64 включительно были реализованы в конструктиве под шину ISA. Однако тенденция отказа от наследия IBM PC требовала перехода на шину PCI, значительно более быструю, а также позволявшую разделять ресурсы компьютера, что существенно упрощало его конфигурирование. Более того, переход на PCI легко решал вопрос организации хранения банков инструментов не в ПЗУ или ОЗУ на самой звуковой карте, а в системном ОЗУ компьютера. Немаловажно и то, что PCI-карты были заметно дешевле. Первую реально работоспособную PCI-аудиокарту создала фирма Ensoniq, которую шустрая Creative тут же и купила. Произошло это в декабре 1997 года. После доработки и модернизации программного обеспечения карта стала называться довольно своеобразно - CreativeLabsEnsoniqAudioPCI (апрель 1998 года).

3D-звук

Его элементы появлялись на звуковых картах уже давно, но, как правило, в реализации, аналогичной применяемой в бытовой аудиотехнике низшей ценовой категории. Это, например, расширение стереобазы (кое-кто вообще скажет, что к 3D это не имеет никакого отношения) и самые простейшие варианты Surround ("звук вокруг"). Кто бы мог подумать, что компьютерные игры простимулируют наряду с 3D-видео интерес к "настоящему" 3D-звуку, вокруг которого и развернулась борьба за передел рынка.

Борьба за первенство в 3D-звуке развернулась между двумя крепостями, первая из которых звалась A3D, а вторая - EAX. Но сначала несколько слов о самом 3D-звуке. Дело в том, что под этим термином, как правило, понимаются три различные технологии.

- Stereo Expansion (расширение стереобазы) - технология, которая увеличивает ширину звукового поля, используя избыточную информацию, содержащуюся в стереосигнале. Вариантов исполнения существует множество, из них самые известные – Sound Retrieval System (SRS) от фирмы SRS Labs и Spatializer 3-D от фирмы SpatializerLabs.

- Surround ("звук вокруг") – технология, которая использует специально закодированные данные в формате surround с целью воспроизведения нескольких звуковых каналов в их пространственной перспективе на небольшом числе реальных источников звука, к примеру, пяти звуковых каналов на двух колонках. Одна из последних реализаций технологии в компьютерной технике – CreativeMulti-SpeakerSurround (CMSS).

- Positional 3D Audio (позиционируемый 3D-звук) – технология, которая основывается на определении местоположения в трехмерном пространстве каждого из множества звуковых потоков.

Первые две технологии применяются в основном при воспроизведении музыки как на персональных компьютерах, так и на специализированной бытовой и профессиональной аудиоаппаратуре, в домашних кинотеатрах и т. п. Следует отметить, что продвинутые варианты технологии Surround широко распространены также в киноиндустрии. Третья технология прочно обосновалась в новейших компьютерных играх. В чистом виде эти технологии встречаются все реже, и в настоящее время появляется все больше реализаций 3D-звука, где они комбинируются самым причудливым образом.

Но это еще не все. Для обеспечения реализма звучания, помимо точного позиционирования источников звука необходима имитация взаимодействия звука с окружающим пространством, то есть, прежде всего, имитация звуков, отраженных от стен, пола и потолка (реверберация), прошедших через препятствие (окклюзия) и поглощенных препятствием (обструкция). Необходимо также произвести дистанционное моделирование, то есть учесть удаленность источника звука от слушателя.

Фирма Aureal выпускает прикладной интерфейс программирования (API) под названием A3D. При подготовке этой технологии Aureal опиралась на разработки лаборатории исследований компьютерного звука (ComputerAudioResearchLaboratory) университета Сан-Диего, выполненные под руководством Дика Мура (DickMoore) в начале 80-х годов. Помимо этого, фирма Aureal приобрела компанию CrystalRiver, в которой трудился Скотт Фостер (ScottFoster), в свое время по заказу NASA разработавший Convolvotron – одну из первых реализаций технологии виртуальной реальности. Второй крепостью стала технология от фирмы Creative под названием EAX (EnvironmentalAudioExtensions), расширяющая возможности прикладного интерфейса программирования (API) Microsoft Direct Sound 3D. Creative использовала результаты работ, проведенных Джоном Чоунингом (John Chowning) в Стэнфордском университете в конце 70-х годов, а также четвертьвековой опыт компании E-mu Systems, которая занималась созданием звукового оборудования для Голливуда и в марте 1993 года была приобретена фирмой Creative.

В связи с тем, что EAX не является полноценным звуковым API, так как в ней отсутствуют средства позиционирования 3D-звука (используются возможности MicrosoftDirectSound 3D, или DS3D), мы этот вопрос опустим, а более подробно поговорим о методах имитации взаимодействия звука с окружающей средой. Единственное, отметим, что при позиционировании 3D-звука в настоящее время все чаще используются бинауральные процессы обработки звука, и, как правило, это функции HRTF (HeadRelatedTransferFunction), посредством которых наши органы слуха совместно с соответствующими центрами головного мозга определяют местоположение источника звука. Качество реализации 3D-позиционирования в A3D и DS3D схожи, хотя существует мнение, что позиционирование звука в вертикальной плоскости реализовано в A3D лучше.

Так в чем же разнятся подходы Aureal и Creative к имитации взаимодействия звука с окружающей средой? Различия корнями уходят в университетскую науку США. Упомянутый выше Дик Мур разрабатывал методы, с помощью которых можно точно вычислить все необходимые параметры звука в зависимости от физических свойств среды. Джон Чоунинг пошел другим путем, и основой его метода моделирования акустической среды стал учет особенностей восприятия звука человеком. Фирма Aureal выбрала первый путь, а Creative – второй.

Реализацией подхода фирмы Aureal является технология WaveTracing, суть которой заключается в проведении анализа упрощенной геометрии окружающего пространства и расчете в режиме реального времени путей распространения звуковых волн, их отражения и поглощения в пассивных объектах акустической среды. У этой технологии есть и недостатки. Прежде всего, она по понятным причинам требует больших вычислительных ресурсов. Существуют также проблемы и с качеством, достижимым в реальных условиях. Дело в том, что алгоритмы, применяемые в WaveTracing, используют только ранние отраженные звуки, напрочь отбрасывая их рассеянные остатки (diffuse tail), играющие огромную роль в акустическом представлении пространства. И это зачастую приводит к явно слышимым артефактам.

Технология EAX от Creative использует для моделирования акустических свойств среды некую обобщенную модель (прежде всего, реверберации), при этом заранее создаются так называемые пресеты, содержащие в себе набор параметров звука для каждого типа среды. Creative руководствовалась, по-видимому, следующими соображениями. Широко известно, что в кинематографии (кстати, вспомните об опыте создания звуковых студий для Голливуда, который имеет E-mu) звук практически никогда не записывается сразу при съемках, а добавляется позже в студийных условиях. И дело не только в том, что на натуре трудно получить высокое качество. В искусстве всегда присутствует некоторая доля условности, более того, она даже необходима для увеличения степени воздействия на зрителя. Например, по замыслу режиссера необходимо, чтобы в какой-то момент на плотном звуковом фоне (шум автомобилей и т. п.) стало отчетливо слышаться тиканье часов. В жизни такого не бывает. А по сюжету фильма – надо. Естественно, звуковой фон и часы записываются отдельно, а потом сводятся воедино нужным способом. Все вышесказанное относится и к компьютерным играм, которые в своих лучших проявлениях, типа "Half-Lifе", уже относятся скорее к категории интерактивных игровых компьютерных фильмов. Раз так, то зачем заниматься расчетами путей прохождения звука в виртуальной акустической среде, когда можно, как в кинематографии, использовать заранее подготовленную высококачественную модель. Результат, утверждает Creative, не хуже, чем обеспечивает WaveTracing, а во многих случаях и лучше. Не все с этим согласны, и такой подход обычно критикуется за отсутствие интерактивности.

Справедливости ради, необходимо упомянуть компанию QSound, которая не смогла возвести свою крепость, но хорошо подготовленные позиции оборудовала. Компания предлагает целое семейство API (как полноценных, так и для очень специфических применений) под названиями Q3D, QMSS, QSoft3D, Qmixer и др., алгоритмы работы которых основываются не столько на формальных (прежде всего, математических) методах, сколько на результатах, полученных при прослушивании тестовых последовательностей звуков большим числом людей (называется цифра, превышающая 500 тысяч). Однако влияние QSound на компьютерном рынке не очень велико. Чтобы больше к фирме QSound не возвращаться, упомяну, что ее технология реализована в аудиопроцессоре VLSI Thunderbird 128 – мощном DSP, применяемом фирмой AztechLabs в звуковой плате AztechLabs PCI 386DSP.