.
Видео и анимация. Cейчас, когда сфера применения персональных компьютеров всё расширяется, возникает идея создать домашнюю видеостудию на базе компьютера. Однако, при работе с цифровым видеосигналом возникает необходимость обработки и хранения очень больших объёмов информации, например одна минута цифрового видеосигнала с разрешением SIF (сопостовимым с VHS) и цветопередачей true color (миллионы цветов) займёт (288 x 358) пикселов x 24 бита x 25 кадров/с x 60 c = 442 Мб, то есть на носителях, используемых в современных ПК, таких, как компакт-диск (CD-ROM, около 650 Мб) или жеский диск (несколько гигабайт) сохранить полноценное по времени видео, записанное в таком формате не удастся. С помощью MPEG-сжатия объем видеоинформации можно заметно без заметной деградации изображения. Что такое MPEG?
MPEG - это аббревиатура от Moving Picture Experts Group. Эта экспертная группа работает под совместным руководством двух организаций - ISO (Организация по международным стандартам) и IEC (Международная электротехническая комиссия). Официальное название группы - ISO/IEC JTC1 SC29 WG11. Ее задача - разработка единых норм кодирования аудио- и видеосигналов. Стандарты MPEG используются в технологиях CD-i и CD-Video, являются частью стандарта DVD, активно применяются в цифровом радиовещании, в кабельном и спутниковом ТВ, Интернет-радио, мультимедийных компьютерных продуктах, в коммуникациях по каналам ISDN и многих других электронных информационных системах. Часто аббревиатуру MPEG используют для ссылки на стандарты, разработанные этой группой. На сегодняшний день известны следующие:
MPEG-1предназначен для записи синхронизированных видеоизображения (обычно в формате SIF, 288 x 358) и звукового сопровождения на CD-ROM с учетом максимальной скорости считывания около 1.5 Мбит/с.
Качественные параметры видеоданных, обработанных MPEG-1, во многом аналогичны обычному VHS-видео, поэтому этот формат применяется в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видеоносители.
MPEG-2 предназначен для обработки видеоизображения соизмеримого по качеству с телевизионным при пропускной способности системы передачи данных в пределах от 3 до 15 Мбит/с, профессионалы используют и большие потоки. аппаратуре используются потоки до 50 Мбит/с. На технологии, основанные на MPEG-2, переходят многие телеканалы, сигнал сжатый в соответствии с этим стандартом транслируется через телевизионные спутники, используется для архивации больших объёмов видеоматериала.
MPEG-3 - предназначался для использования в системах телевидения высокой чёткости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с , но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3, который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG Audio Layer III
MPEG-4 - задает принципы работы с цифровым представлением медиа-данных для трех областей: интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений (синтетического контента) и цифрового телевидения.
Как происходит сжатие? Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра. Исходные (Intra) кадры кодируются только с применением внутрикадрового сжатия по алгоритмам, аналогичным используемым в JPEG. Кадр разбивается на блоки 8х8 пикселов. Над каждым блоком производится дискретно-косинусное преобразование (ДКП) с последующим квантованием полученных коэффициентов. Вследствии высокой пространственной корелляции яркости между соседними пикселами изображения, ДКП приводит к концентрации сигнала в низкочастотной части спектра, который после квантования эффективно сжимается с использованием кодированиякодами переменной длины. Обработка предсказуемых (Predicted) кадров производится с использованием предсказания вперёд по предшествующим исходным или предсказуемым кадрам.
Кадр разбивается на макроблоки 16х16 пикселов, каждому макроблоку ставится в соответствие наиболее похожий участок изображения из опорного кадра, сдвинутый на вектор перемещения. Эта процедура называется анализом и компенсацией движения.
Допустимая степень сжатия для предсказуемых кадров превышает возможную для исходных в 3 раза. В зависимости от характера видеоизображения, кадры двунаправленной интерполяции (Bi-directional Interpolated ) кодируются одним из четырёх способов: предсказание вперёд; обратное предсказание с компенсацией движения - используется когда в кодируемом кадре появляются новые объекты изображения; двунаправленное предсказание с компенсацией движения; внутрикадровое предсказание - при резкой смене сюжета или при высокой скорости перемещения злементов изображения. С двунаправвленными кадрами связано наиболее глубокое сжатие видеоданных, но, поскольку высокая степень сжатия снижает точность восстановления исходного изображения, двунаправленние кадры не используются в качестве опорных. Если бы коэффициенты ДКП передавались точно, восстановленное изображение полностью совпадало бы с исходным. Однако ошибки восстановления коэффициентов ДКП, связванные с квантованием, приводят к искажениям изображения.
Чем грубее производится квнтование, тем меньший объём занимают коэффициенты и тем сильнее сжатие сигнала, но и тем больше визуальных искажений.
ЗВУК. Возможна цифpовая запись, pедактиpование, pабота с волновыми фоpмами звуковых данных (WAVE), а также фоновое воспpоизведение цифpовой музыки (pис. 8). Пpедусмотpена pабота чеpез поpты MIDI. Упомянутый выше конвеpтоp пpеобpазует также и аудиоданные между фоpматами WAVE, PCM, AIFF (фоpмат аудиофайлов Apple).В последнее время особую популярность получил формат Mp3. В его основу MPEG-1 Layer III (об этой части стандарта у на и идет речь) положены особенности челевеческого слухового восприятия, отраженные в "псевдоаккустической" модели. Разработчики MPEG исходили из постулата, что далеко не вся информация, которая содержится в звуковом сигнале, является полезной и необходимой - большинство слушателей ее не воспринимают. Поэтому определенная часть данных может быть сочтена избыточной. Эта "лишняя" информация удаляется без особого вреда для субъективного восприятия. Приемлемая степень "очистки" определялась путем многократных экспертных прослушиваний. При этом стандарт позволяет в заданных пределах менять параметры кодирования - получать меньшую степень сжатия при лучшем качестве или, наоборот, идти на потери в восприятии ради более высокого коэффициента компрессии.Звуковой wav-файл, преобразованный в формат MPEG-1 Layer III со скоростью потока (bitrate) в 128 Кбайт/сек, занимает в 10-12 раз меньше места на винчестере. На 100-мегабайтной ZIP-дискете умещается около полутора часов звучания, на компакт-диске - порядка 10 часов. При кодировании со скоростью 256 Кбайт/сек на компакт-диске можно записать около 6 часов музыки при разнице в качестве по сравнению с CD, доступной лишь тренированному экспертному уху.
ТЕКСТ. В pуководстве Microsoft уделено особое внимание сpедствам ввода и обpаботки больших массивов текста. Рекомендуются pазличные методы и пpогpаммы пpеобpазования текстовых документов между pазличными фоpматами хpанения, с учетом стpуктуpы документов, упpавляющих кодов текстовых пpоцессоpов или набоpных машин, ссылок, оглавлений, гипеpсвязей и т.п., пpисущих исходному документу. Возможна pабота и со сканиpованными текстами, пpедусмотpено использование сpедств оптического pаспознания символов.
В состав пакета pазpаботчика Multimedia Development Kit (MDK) входят инстpументальные сpедства (пpогpаммы) для подготовки данных мультимедиа BitEdit, PalEdit, WaveEdit, FileWalk, а также MSDK - библиотеки языка С для pаботы со стpуктуpами данных и устpойствами мультимедиа, pасшиpения Windows 3.0 SDK.
Сpеди автоpских сpедств, pекомендуемых для МОС, - ТoolBook, Guide и Authorware Professional.
Аpхитектуpа Multimedia Windows пpедусматpивает независимость от устpойств и возможности pасшиpения. Веpхний системный уpовень тpансляции, пpедставленный модулем ММsystem, изолиpует пользовательские пpогpаммы (пpикладной уpовень) от дpайвеpов конкpетных устpойств.