Оптимизация (сжатие) – представление графической информации более эффективным способом, другими словами «выжимание воды» из данных. Требуется использовать преимущество трёх обобщённых свойств графических данных: избыточности, предсказуемости и необязательности.
Схема, подобная групповому кодированию (RLE), которая использует избыточность, говорит: «здесь три идентичных жёлтых пикселя», вместо «вот жёлтый пиксель, вот ещё один жёлтый пиксель и т. д.». Кодирование по алгоритму Хаффмана и арифметическое кодирование, основанные на статистической модели, использует предсказуемость, предполагая более короткие коды для более часто встречающихся значений пикселов. Наличие необязательных данных предполагает использование схемы кодирование с потерями («JPEG сжатие с потерями»). Например, для случайного просмотра человеческим глазом не требуется того же разрешения для цветовой информации в изображении, которая требуется для информации об интенсивности. Поэтому данные, представляющие высокое цветовое разрешение, могут быть исключены.
Сетевая графика представлена преимущественно двумя форматами файлов – GIF (Graphics Interchange Format) и JPG (Joint Photographiсs Experts Group). Оба эти формата являются компрессионными, то есть данные в них уже находятся в сжатом виде. Каждый из этих форматов имеет ряд настраиваемых параметров, позволяющих управлять соотношением качество – размер файла, влияющего на восприятие, добиваться уменьшения объёма графического файла, иногда в значительной степени. Степень сжатия графической информации в GIF не только от уровня её повторяемости и предсказуемости, но и от направления, т. к. сканирование рисунка производится построчно. JPG формата как такового не существует. В большинстве случаев это файлы форматов JFIF и JPEG – TIFF сжатые по JPEG технологиям общепринятой терминологии. Алгоритм сжатия JPEG с потерями не очень хорошо обрабатывает изображения с небольшим количеством цветов и резкими границами их перехода. Например, нарисованную в обыкновенном графическом редакторе картинку или текст. Для таких изображений более эффективным может оказаться их представление в GIF – формате. В то же время он незаменим при подготовке к web – публикации фотографий. Этот метод может восстанавливать полноцветное изображение практически неотличимое от подлинника, используя, при этом около одного бита на пиксель для его хранения. Алгоритм сжатия JPEG достаточно сложен, поэтому работает медленнее большинства других. Кроме того, к этому типу сжатия относится несколько близких по своим свойствам JPEG технологий. Основным параметром, присутствующим у всех них является качество изображения (Q – параметр) измеряемое в процентах. Размер выходного JPG – файла находится в прямой зависимости от этого параметра, т. е. при уменьшении «Q», уменьшается размер файла.
6. Видео и анимация.
Сейчас, когда сфера применения персональных компьютеров всё расширяется, возникает идея создать домашнюю видеостудию на базе компьютера. Однако, при работе с цифровым видеосигналом возникает необходимость обработки и хранения очень больших объёмов информации, например, одна минута цифрового видеосигнала с разрешением SIF (сопоставим с VHS) и цветопередачей true color (миллионы цветов) займёт (228*358) пикселов * 24 бита * 25 кадров/с * = 442 Мб, то есть на носителях, используемых в современных ПК, таких, как компакт – диск (CD – ROM, около 650 Мб) или жёсткий диск (несколько гигабайт) сохранить полноценное по времени видео, записанное, в таком формате не удастся. С помощью MPEG – сжатия объём видеоинформации можно заметно без заметной деградации изображения.
MPEG – этоаббревиатураот Moving Picture Experts Group. Эта экспертная группа работает под совместным руководством двух организаций ISO (Организация по международным стандартам) и IEC (Международная электротехническая комиссия). Официальное название группы – ISO/IEC JTCI SC 29 WG 11. Её задача – разработка единых норм кодирования аудио – и видео сигналов. Стандарты MPEG используются в технологиях CD – i CD – Video, являются частью стандарта DVD. Активно применяются в цифровом радиовещании, в кабельном и спутниковом ТВ, Интернет – радио, мультимедийных компьютерных продуктах, в коммуникациях по каналам ISDN и многих других электронных информационных системах. Часто аббревиатуру MPEG используют для ссылки на стандарты, разработанные этой группой. На сегодняшний день известны следующие:
MPEG – 1 предназначен для записи синхронизованных видеоизображений (обычно в формате SIF, 228*358) и звукового сопровождения на CD – ROM с учётом максимальной скорости считывания около 1,5 Мбит/с.
MPEG – 2 предназначен для обработки видеоизображения соизмеримого по качеству с телевизионным, при пропускной способности системы передачи данных в пределах от 3 до 15 Мбит/с, профессионалы используют и большие потоки, в аппаратуре используются потоки до 50 Мбит/с. На технологии, основанные на MPEG – 2, переходят многие телеканалы, сигнал сжатый в соответствии с этим стандартом транслируется через телевизионные спутники, используется для архивации больших объёмов видеоматериала.
MPEG – 3 предназначен для использования в системах телевидения высокой чёткости (high – defenition television, HDTV)со скоростью потока данных 20 – 40 Мбит/с, но позже стал частью стандарта MPEG – 2 и отдельно теперь не упоминается.
MPEG – 4 задаёт принципы работы с цифровым представлением медиа – данных для трёх областей: интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений и цифрового телевидения.
Как происходит сжатие? Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остаётся достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра. Исходные (Intra) кадры кодируются только с применением внутрикадрового сжатия по алгоритмам, аналогичным используемым в JPEG. Кадр разбивается на блоки 8*8 пикселов. Над каждым блоком производится дискретно – косинусное преобразование (ДКП) с последующим квантованием полученных коэффициентов. Вследствии высокой пространственной корреляции яркости между соседними пикселями изображения, ДКП приводит к концентрации сигнала и низкочастотной части спектра, который после квантования эффективно сжимается с использованием кодирования кодами переменной длины. Обработка предсказуемых (Predicted) кадров производится с использованием предсказания вперёд по предшествующим исходным или предсказуемым кадрам. Кадр разбивается на макроблоки 16*16 пикселов, каждому макроблоку ставится в соответствие наиболее похожий участок изображения из опорного кадра, сдвинутый на вектор перемещения. Эта процедура называется анализом и компенсацией движения.
Допустимая степень сжатия для предсказуемых кадров превышает возможную для исходных в 3 раза. В зависимости от характера видеоизображения, кадры двунаправленной интерполяции (Bi – directional Interpolated) кодируется одним из четырёх способов: предсказание вперёд, обратное предсказание с компенсацией движения, внутрикадровое предсказание изображения, двунаправленное предсказание при резкой смене сюжета или при высокой скорости перемещения элементов изображения. С двунаправленными кадрами связано наиболее глубокое сжатие видеоданных, но, поскольку высокая степень сжатия снижает точность восстановления исходного изображения, двунаправленные кадры не используются в качестве опорных. Если бы коэффициенты ДКП передавались точно, то восстановленное изображение полностью совпадало бы с исходным. Однако ошибки восстановления коэффициентов ДКП, связанные с квантованием, приводят к искажениям изображения. Чем грубее производится квантование, тем меньший объём занимают коэффициенты и тем сильнее сжатие сигнала, но и тем больше визуальных искажений.
7. Звук.
Возможна цифровая запись, редактирование, работа с волновыми формами звуковых данных (WAVE), а также фоновое воспроизведение цифровой музыки. Предусмотрена работа через порты MIDI. В последнее время особую популярность получил формат МР3. В его основу положены особенности человеческого слухового восприятия, отражённые в «псевдоаккустической» модели. Разработчики MPEG исходили из постулата, что далеко не вся информация, которая содержится в звуковом сигнале, является полезной и необходимой – большинство слушателей её не воспринимают. Поэтому определённая часть данных может быть сочтена избыточной. Эта «лишняя» информация удаляется без особого вреда для субъективного восприятия. Приемлемая степень «очистки2 определяется путём многократных экспертных прослушиваний. При этом стандарт позволяет в заданных пределах менять параметры кодирования – получать меньшую степень сжатия при лучшем качестве или, наоборот, идти на потери в восприятии ради более высокого коэффициента компрессии. Звуковой wav – файл, преобразованный в формат MPEG – 1 Layer III со скоростью потока в 128 Кбайт/сек, занимает в 10 – 12 раз меньше места на винчестере. На 100 – мегабайтной ZIP – дискете уменьшается около полутора часов звучания, на компакт – диске – порядка 10 часов. При кодировании со скоростью 256 Кбайт/сек на компакт – диске можно записывать около 6 часов музыки при разнице в качестве по сравнению с CD, доступной лишь тренированному экспертному уху.
8. Текст.
В руководстве Microsoft удалено особое внимание средствами ввода и обработки больших массивов текста. Рекомендуются различные методы и программы преобразования текстовых документов между различными форматами хранения, с учётом структуры документов, управляющих кодов текстовых процессоров или наборных машин, ссылок, оглавлений, гиперсвязей и т. п. , присущих исходному документу. Возможна работа и со сканированными текстами, предусмотрено использование средств оптического распознания символов.
В состав пакета разработчика Multimedia Development Kit (MDK) входят инструментальные средства (программы) для подготовки данных мультимедиа BitEdit, WaveEdit, PalEdit, FileWaik, а также MSDK - библиотеки языка С для работы со структурами данных и устройствами мультимедиа, расширения Windows 3.0 SDK.