Локальная сеть, с помощью которой связаны совместимые с H.323 терминалы, может быть простым сегментом, соединением по типу "кольцо" или целым набором сегментов сложной топологии соединений. Необходимо заметить, что сложность структуры сети влияет на производительность H.323-терминалов. К сожалению, рассмотрение способов, с помощью которых можно добиться нужной производительности терминалов при работе со сложными сетями, выходит за рамки рекомендации H.323.
H.323-совместимые терминалы могут быть встроены в персональные компьютеры или выполнены в виде отдельных устройств, например, видеотелефонов. Поддержка обмена звуковыми данными для них обязательна, в то время как возможность передачи цифровой информации и видеоданных является дополнительной. Однако, при использовании режима обмена видеоданными или цифровой информацией для совместной работы требуется поддержка нужного режима всеми устройствами. H.323 дает возможность одновременно передавать данные по нескольким каналам каждого типа. Среди стандартов, связанных с H.323, - рекомендации по сжатию и синхронизации H.225.0, управлению H.245, видеокодированию H.261 и H.263, аудиокодированию G.711, G.722, G.728, G.729 и G.723, а также серия коммуникационных мультимедиа-протоколов T.120.
Стандарт H.323 разработан с учетом Рекомендаций H.245, описывающих последовательность специальных процедур при открытии логического канала передачи информации. Эти процедуры, определяющие содержание логического канала, необходимы для согласования передающего устройства с приемным - таким образом, передатчик будет транслировать только ту информацию, которую способен воспринять приемник. Приемник может потребовать от передатчика ведения обмена данными в нужном ему режиме. Поскольку аналогичные процедуры, описанные стандартом H.245, предлагаются также в Рекомендациях H.310 для ATM-сетей, H.324 для GSTN и V.70, взаимодействие H.323-систем с системами на их основе возможно без преобразования H.242-H.245, как этого потребовали бы системы стандарта H.320.
Терминалы стандарта H.323 могут работать в многоточечных конфигурациях и взаимодействовать с терминалами стандарта H.310 для B-ISDN, стандарта H.320 для N-ISDN, стандарта H.321 для B-ISDN, стандарта H.322 для локальных сетей с гарантированным качеством соединения, стандарта H.324 для GSTN и беспроводных сетей и стандарта V.70 для GSTN.
Для передачи видеоизображения стандарт Н.323 требует использования стандарта Н.261.
Видеопоток стандарта Н.261.
Рекомендация ITU-T Н.261. была разработана для передачи видеоинформации при уровнях битового потока Рх64 Кбит/с, где р - может меняться от1 до 30. Стандарт включает как кодирование отдельных кадров в стиле JPRG, так и использование компенсации движения для устранения временной корреляции между кадрами. Он относится к гибридным системам сжатия в пространственной и временной областях.
Burst bandwidth assumes that the transfer of video occurs only during the active period.
Continuous bandwidth assumes entire frame time is used to transfer active video
Форматы исходных данных CIF QCIF
Формат | Разрешение | Ширина Полосы Частот | ||
Мбайт/сек (1) | Мбайт/сек (непрерывный) | |||
QCIF | 216x156 | 176x144 | 1.69 | 1.27 |
CIF | 432x312 | 352x288 | 6.74 | 5.07 |
Для того, чтобы обеспечить преобразование данных различных систем телевидения к единому стандарту, был разработан стандарт CIF (общий промежуточный стандарт). Для яркостной компоненты Y разрешение составляет 288 по вертикали и 360 пикселов по горизонтали, из которых не используется по четыре крайних пиксела с каждой стороны для обеспечения кратности 16 Используется цветовая модель - 4:2:0 с серединным расположением пикселов цветности. Для яркости используется разрешение 352х288 ( область значимых пикселов, а для обоих цветоразностных компонентов разрешение - 176х144. Используется также формат QCIF с половинным разрешением.
Частота кадров составляет 29,97 кадров/сек, но может быть и понижена до 10-15 кадров/се. Декодер должен способен рас кодировать поток с пропущенными кадрами , так. Как для увеличения сжатия предусмотрена возможность опускать при кодировании отдельные кадры вместо того, чтобы поддерживать постоянную частоту кадров.
Стандартом предусмотрено разбиение видео потока на четыре уровня:
- уровень кадров ( для CIF-формата - 352х288 пикселов, 396 макроблока, 1584 блока, 12 групп блоков):
код начала кадра ( 20 бит, 0000 0000 0000 0001 0000)
номер кадра в последовательности ( 5 бит)
тип кадра в последовательности ( 6 бит)
дополнительные данные
- уровень группы блоков (GOB) ( 176х48 пикселов, 132 блока. 33 макроблока)
код начала группы ( 16 бит , 0000 0000 0000 0001)
номер группы в кадре ( 4бита)
уровень квантования в группе ( 5 бит)
дополнительные данные
- уровень макроблока ( 16х16 пикселов, , 4 блока)
код адреса макроблока ( код переменной дилны, до11 бит)
код типа макроблока ( код переменной дины)
-уровень квантования маклоблока ( 5 бит)
код вектора движения ( код переменной длины, до 11 бит)
код присутствия данных блоков ( код переменной длины, до 9 бит)
-уровень блока ( 8х8 пикселов)
коэффициенты ДКП ( коды переменной длины, до 13 бит)
БЛОКМАКРОБЛОК (MB)
ЦВЕТОРАЗНОСТНЫЕ ЯРКОСТНЫЕ
составляющие
КАДРЫ QCIF
ГРУППА БЛОКОВ (GOB) КАДРЫ CIF
Рис. 4.
Алгоритм кодирования.
Стандарт не специализирует конкретных методов сжатия, и поиск наиболее эффективных алгоритмов сжатия является задачей разработчиков кодера. Для передачи CIF изображения по каналу (64 кбит/сек) степень сжатия должна превышать 300:1. В алгоритме кодирования можно выделить следующие этапы:
1.Входной поток подвергается предварительной обработке:
Если исходное изображение передается в виде чересстрочных полей, то из них формируются кадры с прогрессивной разверткой, кадры передискретизиуются до формата CIF или QCIF;
Производится преобразование RGB в YUV
Производится преобразование из формата цветности 4:4:4 в 4:2:0 ( горизонтальная и вертикальная поддискретизация цветоразностных компонентов).
Схема выборки 4:2:2 Схема выборки 4:2:0
- выборка только Y - выборка Y, Cb, Cr - выборка Сb, CrРис. 5.
Эта схема преобразования обычно используется для стандарта Н. 261 .
На рис.5 изображена двумерная 2:1 подвыборка цветоразностных элементов по отношению к элементам яркости. Элементы Cb и Cr не совпадают по расположению с элементами яркости, но представляют информацию о цвете для группы четырех элементов яркости, расположенных по углам квадрата. Значение Си СR обычно вычисляются 4:4:4 путем горизонтальной и вертикальной фильтрации и интерполяции. Обычно значения Cb и Cr вычисляются только для каждой второй линии элементов яркости. Т. о. Остальные линии несут только яркостную составляющю.4:2:0. Ширина полосы сигнала 4:2:0 идентична полосе сигнала 4:1:1. На рис.5 Представлен построчный видеосигнал, в котором используется только одно поле сигнала.
Для устранений возможных искажений типа появления ложных элементов на границе объектов или смещения позиции, может применяться перефильтрация низкочастотным фильтром.
2.Изображение разбивается на макроблоки , для которых находятся вектора движения. Вектора движения для макрблоков могут быть только целочисленными и по абсолютной величине не превышать 15 пикселов.
3.Находятся ошибки предсказания движения.
4.Производится анализ информации о движении и принимается решение о способе кодирования макроблока.
5.В зависимости от результатов предыдущей стадии или исходный или разностный сигнал подвергается дискретному косинусному преобразованию
6.Осуществляется квантование коэффициентов ДКС, Z- упорядочивание, и кодирование кодами переменой длины. На этом этапе необходимо строить выходной поток данных , поддерживая заданное значение битового потока, для чего требуется специальный алгоритм выбора уровня квантования коэффициентов: если заполнение буфера оказывается больше заданной пороговой величины, то уменьшается точность передачи данных.
Кодирование I- блоков.
Процедура кодирования I-блоков похода на методику кодирования неподвижных блоков стандарт JPEG. Однако в отличии от JPEG уровень квантования может быть переменным, и коэффициент квантования подбирается кодером.
Кодирование Р-блоков.
Процедура кодирования Р-блоков гораздо сложнее процедуры кодирования неподвижных блоков. Кодер должен выбрать метод кодирования макроблока. В этом случае также стандарт не предписывает какого-либо алгоритма, оставляя это на разработчиков кодера
1.Принимается решение, следует ли использовать компенсацию движения, т.к. в случае отсутствия движения используется разность между текущим макроблоками и его несмещенным базовым макроблоком ( можно считать нулевым вектором движения). Достигается экономия за счет того, что вектор движения не передается. Для этого вычисляется сумма несмещенной разности между текущим макроблоков и его базовым макроблоком ( т.е. с нулевым вектором движения) D1., и та же сумма для разности с вектором движения, D2.На основании ряда численных экспериментов была получена эмпирическая крива выбора решения. Кривая имеет сложную форму в области небольших значения разностей, т. к. любое ложное движение фона, вызванное медленным движением перемещением объекта , является крайне нежелательным эффектом. , заметно ухудшающее визуальное изображение.