Рис. 4.5.
a- сечение (осеcимметричной) аппаратной функции глаза человека; б - сечение (осесимметричной) частотной характеристики глаза человека.
воспринимается по логарифмическому закону. Это существенно нелинейный закон.
Другой отличительной характеристикой системы зрения человека является ее пространственночастотный отклик. Импульсный отклик глаза, рассматриваемого в виде двумерной линейной системы (т.е. линейной после начального логарифмического преобразования интенсивности наблюдаемого света), не является
- функцией Дирака. Реакция глаза на приходящее световое поле описывается аппаратной функцией, сечение которой показано на рис. 4.5, а [16]. Острый центральный пик и отрицательные боковые лепестки импульсного отклика глаза показывают, что глаз обрабатывает пространственные частоты так же, как фильтр верхних частот. Точная форма частотной характеристики глаза исследовалась с помощью ряда психовизуальных экспериментов; было показано, что глаз подавляет низкие и ослабляет высокие пространственные частоты. В грубом приближении пространственно-частотный отклик глаза имеет полосовой характер. Подобная характеристика ( рис. 4.5,б ), например, была получена в ряде экспериментов, проведенных Манносом и Сакрисоном [17].Наконец, особенностью зрения человека является способность к насыщению, т.е. к ограничению отклика при очень больших или очень малых интенсивностях наблюдаемого светового потока. Перечисленные свойства системы зрения можно описать моделью, представленной в виде блок - схемы на рис. 4.6. Однако данная модель совершенно не отражает других известных свойств системы зрения. Например, есть сведения, что некоторые стороны процесса восприятия изображения можно объяснить только наличием не одной, как на рис. 4.6, а нескольких линейных систем, включенных параллельно, т.е. в рамках модели с частотными каналами [18]. Другие визуальные явления (такие, как иллюзия одновременного контраста) указывают, что логарифмическое преобразование, введенное в блок-схеме рис. 4.6, является слишком большим упрощением. Но, несмотря на известные недостатки, модель, представленная на рис. 4.6, является полезной, поскольку она
1) объясняет ряд важных явлений, таких, как восприятие яркости света и полосы Маха;
Рис. 4.6. Блок-схема системы зрения человека.
2) указывает, что в системе зрения содержатся некоторые элементы системы обработки информации. В частности система зрения человека, по-видимому, выполняет некоторые операции гомоморфной обработки информации [19].
Полезно связать логарифмическое преобразование изображения, выполняемое глазом, с рассмотренным ранее вопросом о плотностном (и яркостном изображениях. Можно заметить, что поскольку яркость света воздействует на глаз по логарифмическому закону, глаз воспринимает изображение как плотностное, если даже оно представлено (с помощью устройства отображения) в виде яркостного изображения.
Представляется логичным воспользоваться моделями системы зрения человека при анализе возможных применений цифровой обработки изображений. Однако это делать нужно осторожно, так как система зрения человека настолько сложна, что необоснованное применение упрощенных моделей зрения может принести больше вреда, чем пользы. Манное и Сакрисон [17] доказали применимость модели зрения для исследования вопроса о сокращении избыточности изображений. Однако пока еще не определены все области возможного применения моделей зрения.
4. 3. Применение цифровой обработки для сокращения избыточности изображений
Сокращение избыточности изображений является первой областью применения цифровой обработки изображений, которая будет здесь рассмотрена. Интенсивное развитие цифровых методов повлияло на все отрасли техники передачи и хранения информации в силу присущих цифровым системам преимуществ в помехозащищенности, возможности исправления ошибок, гибкости при коммутации сообщений, постоянно понижающейся стоимости и увеличивающейся надежности. Одновременно с внедрением цифровой техники расширялось использование изображений в различных областях науки и техники, например в медицине, .экспериментальной физике, бесконтактной дефектоскопии, исследовании природных ресурсов. Такая параллельность развития цифровой техники и расширения области применения изображений привела к естественному результату, а именно к интенсивным исследованиям в области передачи ;и записи изображений цифровыми методами.
Типичное изображение содержит очень много избыточной информации, что заметно даже при беглом взгляде на большинство изображений. Эта избыточность приводит к экономическим потерям. Ширина полосы частот, необходимая для передачи изображения в цифровой форме, зависит от числа отсчетов изображения, разрядности отсчетов, времени, отведенного на передачу, и от мощности передатчика. С расширением полосы увеличиваются необходимая мощность передатчика и расходы. Деньги и энергия не являются проблемой, но электромагнитный спектр предельно загружен. Поэтому сокращение избыточности при передаче изображений является очень важной задачей. Столь же важно оно и для хранения .изображений в цифровом виде. Если бы требовалось хранить только одно изображение, то об этом можно было бы не беспокоиться. Однако во многих существующих и проектируемых системах, таких, как геологоразведочный спутник NASAERTS (EarthResourcesTechnologySatellite), получается большое количество изображений, которые целесообразно получать и хранить в цифровой форме. Хотя цифровые запоминающие устройства и становятся все дешевле, число получаемых изображений настолько увеличивается, что сокращение их избыточности является задачей первостепенной важности.
4.3.1. Некоторые замечания о сокращении избыточности изображений
Избыточность видеоинформации может быть описана функцией корреляции между отсчетами изображений; она проявляется в высокой степени взаимной статистической прогнозируемости близколежащих отсчетов, взятых из изображения. Конечной целью операции сжатия видеоинформации является устранение этой статистической прогнозируемости (т.е. необходимо в максимально возможной степени уменьшить коррелированность отсчетов). На блок-схеме рис. 4.7 показаны основные операции, выполняемые системой сжатия видеоинформации. Сначала выполняется операция по максимальному уменьшению коррелированности отсчетов изображения. Затем отсчеты должны быть соответствующим образом квантованы. Квантованные отсчеты кодируются в форму, благоприятную для передачи (при этом, конечно, может быть обеспечена возможность обнаружения или исправления ошибок) .
Квантование и кодирование выполняются с учетом общих правил, не зависящих от особенностей схемы декорреляции, выбранной для первого этапа обработки. Поэтому системы сжатия видеоинформации различаются видом схемы, выполняющей операции, относящиеся к первому этапу. В силу этого способам реализации первого блока схемы рис. 4.7 здесь будет уделено больше внимания, чем вопросам
Рис. 4.7. Блок-схема системы сокращения избыточности
видеоинформации.
построения второго и третьего блоков. Такой подход полностью соответствует замыслу данной книги, посвященной техническим применениям цифровой обработки сигналов, т.е. задачам, в основном относящимся к первому блоку.
При разработке принципов реализаций первого блока схемы рис. 4.7 следует учесть ряд соображений. Рассмотрим сначала статистические свойства изображений. Если отсчеты изображения образуют сетку точек размером N
N и каждый отсчет представлен Р - разрядным двойным числом, то при записи и передаче изображения с помощью обычной импульсно-кодовой модуляции (ИКМ) потребуется N2P двоичных разрядов. Однако, как было отмечено выше, типичное изображение имеет большую избыточность. Один из способов, позволяющих измерить эту избыточность и сравнить ее с номинальным числом N2P разрядов, заключается в построении гистограммы яркости изображения и вычислении соответствующей энтропии. С помощью Р- разрядных чисел можно описать квантованяе по 2p уровням. Для этого следует проанализировать все N2 отсчетов и подсчитать, сколько раз встречается каждый уровень квантования. Затем следует построить гистограмму яркости изображения, т.е. для каждого уровня квантования указать число его появлений в изображения. Разделив эти числа на общее число точек N2 , можно получить аппроксимацию плотности вероятности процесса, порождающего изображение. Если обозначить нормированные частоты через pi( i = 1, 2, ... , 2p ), то энтропия по определению выражается суммойh = __
(4.19)и равна средней информации (измеряемой числом бит, приходящихся на элемент изображения), содержащейся в каждом элементе изображения. Анализ изображений показал, что типичное значение h гораздо меньше числа разрядов Р, необходимого для стандартного представления с помощью ИКМ. В работе [20] отмечалось, что энтропия имеет величину порядка 1 бит/точка. Это означает, что разрядность массива, описывающего изображение, можно (хотя бы теоретически) сократить без потерь информации в среднем до 1 бит/точка.