Харківський національний університет радіоелектроніки
Чупиков Андрій Миколайович
УДК 004.932.2:004.93’14
МОДЕЛІ МУЛЬТИГРАНИЧНОЇ СЕГМЕНТАЦІЇ ЗОБРАЖЕНЬ
05.13.23 – системи та засоби штучного інтелекту
Автореферат
дисертації на здобуття наукового ступеня
кандидата технічних наук
Харків – 2008
Дисертацією є рукопис.
Робота виконана в Харківському національному університеті радіоелектроніки, Міністерство освіти і науки України.
Науковий керівник – доктор технічних наук, професор
Машталір Володимир Петрович,
Харківський національний університет радіоелектроніки,
декан факультету комп’ютерних наук.
Офіційні опоненти: доктор технічних наук, професор
Крилов Віктор Миколайович, Григорович,
Одеський національний політехнічний університет,
професор кафедри прикладної математики та інформаційних технологій в бізнесі; Харківський нац
ух обчислювальних машин;
доктор технічних наук, професор Соколов Олександр
Шабанов-Кушнаренко Юрій Петрович, й університет
Харківський національний університет радіоелектроніки,
професор кафедри програмного забезпечення ЕОМ. .
овідна установаіональнй технічний університет України «Одеський політехнічний інститут», кафедра технчної кібернетики, Міністерство освіти і науки України, м. Одеса.
Захист відбудеться « 18 » червня 2008 р. о 1300 годині на засіданні спеціалізованої вченої ради Д 64.052.01 у Харківському національному університеті радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14.
З дисертацією можна ознайомитись у бібліотеці Харківського національного університету радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14.
Автореферат розісланий «25 »квітня 2008 р.
Вчений секретар
спеціалізованої вченої ради С.Ф. Чалий
загальна характеристика роботи
Актуальність теми. Доступність візуальної інформації у цифровій формі для корпоративних та індивідуальних користувачів, її поширення в різних видах діяльності, інтенсифікація створення та використання систем із базовим носієм інформації у вигляді зображень визначають необхідність удосконалення методів автоматичної інтерпретації відеоданих. Сучасний стан методів і засобів аналізу, перетворень та інтерпретації зображень у різних предметно-орієнтованих областях фокусує увагу на ліквідації семантичного конфлікту між результатами обробки алгоритмами низького рівня і прикладним трактуванням результатів, коли зображення трансформується в деяку семантичну конструкцію. У цьому аспекті на перший план виходять задачі достовірної сегментації зображень, тобто пошуку в полі зору однорідних (із тих або інших позицій) областей, які корелюють зі значущими об’єктами сцен. Інакше кажучи, перцептивна організація даних (грануляція, кластеризація, інкапсуляція, факторизація) і є суттю сегментації – пошуку областей носія зображення на основі заданої або формованої у процесі обробки моделі подібності.
Серед основних цілей сегментації зображень варто виділити такі: позиціонування областей на основі агрегованих ознак; врахування ознак форми цільового об’єкта та просторових відношень між різними об’єктами; створення передумов для підвищення швидкодії за рахунок виключення необхідності аналізу окремих пікселів; стиснення зображень на основі сукупностей областей, які не перетинаються, та їх яскравих та геометричних ознак, забезпечення можливостей індексації та пошуку в базах даних по змісту зображень із запитами ‘ad exemplum’.
Основний вплив на розвиток методів сегментації зображень зробили українські та зарубіжні вчені С.Г. Антощук, А.М. Ахметшин, Р.А. Воробель, В.М. Крилов, Є.П. Путятін, М.І. Шлезінгер, L. Alvarez, B.K.P. Horn, W.G. Kropatsch, A. Rosenfeld, J. Serra, J. Weіckert та ін. Аналіз стану та тенденцій розвитку методів сегментації дозволяє стверджувати, що, незважаючи на численні дослідження в цьому напрямку, задача синтезу розумних із погляду прикладної інтерпретації фактор-множин ще далека від свого остаточного розв’язання.
Таким чином, вивчення зв’язків і властивостей покриття та розбиття інформації, яка зареєстрована (діапазону півтонівё або колірних складових, наборів ознак), і продукованих покриттів та розбиттів поля зору є актуальним завданням, що забезпечує можливості інтелектуального аналізу зображень.
Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконана відповідно до плану науково-дослідних робіт Харківського національного університету радіоелектроніки в межах держбюджетних тем «Дослідження та розробка методів аналізу зображень в умовах складних перетворень» (№ ДР 0103U001572, виконавець), «Розробка моделей та методів факторизації інформації в умовах багатозначності» (№ДР 0104U004063, виконавець) та “Інтелектуальний аналіз і обробка даних у реальному часі на основі засобів обчислювального інтелекту” (№ДР 0104U003432, виконавець), що виконуються згідно з наказами Міністерства освіти і науки України за результатами конкурсного відбору проектів наукових досліджень. У межах зазначених тем здобувачем було удосконалено моделі мультиграничної сегментації півтонових зображень, а також введено та обґрунтовано методи трансформації отриманих класів еквівалентностей або їх окремих елементів.
Мета і завдання дослідження. Метою дисертаційного дослідження є розроблення математичних моделей та методів мультиграничної сегментації статичних півтонових зображень на базі аналізу класів толерантностей та еквівалентностей для синтезу алгоритмів автоматичної інтерпретації візуальної інформації у конкретних предметних областях.
Відповідно до поставленої мети дисертаційна робота передбачала розв’язання таких завдань:
– синтез, обґрунтування і дослідження моделей мультиграничної сегментації на основі зв’язків покриттів або розбиттів носія та покриттів або розбиттів області значень даних, що аналізуються;
– введення і дослідження операцій на класах еквівалентностей або толерантностей для перетворень результатів сегментації для отримання областей зображень, що інтерпретуються;
– дослідження специфіки реалізації та застосування мультиграничної сегментації, створення і впровадження дослідницьких та спеціалізованих програмних засобів.
Об’єкт дослідження – процеси обробки візуальної інформації для контекстної інтерпретації в системах технічного зору.
Предмет дослідження – моделімультиграничноїсегментації візуальної інформації для контекстної інтерпретації в системах технічного зору.
Методи дослідження – при розробці та дослідженні моделей сегментації зображень було використано математичний апарат розпізнавання образів, теорії множин та алгебри, елементи статистичного аналізу.
Наукова новизна отриманих результатів. Наукова новизна дисертації полягає у постановці та розв’язанні задачі обробки зображень для предметно-орієнтованої інтерпретації. При розв’язанні здійснюється мультигранична сегментація та контекстні перетворення класів еквівалентності або толерантності:
– отримали подальший розвиток методи сегментації зображень, які, на відміну від відомих, використовують додаткові просторові дані, що забезпечує підвищення адекватності тематичної інтерпретації;
– вперше запропоновано моделі, які, на відміну від існуючих моделей граничної сегментації, пов’язують розбиття (покриття) діапазону зміни яскравості (ознак) і розбиття (покриття) поля зору, що створює передумови для інтелектуального аналізу зображення;
– отримали подальший розвиток методи перетворень розбиттів і покриттів зображень, які, на відміну від відомих, враховують характеристики форми областей або їх множин, що приводить до підвищення валідності процедур вторинної сегментації візуальної інформації.
Практичне значення отриманих результатів. Розроблені в дисертаційній роботі моделі мультиграничної сегментації зображень, що засновані на аналізі зв’язку розбиття та покриття поля зору та області значень даних із використанням їх перетворень для пошуку раціонального прикладного трактування, можуть бути застосовані для вирішення широкого кола завдань інтерпретації зображень. Використання отриманих результатів забезпечило досить стійку автоматичну сегментацію зображень та створило передумови для оцінки подібності зображень за результатами сегментації, що дозволяє враховувати надмірність або дефіцит інформації разом з її багатозначністю на етапі тематичної інтерпретації. Синтезовані методи підтвердили свою ефективність при створенні систем медичної діагностики, зокрема в Харківському державному медичному університеті (акт про впровадження від 15.09 2007 р.), в Дорожній клінічній лікарні ст. Харків (акт про впровадження від 19.09 2007 р). Також наукові положення, висновки і рекомендації, викладені в дисертації, були використані в навчальному процесі Харківського національного університету радіоелектроніки (акт про впровадження від 24.10 2007 р).
Особистий внесок здобувача. Усі основні результати, що виносяться на захист, отримані здобувачем особисто. У роботах, опублікованих зі співавторами, здобувачу належать: у [2] – запропоновані й досліджені моделі часткової сегментації на базі зв’язку розбиттів (покриттів) областей визначення і значень даних; у [3] – проведено оцінку ефективності застосування існуючих методів сегментації для виділення областей інтересу на різних класах зображень; у [4] – формалізовані та вивчені властивості толерантностей у задачах сегментації зображень; у [5] – введенні трансформації перерізів зображень, які є класами еквівалентностей або толерантностей; у [9] – запропоноване врахування ознак форми, яке забезпечує можливості інтерпретації перетворень результатів сегментації.
Публікації. Основні результати дисертаційної роботи надруковано у 10 наукових працях, у тому числі 3 статті у виданнях, що входять до переліків, затверджених ВАК України, та 7 публікацій у збірниках праць міжнародних наукових конференцій.