II ОБЗОР И СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПРОГРАММ РАСПОЗНАВАНИЯ ОБРАЗОВ ACROBAT READER И ASDSee
2.1 Программы распознавания образов
В последние годы распознавание образов находит все большее применение в повседневной жизни. Распознавание речи и рукописного текста значительно упрощает взаимодействие человека с компьютером, распознавание печатного текста используется для перевода документов в электронную форму. Популярно мнение, что распознавание, как и прочие алгоритмы искусственного интеллекта, есть черная магия, недоступная простым смертным. На самом же деле алгоритмы, лежащие в основе распознавания, довольно очевидны, нужно лишь зайти чуть издалека и определиться с терминами.
Базовым является неопределимое понятие множества. В компьютере множество представляется набором неповторяющихся однотипных элементов. Слово "неповторяющихся" означает, что какой-то элемент в множестве либо есть, либо его там нет. Универсальное множество включает все возможные для решаемой задачи элементы, пустое не содержит ни одного.
В классической постановке задачи распознавания (странно называть классической науку, которой от силы несколько десятилетий универсальное множество разбивается на части-образы). Образ какого-либо объекта задается набором его частных проявлений. В случае с распознаванием текста в универсальное множество войдут все возможные знаки, в образ "Ы" - все возможные начертания этой буквы, а программа распознавания занимается тем, что на основе небольшого набора примеров начертаний каждой буквы (обучающей выборки) определяет, какую из них символизирует введенный символ.
Методика отнесения элемента к какому-либо образу называется решающим правилом. Еще одно важное понятие - метрика, способ определения расстояния между элементами универсального множества. Чем меньше это расстояние, тем более похожими являются символы, звуки - то, что мы распознаем. Обычно элементы задаются в виде набора чисел (а как еще?), а метрика - в виде функции. От выбора представления образов и реализации метрики зависит эффективность программы, один алгоритм распознавания с разными метриками будет ошибаться с разной частотой (право на ошибку для программ распознавания так же характерно, как и для людей).
Хорошо показывает принцип работы распознавания образов элементарный алгоритм на основе метода множества эталонов. На входе его имеется обучающая выборка - набор примеров A'ij для каждого образа Ai, метрика d и сам распознаваемый объект x. С помощью метрики вычисляем расстояние от x до каждого элемента обучающей выборки d(x, aij) и находим условное расстояние d(x, Ai) как расстояние от x до ближайшего элемента из Ai. Элемент x относится к образу, который окажется ближе всех.
Практически тут требуется найти минимум расстояния по каждому классу и еще раз взять минимум. Любители трогать руками могут взять в качестве представления элемента пару координат, в качестве метрики - расстояние по теореме Пифагора, и набросать программку, которая будет выполнять описанную операцию над массивом точек двухмерного пространства и отображать это в графике.
Еще один элементарный алгоритм - метод k-ближайших соседей. Как следует из названия, в нем вводится дополнительный входной параметр, целое число «k». Тут все еще проще - берется «k» ближайших к «x» элементов обучающей выборки и подсчитывается, сколько из них принадлежит к какому образу. К какому образу принадлежит больше, к тому относится и «x».
В обоих алгоритмах может возникнуть неопределенная ситуация - когда «x» будет находиться на одинаковом расстоянии от нескольких образов. В таком случае программа должна либо спросить у пользователя, к какому образу относить элемент, либо тихо бросить жребий. Это зависит от требований к точности с одной стороны, и удобству использования с другой, лучше всего реализовать оба варианта.
Несмотря на чрезвычайную простоту, описанные алгоритмы вполне применимы на практике. Существует множество других методов, более сложных, и теоретические работы по данной теме могут повергнуть в трепет своей монументальностью (кроме того, большая их часть написана на английском), но и программы на элементарных алгоритмах, толково реализованные, могут выдавать неплохие практические результаты.
2.2 Программа распознавания образов ASDSee, ее характеристика и системные требования
ACDSee – это, самая известная программа для просмотра и одна из самых мощных, позволяющих, кроме непосредственно просмотра, осуществлять и простейшие операции над изображениями - поворот, тоновую и цветовую коррекцию, кадрирование, преобразование изображения в другой формат. Переименование и конвертирование изображения возможно осуществлять сразу над несколькими изображениями.
Количество поддерживаемых форматов - одно из самых больших (более 40, включая такие относительно новые форматы, как LWF и DjVu). Причем реализован очень интересный механизм с использованием плагинов, позволяющий легко расширять возможности программы. Можно расширить как набор поддерживаемых форматов, так и дополнительных команд. Таким образом, реализована поддержка большинства графических форматов, а также расширений, подобных генерации листа миниатюр или галереи в формате HTML. Интерфейс программы классический, т.е. а-ля проводник, но, в отличие от Multimedia Xplorer, можете расположить все панели как заблагорассудится.
Одна из самых удобных и полезных характеристик программы - это генерация миниатюр. Причем есть возможность как генерировать их на лету - при каждом открытии папки с изображениями, так и кэшировать просмотренные миниатюры в собственной базе данных. Миниатюры - это очень удобно, буквально одного взгляда бывает достаточно, чтобы сориентироваться и найти необходимую фотографию.
ACD Systems - представляет собой универсальный «комбайн», который может не только упорядочить коллекцию фотографий, но и преобразовать их в другие форматы, создать веб-галерею и записать CD-диск.
ACDSee Photo Editor 2008 – это оптимальное решение для работы с цифровыми изображениями. Пользователь получает возможность превратить набор обычных семейных фотографий во что-то креативное и экстраординарное.
Также существует опция создания фотографий специально для открыток, календарей и альбомов. Photo Editor обучает пользователя, как сделать то, что ему хочется, без потери качества, как добавить такие эффекты как Lens Flare, Glowing Edges, Oil Paint.
ACDSee Pro 2008 Beta (5.0.244)
Программа для работы с цифровыми фотографиями, которая обладает расширенным набором функций, рассчитанных на профессиональных фотографов. Программа позволяет работать с RAW-изображениями, автоматически сортировать фотографии по параметрам, полученным из цифровых фотокамер, содержит эффективный визуальный метод добавления к изображениям метатегов и быструю пакетную обработку большого количества картинок, в том числе и в RAW формате. Кроме того, здесь присутствуют инструменты для независимого регулирования цветовых каналов, исправления артефактов фотографий, появляющихся из-за погрешностей оптики, добавления "водяных знаков", работы с IPTC-метаданными, имеется возможность архивирования графических коллекций в ZIP-файлы, запись на CD или DVD и многое другое.
Рисунок 2.1 – Рабочее окно программы
Таблица 2.1 - Характеристика программы ACDSee Pro 2008 Beta (5.0.244)
Разработчик | ACD Systems |
Скриншот программы | См. скриншот ACDSee Pro 2008 Beta (5.0.244) |
Статус программы | Условно-бесплатная (shareware) |
Интерфейс | Английский |
Размер файла | 71966 кб |
Система | Система |
Новая русская версия одной из лучших программ для просмотра и организации графики - цифровых фотографий и любых других картинок. С помощью ACDSee Photo Manager можно просматривать изображения порядка пятидесяти графических форматов (причем умеет программа работать и с ZIP и LHA-архивами), составлять каталоги графических файлов, создавать слайд-шоу и HTML-альбомы.
Поддерживается работа со сканерами и цифровыми камерами. Одно из крайне положительных свойств - умение на лету создавать и показывать уменьшенные копии изображений. Стоит только открыть каталог, и программа сразу начинает показывать все расположенные в нем картинки. ACDSee Photo Manager 10.0 Build 238 умеет также конвертировать изображения из одного формата в другой, а также обладает некоторыми функциями редактирования графики.
Таблица 2.2 - Характеристика программы ACDSee Photo Manager 10.0 Build 238
Год выпуска | 2007 |
Версия | v2.0.219 Final (Русская версия) |
Разработчик | ACD Systems |
Платформа | winall |
Совместимость | с Vista: полная |
Таблица 2.3 - Системные требования ASDSee 2008
Intel Pentium® III / AMD Athlon (Intel Pentium® 4 / AMD Athlon XP recommended) | |
512 MB RAM (1 GB RAM recommended) | |
100 MB free hard drive space (1 GB recommended) | |
High Color display adapter at 1024 x 768 resolution (1280 x 1024 recommended) | |
Windows® 2000, Windows® XP, and Windows Vista™ | |
Microsoft® Internet Explorer™ 5.0.0 (6.0.0 recommended) | |
Ghostscript® 8.0 | for PDF support |
Windows Media™ Player 9.0 or later | |
Язык интерфейса | только русский |
Таблетка | Присутствует |
ACDSee не нуждается в рекламе. К основным достоинствам программы следует отнести высокую скорость обработки графических данных, многопоточность, поддержку большинства известных графических форматов (в текущей версии более 40 штук), наличие удобного файл - браузера, мощных средств предварительного просмотра, функций создания слайд-шоу с упреждающим кэшированием, конвертирования изображений. ACDSee также предоставляет средства поддержки внешних плагинов, организации и управления коллекциями изображений, видео и аудио-файлов, которые программа, кстати, тоже может воспроизводить, используя QuickTime компоненты. Профессиональная версия одного из самых популярных вьюевера и конвертора графики. Вдобавок к функциям, имеющимся в стандартной версии ACDSee (каталогизация, просмотр и обработка графических изображений, воспроизведение аудио и видеофайлов, запись дисков, импорт графических изображений с камер и сканеров и многое другое) добавлены многочисленные дополнительные опции по работе с цифровыми фотографиями.