Смекни!
smekni.com

Работа с документами (стр. 5 из 5)

Распознавание цвета

Раньше программы распознавания требовали только черно-белых (1-битовых) изображений в разрешениях, близких к 300ґ300 dpi. Теперь программы фирм ABBYY и Cognitive Technologies Ltd., позволяют распознавать серые и цветные изображения с разрешениями от 200 до 600 dpi. Осталось только проверить, насколько хорошо они это делают.

Для проведения данного теста мы возьмем первую страницу цветной газеты, отсканируем ее в 24-битном режиме (16,5 млн цветов) и постепенно будем уменьшать цветность. В данном тесте нас будут интересовать результаты времени распознавания и качество, а также их зависимость от количества цветов.

Теперь полученный 23-мегабайтный файл загружаем в наши программы распознавания. Сначала разбиваем его на блоки автоматическим путем. Смотрим, что у нас получилось: Fine Reader без особого труда с маленьким недочетом (упустил одну букву) определил все блоки, причем правильно, а Cuneiform 2000 опять нашел несуществующую таблицу, но в целом все остальное определил неплохо.

Переходим ко второй стадии - распознаванию. Fine Reader - 34 с, Cuneiform - 52 с! Невероятно, но факт. Fine Reader, помимо высокой скорости, еще и очень качественно распознал данную страницу (совершив всего несколько ошибок, распознав даже белый текст на черном фоне), особенно по сравнению с Cuneiform, который не смог распознать большую часть текста. Кроме того, Fine Reader вырезал картинку без примеси текста! Таких результатов от Fine Reader мы не ожидали.

Теперь понижаем цветность с 16,5 млн до 256 цветов и смотрим, изменится ли картина распознавания. Для Fine Reader ситуация с определением блоков не изменилась, а вот у другой тестируемой программы проблема - она, похоже, не нашла текст. Будем считать, что программа Cuneiform 2000 провалила данный тест. Скорость распознавания у Fine Reader изменилась в сторону уменьшения: получилось около 27 с. Да, кстати, на этот раз программа вообще не ошиблась при определении блоков.

Ну и, наконец, последнее распознавание этого же изображения в режиме 256 градаций серого. С Cuneiform 2000 опять та же проблема - не находит текст, опять провал. А вот Fine Reader не ударил в грязь лицом и спокойно распределил блоки с той же точностью. Процесс распознавания занял всего 24 с - превосходный результат!

Ну а теперь можно подвести итоги проделанной работы. Бесспорным лидером нашего теста оказался Fine Reader 5.0 Pro, который победил почти во всех тестах программу Cuneiform 2000 Master. Качество распознавания у победителя бесспорно выше, особенно при плохих оригиналах. Скорость у него не сильно отстает, а иногда и превосходит своего конкурента. Как показали последние два теста, у Fine Reader отличная система распознавания блоков и цветного изображения.

Есть, конечно, и некоторые неудобства в обеих программах: надо проверять, а иногда и исправлять распознанные блоки, при больших объемах страниц. А в общем обе программы достаточно конкурентоспособны и еще будут бороться за первое место, но на данном этапе, как видите, Fine Reader лучше.

Заключение.

В настоящее время всё больше людей используют компьютеры в повседневной жизни, даже работа с текстами проходит через машины. А программы для работы с текстом улучшаются на глазах. Написав эту работу, я делаю вывод – что следует выбирать надежность и качество при выборе ПО для каждого компьютера и ни в коем случае не спешить с этим делом.