Смекни!
smekni.com

«Перспективы применения ит в изучении рукописных текстов» (стр. 1 из 3)

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Выпускная работа по
«Основам информационных технологий»

Магистрант

кафедры теоретического и славянского

языкознания

Пачковская Виолетта Чеславовна

Руководители:

профессор Кожинова Алла Андреевна,

ст. преподаватель Громко Николай

Иванович

Минск – 2008 г.

Оглавление

Оглавление. 1

Реферат по теме «Перспективы применения ИТ в изучении рукописных текстов» 3

Введение. 3

Глава 1 (обзор литературы). 4

Глава 2 (существующие программы). 5

Глава 3 (пути развития). 8

Заключение. 11

Список литературы к реферату. 12

Интернет ресурсы в предметной области исследования. 13

Действующий личный сайт в WWW (гиперссылка). 14

Граф научных интересов (образец приведен ниже). 15

Список литературы к выпускной работе. 16

Предметный указатель. 17

Реферат по теме «Перспективы применения ИТ в изучении рукописных текстов»

1. Введение

Ни для кого не секрет, что на сегодняшний день довольно остро стоит проблема изучения рукописных текстов. Наряду с проблемой распознавания и записи звучащей речи, проблема распознавания и записи рукописного текста является одной из самых сложных в современных информационных технологиях. Многие ученые и информатики-любители не первый день бьются над созданием программы для перенесения текста, написанного рукою человека, в компьютер и последующей его обработки.

Мы также столкнулись с данной проблемой, хотя информатиками и не являемся. Приступая к изучению польскоязычных юридических рукописных текстов 17 века, мы пытались найти оптимальный способ перенесения текстовой информации в компьютер, однако столкнулись с рядом трудностей, главная из которых – отсутствие какой-либо компьютерной программы, которая могла бы помочь нам именно в перенесении древних текстов в электронный вид, которая облегчила бы нашу работу и сделала ее более быстрой и эффективной.

Целью данного реферата является поиск оптимального на сегодняшний день решения проблемы изучения древних рукописных текстов, а также возможных перспектив использования ИТ в данной области исследований языка. Для достижения данной цели поставлены следующие задачи:

1) изучить существующие программы и средства для распознавания текста, в том числе и рукописного;

2) познакомиться с новыми разработками и планируемыми путями решения проблемы распознавания рукописного текста

3) найти решение проблемы для применения его в собственном исследовании.

Глава 1

Изучение, первоначально, поиск информации по теме работы вызвали у нас технические трудности. Дело в том, что практически нет никаких серьезных источников, которые описывали бы современное состояние разработок. Это и понятно, ведь коммерческая тайна остается коммерческой тайной до тех пор, пока продукт не появится на рынке, и наш случай именно такой. Возможно, сегодня реально что-то создается, но пока об этом ничего не говорится. Поэтому при написании нашей работы мы вынуждены были довольствоваться только интернет-ресурсами, в частности это были рекламные сайты компаниай-разработчиков программ ABBYY FormReader, CellWriter (разработка Linux), статья из компьютерной газеты о существующих программах для распознавания текста, а также множество форумов, посвященных данной проблеме.

Начнем с рекламных сайтов. На первый взгляд все очень здорово, ABBYY FormReader обещает, что «автоматизировав ввод форм, вы в 5 раз сократите объём ручного ввода, избавив себя и свой бизнес от всех связанных с этим проблем!» [1]. Но на том же сайте, только в форуме, администратор разводит руками и говорит, что «речи об распознавании обычного текста, даже если он написан печатными буквами, здесь не идет». Русскоязычный сайт Linux предлагает писать на экране их компьютера и также ссылается на приоритетность разработок. То есть, на сайтах компаний мы ничего нового для себя не узнаем.

Что касается статьи «Программы для распознавания текстовой информации», опубликованной в «Компьютерной газете», то из нее мы получили более точную картину. В статье описываются наиболее популярные программы с ученом их удобства, стоимости и точности работы. Данная статья была использована для написания главы 2. Путем сравнения выделяются достоинства и недостатки программ.

Наиболее четкую картину того, как разворачиваются события в создании программ для распознавания рукописного текста, мы можем увидеть на тематических форумах. Из них мы узнаем, что пока нет даже теоретической базы для данных программ, есть только идеи, направления мысли, о правильности которых можно будет сказать только в будущем.

Таким образом, изучив доступную нам информацию, мы пришли к выводу, что на сегодняшний день нет решения проблемы распознавания рукописного текста, а значит, есть только перспективы использования ИТ как в нашем исследовании в частности (исследовании польскоязычных рукописных юридических текстов 17 века), так и в архивных исследованиях вообще.

Глава 2

Для распознавания текста существуют специальные OCR-программы . О них, а также о программах, использующих средства ввода, мы постараемся рассказать в данной главе.

Наиболее качественной, по мнению многих экспертов и обычных пользователей, является FineReader. Эта программа известна многим — особенно тем, у кого есть сканер. Она часто входит в комплект сканера при продаже как бонус, и, как оказывается, не зря. FineReader на сегодня считается лидером, эталоном, если хотите, распознавания текста из графических документов в текстовые. Программа способна производить сканирование документа на сканере, обращаясь к его драйверу (что весьма удобно — не нужно открывать множество окон). При распознавании в опциях FineReader следует указать язык для распознавания текста. Программа способна самостоятельно проверять орфографию и сохранять распознанную информацию в файлы форматов doc, pdf, html, sxw и др. Весь процесс — от сканирования и до распознавания — можно проводить самостоятельно вручную (для продвинутых пользователей) и с помощью мастера распознавания и перевода в автоматическом режиме (для новичков) [6]. Однако появляется много проблем, связанных с нашим исследованием и исследованием рукописного текста вообще. Во-первых, данная программа не распознает рукописный текст. Существует разновидность FineReader - ABBYY FormReader - система ввода форм, заполненных от руки или на принтере, с применением технологии ICR (Intelligent Character Recognition) [1]. Распознавание рукописного текста очень трудоемкая задача, на данный момент мы умеем распознавать только машиночитаемые формы. При этом для корректного распознавания такие формы должны удовлетворять ряду условий. Речи об распознавании обычного текста, даже если он написан печатными буквами, здесь не идет. Следует также добавить, что FormReader предназначен для обработки больших объемов однотипных документов с последующим сохранением этой информации в базу данных. Это программа предназначена для обработки информации полученной от клиентов, пользователей, сотрудников и т.п. в виде анкет, заполненных бланков, и т.п и централизованное хранение подобной информации в электронной базе данных, таким образом чтобы всегда быстро можно было поднять нужные данные. Однако данная программа также оказывается неприменимой в нашем исследовании, т.к. мы изучаем не какие-то заполненные формы, а рукописный произвольный текст, к тому же текст 17 века, язык которого мы также не можем выбрать для распознавания.

Существуют также похожие OCR-программы (SimpleOCR, CuneiForm, Recognita, Microsoft Office Document Imaging), но мы не будем более подробно на них останавливаться, т.к. их описание их различий не является необходимым для рассмотрения в нашей работе, поскольку ни одна из них не может делать того, что необходимо в нашем исследовании, а именно не может распознавать написанный ранее рукописный текст.

После знакомства с различными материалами на тему распознавания рукописного текста, заглядывания на тематические форумы у нас возникло подозрение, что на сегодняшнем уровне AI-алгоритмистики данная задача (распознавание произвольного рукописного текста) не решаема в принципе. Во всяком случае авторы всех попадавшихся нам материалов относятся к этой идее достаточно скептически.
Правда в одном из американских университетов соорудили устройство, способное распознавать рукописи на арабском. Но известно, что для арабского письма характерно довольно строгое написание кожного графического элемента, что намного упрощает последуещее его распознавание. Для кириллицы, а также для польского написания букв 17 века, которое мы встречаем в нашем исследовании, создание какого-либо похожего устройства было бы намного проблематичнее из-за широкой вариативности начертания графических элементов.

Однако, не стоит думать, что рукописный текст на сегодняшний день нельзя распознать вообще. На самом деле программы распознавания есть для устройств ввода (планшет,мышь,цифровая ручка), но есть маленькое "но": они работают только с этими устройствами, и в основном в режиме реального времени. [2]. Примером такой программы может быть CellWriter.

Разработал данную программу американский студент Майкл Левин. Вот что сообщает нам сайт компании Linux, для компьютеров которой и предназначена данная программа: «Положив в основу индивидуальную тренировку программы под каждого пользователя, Левин обошел очень важную проблему: нет двоих людей с одинаковым почерком, так что системе распознавания рукописного текста общего назначения необходимо выработать некий "наименьший общий каллиграфический знаменатель".