Название: Компьютерные технологии в науке и образовании.Методические указания к практическим занятиям(Арефьев В.Н., А.Трофимова)

Жанр: Авиационные технологии и управление

Просмотров: 1349


2.5. система оптического распознавания finereader (fr)

 

FR предназначена для автоматизации ввода в ПК типографских доку- ментов. Работает в среде Windows. Обеспечивает распознавание до 99,6\% символов. Время обработке 1-й страницы <1 мин.

Главное окно системы (как и все WS - приложения) включает управ-ляющее меню, инструментальные панели и рабочее поле.Работа в FR выполняется в три этапа: сканирование, распознавание, ре-дактирование.Сканирование выполняется при физически и программно установленном сканере, регистрация которого в системе выполняется через пункт Сервис / Опции / Сканер.Для качественности распознавания перед началом работы в диалоговомокне установки сканера (пункт Scаn&Read) задаются необходимые парамет-ры: тип изображения, формат, ориентация, разрешение и яркость.Выполнение сканирования производится по команде: пункт Scаn&Read/Сканирование.После завершения процесса в рабочем окне появляются окна: "Изобра- жение", "Крупный план" и "Текст". Полученный файл для дальнейшей обра- ботки необходимо сохранить в формате FRF (пункт Файл/Сохранить как...).Распознавание, т.е. формирование системой истинного образа докумен-та, включает настройку системы на документ, разбиение документа на блоки и распознавание блоков. Настройка заключается в задании параметров распо- знавания (язык текста, тип и расположение) в диалоговых окнах Сер- вис/Опции/Распознавание и Сервис/Опции/Страница.Разбиение документа на блоки (текстовые, табличные и т.д.), т.е. зоны,ограниченные рамками с соответствующей нумерацией выполняется автома-тически или вручную командами пункта Редактор/Выделить блоки.Распознавание разделенного на блоки документа выполняется командойScаn& Read/Распознавание.Во время распознавания обработанная часть выделяется цветом в окне "Изображение", а после окончания появляется окно "Текст" с содержанием документа.Редактирование документа включает корректировку, орфографический контроль и сохранение текста. Корректировка выполняется для первичного уточнения текста командами пункта Редактор,  т.е. средствами встроенного текстового редактора.Проверка орфографии производится с помощью встроенной в FR систе- мы Lingvo Corrector, которая позволяет находить ошибки и неуверенно рас- познанные слова, корректировать ненужные пробелы и т.п. Эта операция вы- полняется через пункт Сервис/Орфография.Сохранение документа (пункт Файл/Сохранить как...)  может быть вы-полнено:для текстовых блоков - в форматах ТХТ, RTF;для таблици форм - в форматах CSV, DBF, XLS.К дополнительным возможностям FR можно отнести:1.Обучение системы  распознанию "плохих" текстов.

При хорошем полиграфическом качестве документа используется режим омнифонт (см. Сервис/Опции/Распознавание), в котором каждый символ автоматически сравнивается с имеющимся в базе данных образцами.При некачественности сканируемого документа используется распозна-вание с обучением (включается соответствующий флаг в окне "Сер- вис/Опции/Распознавание"). При этом пользователь, просматривая документ, выделяет плохо различимые символы и объявляет их названия системе, кото- рая использует их при дальнейшей работе.2. Режим  пакетной обработки.Используется при вводе больших объемов однотипных документов практически без участия пользователя. Реализуется со сканером, имеющим механизм автоподачи страниц. Включается кнопкой Scan&Read на ИП. Этот режим очень удобен для подготовки табличных файлов перед вводом их в БД.3. Распознавание форм.Обеспечивает ввод переменной информации с однотипных документов. Здесь блоки делятся на реперные (нераспознаваемые) и распознаваемые , за- тем формируется шаблон:

Фамилия

 

Группа

 

Факультет

 

Год поступления

 

Набор подобных форм обрабатывается в пакетном режиме и результаты распознавания передаются в БД.4. FR может быть встроен в интегрированный пакет Stylus Lingvo Office, реализующий законченную технологию обработки иностранных текстов: распознавание, перевод, проверка орфографии, что обеспечивает получение готового документа на необходимом языке.