7.2.6. Автоматизация ввода
информации в компьютер
<<Назад
|
Содержание
| Далее>>
Основным методом перевода бумажных
документов в электронную форму является сканирование. В
результате сканирования получается графическое изображение,
состоящее из точек, т.е. растровое изображение. Количество точек
определяется как размером изображения, так и разрешением
сканера.
Существуют специальные стандарты
программного интерфейса, обеспечивающего связь между сканерами и
операционной системой. Этот интерфейс основан на специальном
протоколе TWAIN.
Графический образ, получаемый после
сканирования документа, иногда необходимо перевести в текст. Для
этого используются специальные программные средства, называемые
средствами распознавания образов. Из программ, способных
распознавать текст на русском языке наиболее известной является
ABBYY Fine Reader.
Преобразование документа в электронный
вид происходит в три основных этапа. Каждый из этих этапов может
выполняться программами как автоматически, так и под контролем
пользователя.
1.
Сканирование. Запускается сканирующий модуль,
настраиваются параметры сканирования (разрешение, размер, тип
сканирования) и происходит собственно сканирование.
2.
Сегментация и распознавание текста. Прежде чем получить
готовый текст, необходимо разбить фрагменты документа на блоки
(текст, рисунок, таблица и т.д.), для того, чтобы правильно их
распознать (преобразовать в текстовый документ).
3.
Проверка орфографии и передача текстового документа в
нужное приложение для дальнейшей работы или сохранение в файл.
<<Назад
|
Содержание
| Далее>>
|