Далее нажимаем кнопку "Распознать".
Для распознавания сразу всех страниц необходимо нажать на сочетание клавиш "Ctrl+Shift+R" или нажимаете на стрелку "т", находящуюся слева от кнопки
"Распознавать", далее в ниспадающем меню выбираем "Распознать все".
• Шаг 6 (проверка после распознавания и сохранение)
Если у вас распознанный документ, то можно сохранить данные… в различные текстовые форматы. Для этого нажмите сочетание клавиш "Ctrl+S" или через меню «Файл» выберите "Сохранить страницы".
После сохранения изображения не забудьте сохранить сам проект в "пакет" (сохраняйте, если захотите продолжить проект в будущем; а также после 100 отсканированных страниц, во избежание порчи проекта). Из меню файл, выбираем пункт "Сохранить пакет как".
После чего выбираем имя и сохраняем.
Document Express Editor 6
Данная программа предназначена для создания DjVu файлов.
DjVu — графический формат, оптимизированный для хранения отсканированных документов. В частности он идеально подходит для создания электронных книг.
Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литературы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым. В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы.
РАБОТА С ПРОГРАММОЙ
• Шаг 1 (открытие файла)
Для открытия файла нажмите на иконку или сочетание клавиш "Ctrl+O", так же файл можно открыть из верхнего меню (см. рисунок).
Выберем «Тип файлов».
После чего появится диалоговое окно, в котором необходимо выбрать формат файла (в нашем случае tiff).
Мы увидим все файлы этого типа и сможем выбрать, и открыть необходимый — кнопкой «Открыть».
Файлы указанных типов получаются при сканировании странниц книг. Сканирование можно делать этой же программой, но практика показывает, что делает она это не очень быстро. Лучше воспользоваться какой-нибудь другой программой, например: VueScan, Irfan View, XnView. He следует использовать для этого программу FineReader, поскольку она неаккуратно делает выпрямление косых сканов, из-за чего на изображении появляются изломы, которые ухудшают просканированный текст.
• Шаг 2 (добавление других файлов)
Зачастую вам приходится изготавливать DjVu-файл из нескольких файлов. В этом случае при добавлении новых файлов, вам необходимо выделить страницу после (или до которой) необходимо вставить файл(ы). Для примера вставим еще один любой файл в конец проекта, для этого выделяем последний файл, как показано на рисунке.
После чего в верхнем меню выбираем "Правка" —> "Добавить страницы после", появляется окно аналогичное в 1 шаге, где вы и выбираете нужный файл.
• Шаг 3 (сохранение)
Для сохранения файла нажмите на значок или сочетание клавиш "Ctrl+S", а так же с помощью верхнее меню (см. рисунок).
После чего отмечаем: сохранять страницы "Вместе". Если у вас полная версия программы (дистрибутив более 40 Мb), то возможно распознавание текста, для этого поставьте галочку рядом с "OCR" (распознавание текста, точнее вставку текстового слоя, можно провести и с помощью программы DjvuOCR, которая работает в комплексе с программой ABBYY FineReader 7, последняя делает распознавание гораздо лучше). Далее распознавание документа будет рассмотрено более подробно в шаге 4.
Профиль сохранения: названия профиля говорит о его назначении, поэтому особой трудности вызнать это не должно. Но при неправильном выборе можно получить исходный файл плохого качества или большего размера.
Например:
"Нормальный" — в большинстве случаев можно использовать его (в основном для книг, для рукописи использовать не рекомендуется)
"Черно-белый" — выбирайте, если материал хорошего качества, и большая часть книжный текст (рекомендуется для книг и различный буклетов)
"Рукопись" — подходит для лекций и др.
Разрешение: чем выше разрешение, тем лучше исходный текст, рекомендуется выбирать 600 dpi (несмотря на то, что сканирование шло при 300 dpi).
Качество текста: в большинстве случаев лучше выбирать "почти без потерь" (если текст в исходном файле получится неудовлетворительного качества, то установите сохранение "без потерь"). Но если вы собираетесь переслать текст, например, для предварительного ознакомления, то можно поставить качество с большими потерями.
• Шаг 4 (распознавание) — необязательно
Распознавание так же возможно непосредственно в программе Document Express Editor.
Из верхнего меню: "Сервис" —> "OCR" —> "OCR документа" (также можно указать распознать при сохранении файла, см. шаг 3).
После чего пойдет процесс распознавания текста.
Если в для распознавания у вас некорректно был выбран язык распознавания (например, текст на русском языке, а распознавание производилось с учетом того, что это был английский), то в результате получится нечитаемый текст.
Для настройки языка распознавания зайдите, как показано на нижних рисунках и выберите соответствующий язык.