Литмир - Электронная Библиотека

Далее нажимаем кнопку "Распознать".

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_21

Для распознавания сразу всех страниц необходимо нажать на сочетание клавиш "Ctrl+Shift+R" или нажимаете на стрелку "т", находящуюся слева от кнопки

"Распознавать", далее в ниспадающем меню выбираем "Распознать все".

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_22

• Шаг 6 (проверка после распознавания и сохранение)

Если у вас распознанный документ, то можно сохранить данные… в различные текстовые форматы. Для этого нажмите сочетание клавиш "Ctrl+S" или через меню «Файл» выберите "Сохранить страницы".

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_23

После сохранения изображения не забудьте сохранить сам проект в "пакет" (сохраняйте, если захотите продолжить проект в будущем; а также после 100 отсканированных страниц, во избежание порчи проекта). Из меню файл, выбираем пункт "Сохранить пакет как".

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_24

После чего выбираем имя и сохраняем.

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_25

Document Express Editor 6

Данная программа предназначена для создания DjVu файлов.

DjVu — графический формат, оптимизированный для хранения отсканированных документов. В частности он идеально подходит для создания электронных книг.

Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литературы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым. В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы.

РАБОТА С ПРОГРАММОЙ

• Шаг 1 (открытие файла)

Для открытия файла нажмите на иконку или сочетание клавиш "Ctrl+O", так же файл можно открыть из верхнего меню (см. рисунок).

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_26

Выберем «Тип файлов».

После чего появится диалоговое окно, в котором необходимо выбрать формат файла (в нашем случае tiff).

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_27

Мы увидим все файлы этого типа и сможем выбрать, и открыть необходимый — кнопкой «Открыть».

Файлы указанных типов получаются при сканировании странниц книг. Сканирование можно делать этой же программой, но практика показывает, что делает она это не очень быстро. Лучше воспользоваться какой-нибудь другой программой, например: VueScan, Irfan View, XnView. He следует использовать для этого программу FineReader, поскольку она неаккуратно делает выпрямление косых сканов, из-за чего на изображении появляются изломы, которые ухудшают просканированный текст.

• Шаг 2 (добавление других файлов)

Зачастую вам приходится изготавливать DjVu-файл из нескольких файлов. В этом случае при добавлении новых файлов, вам необходимо выделить страницу после (или до которой) необходимо вставить файл(ы). Для примера вставим еще один любой файл в конец проекта, для этого выделяем последний файл, как показано на рисунке.

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_28

После чего в верхнем меню выбираем "Правка" —> "Добавить страницы после", появляется окно аналогичное в 1 шаге, где вы и выбираете нужный файл.

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_29

• Шаг 3 (сохранение)

Для сохранения файла нажмите на значок или сочетание клавиш "Ctrl+S", а так же с помощью верхнее меню (см. рисунок).

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_30

После чего отмечаем: сохранять страницы "Вместе". Если у вас полная версия программы (дистрибутив более 40 Мb), то возможно распознавание текста, для этого поставьте галочку рядом с "OCR" (распознавание текста, точнее вставку текстового слоя, можно провести и с помощью программы DjvuOCR, которая работает в комплексе с программой ABBYY FineReader 7, последняя делает распознавание гораздо лучше). Далее распознавание документа будет рассмотрено более подробно в шаге 4.

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_31

Профиль сохранения: названия профиля говорит о его назначении, поэтому особой трудности вызнать это не должно. Но при неправильном выборе можно получить исходный файл плохого качества или большего размера.

Например:

"Нормальный" — в большинстве случаев можно использовать его (в основном для книг, для рукописи использовать не рекомендуется)

"Черно-белый" — выбирайте, если материал хорошего качества, и большая часть книжный текст (рекомендуется для книг и различный буклетов)

"Рукопись" — подходит для лекций и др.

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_32

Разрешение: чем выше разрешение, тем лучше исходный текст, рекомендуется выбирать 600 dpi (несмотря на то, что сканирование шло при 300 dpi).

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_33

Качество текста: в большинстве случаев лучше выбирать "почти без потерь" (если текст в исходном файле получится неудовлетворительного качества, то установите сохранение "без потерь"). Но если вы собираетесь переслать текст, например, для предварительного ознакомления, то можно поставить качество с большими потерями.

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_34

• Шаг 4 (распознавание) — необязательно

Распознавание так же возможно непосредственно в программе Document Express Editor.

Из верхнего меню: "Сервис" —> "OCR" —> "OCR документа" (также можно указать распознать при сохранении файла, см. шаг 3).

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_35

После чего пойдет процесс распознавания текста.

Интернет-журнал "Домашняя лаборатория", 2008 №2 - img_36

Если в для распознавания у вас некорректно был выбран язык распознавания (например, текст на русском языке, а распознавание производилось с учетом того, что это был английский), то в результате получится нечитаемый текст.

Для настройки языка распознавания зайдите, как показано на нижних рисунках и выберите соответствующий язык.

68
{"b":"870464","o":1}