Другие языки программирования и технологии

Вопрос об оцифровке печатных текстов и создании электронных книг. Кто в этом понимает, подскажете технологию?

(Надеюсь, что правильно выбрала категорию. )
Имеются отсканированные страницы книги в формате BMP. Требуется создать из них файл в формате PDF или DjVu.
Какой программой это сделать? Желательно, бесплатной общедоступной! Распознавание текста не требуется.
Сканы отредактированы: обрезка, поворот, яркость, контраст. Проблема в том, что без этого редактирования обойтись невозможно!
Если не редактировать, то сканер в принципе имеет возможность сохранять изображения в формате PDF. Но это хорошо для ровненьких листов А4 размером с планшету сканера, а для книжных страниц никак не годится.
Что касается DjVu — это имеет смысл. Но книга без полноценного текстового слоя будет неудобна — нельзя произвести поиск, скопировать текст, и т. д.
DjVu в "минимальной комплектации" — это слой картинок (они у вас уже есть) . А полноценная книга имеет еще и текстовый слой.
Для создания этого слоя нужно распознать текст. И тут кроме программы FineReader посоветовать просто нечего (по качеству распознавания) . Она платная, но можно скачать пробную версию с официального сайта: http://www.abbyy.ru/finereader/
Про создание книг в этом формате есть хороший сайт: http://www.djvu-soft .narod .ru/ (пробелы перед .narod и .ru убрать) — там и программы, и приемы работы.. .На этом сайте упомянута и бесплатная программа для распознавания тестов: OpenOCR (Cuneiform) - http://openocr .org/ (пробел убрать. это "бесплатный файнридер" и есть)

В других форматах (например, PDF) без распознавания текстов делать книгу просто бессмысленно. Объем файла будет очень большой, а сама книга будет не электронной книгой в привычном понимании, а набором слайдов (для экспорта в PDF, опять же, удобен FineReader... да, платный. Но Home Edition стоит не так уж и дорого) .
Читать просто со сканированных картинок — это жутко неудобно. Даже увеличить текст при желании нельзя. Он и так "мыльный", а станет вовсе нечитабельным. Глаза будут в кучку через пару минут чтения. Распознанный текст отличается тем, что это вектор. Его можно масштабировать без ухудшения качества.
Azamat Tolegenov
Azamat Tolegenov
60 969
Лучший ответ
Виктор Гулякевич Спасибо за дельный ответ!
Ncesoft Flip Book Maker - мощная, но простая в использовании программа, позволяющая конвертировать pdf файлы в книги с возможностью перелстывания страниц, а также профессиональные фотокниги, 3d книги, детские, рождественские, новогодние, поздравительные книги с перелистыванием страниц, альбомы и видеожурналы.

При работе с Flip Book Maker вам не понадобится никаких навыков в программировании. Просто выберите нужные фотографии, затем выберите понравившийся шаблон из коллекции (например, свадебный, новогодний и т. д. ) и сохраните результат!

Основные возможности:
• Создание книги и альбома с настоящим эффектом перелистывания страниц
• Поддержка изображений, а также файлов swf, видео (flv), pdf форматов
• Сохранение резултатов в swf, html, exe, создание скринсейвера или отправка по электронной почте
• Добавление музыки
• Добавление динамических фонов
• Добавление эффектов
• Добавление названия книги
• Изменение размеров книги и т. д.

htmlDocs2fb2
htmlDocs2fb2 - Программа для конвертации документов в формате html и doc (MS Word) в формат электронных книг FictionBook версии 2.1 (fb2).

Основные характеристики:

Поддержка ресайза растровых изображений по двум заданным параметрам - максимальным ширине и высоте картинки;
Возможность конвертации html-таблиц в их растровые изображения (в формат png) в автоматическом и полуавтоматическом режимах;
Наличие поддержки вставки изображений в FB2-текст в полуавтоматическом режиме;
Сохранение файла в кодировках ansi и unicode (utf-8);
Возможность упаковки результата в zip-архив;
Наличие режима пакетной обработки;
Работает из любой директории, инсталляции не требует.
Лицензия : freeware
Текущая версия : 1.0.25 beta (21.09.10)
OS : Win 2000 / XP / Vista / 7
Языки : Английский и Русский
Cсылка для скачивания (Download): htmlDocs2fb2.zip (715 Kb)

Пpoгpaмма Natata eBook Compiler http://natata.hn3.net пpeдocтaвляет вoзмoжнocть пoльзoвaтeлям coздaвaть cвoи coбcтвeнныe элeктpoнныe книги.
Baм пpeдocтaвляeтcя вoзмoжнocть coздaть цeлocтнyю oбoлoчкy (.exe фaйл) , кoтopaя бyдeт oбъeдинять HTML-cтpaницы, DHTML, JavaScripts, VBScript, тeкcтoвыe фaйлы, гpaфикy, aнимиpoвaннyю гpaфикy фopмaтa GIF, фoтoгpaфии, звyкoвыe фaйлы и мнoгoe дpyгoe. Бесплатная.

SyBookMaker 1.1
SyBookMaker 1.1 - Программа для создания и улучшения электронных книг для использования на bookreader-устройствах. Принимает на вход файлы изображений многих популярных форматов, позволяет их повернуть и обрезать, после чего сохраняет результат обработки в PDF.
Назначение:
* Создание электронных книг в формате PDF из наборов изображений.
* Повышение качества уже существующих книг в форматах PDF, DJVU, TIFF.
* Конвертация набора изображений в PDF.
Возможности:
* Чтение картинок из файлов следующих форматов: PDF, DJVU, TIFF, JPG, PNG, GIF, BMP.
* Сохранение обработанной книги в PDF.
* Поддержка одной и двух страниц на изображении.
* Автоматический и ручной поворот страниц.
* Обрезка лишних полей страниц.
Работа с программой происходит в 4 этапа:
1. Поворот исходного изображения.
2. Разрезка изображения на страницы.
3. Обрезка страниц.
4. Поворот страниц с целью выравнивания текста.
Требования к работе программы:
* Windows XP SP2 и выше.
* .NET Framework 2.0 (обычно, он уже установлен) .
* GhostScript (если вам требуется PDF в качестве входного формата) .

Клён-библиотека 0.2.5 - Программа для создания электронных книг. Предназначена для профессионального написания и чтения электронных книг и электронных методических пособий. Она состоит из 3-х модулей: модуль редактирования книги, модуль чтения книги и модуль тестирования. Есть защита паролем каждой книжки и режима редактирования. Обладая текущими функциями, можно создать достаточно хорошую книгу для удобного чтения всем студентам и школьникам.
Виктор Гулякевич Большое спасибо!
Виктор Гулякевич Чтобы закрыть вопрос с двумя лучшими ответами, пришлось бросить монетку. :( Вместо второго ЛО - ВИП на сутки, время пошло пару минут назад. Надеюсь, Вы за воскресенье успеете воспользоваться преимуществами ВИПа. Успехов!
Fine Reader - он и отсканирует и передаст в ворд и кажется может в pdf Преобразовывать...
Если текстового слоя не требуется - самое простое бросить на печать в виртуальный принтер PDF (ряд программ есть) . Есть и виртуальный принтер DJVU.