Другие языки программирования и технологии

как переделать документ djvu в doc(word)

мне очень нужно чтобы он текст распознал и можно было его исправлять
Это невозможно. Формат DjVu - это графический, а не текстовый формат. Поэтому DjVu-файлы не содержат никакой информации о структуре документа - в лучшем случае только внедрённый текстовый OCR-слой - так что информацию для подобной прямой переконвертации брать в DjVu-файле просто неоткуда.

Поэтому для создания Word'овского Doc-файла из DjVu-файла используется традиционный путь: DjVu-файл преобразуется в какой-нибудь обычный графический формат и распознаётся в ABBYY FineReader . В последних релизах ABBYY FineReader v9.0 предусмотрена прямая поддержка на чтение формата DjVu (при формировании пакета на распознавание).
Алексей Саватеев
Алексей Саватеев
265
Лучший ответ
Дамир все правильно ответил. по-хорошему, можно было бы просто приписать комментарий, а так.
OCR слой не по-хорошему, а как-раз, по-плохому. по-хорошему будет и текстовой. но безо всякой разметки. это легко обнаружить по тому, можно ли выбрать кусок именно текста, осуществлять поиск по тексту и, вообще, сохранить текст. но текст будет неразмеченный.
кстати, распознавание не такой уж плохой и заморочный способ.
Максим Эйтнер
Максим Эйтнер
50 168
переконвертировать в программе djvu-solo в jpeg, затем этот jpeg распознать в Fine Reader и сохранить в любом интересующем тебя формате
Насколько я знаю то есть один способ но очень заморочистый и долгий. Надо необходимые станицы сохранить в виде изображений и распознать с помощью FineReader.
С помощью программы ABBYY Finereader.
Djvu конвертируем с помощью DjVuDecode в tif.
Открываем tif с помощью FineReader .
Распознаем.
Сохраняем в doc.