Как преобразовать doc в xml?
Исходные данные - 600 текстов с выделенными полужирным словосочетаниями в doc формате. Для дальнейшей работы очень хочется иметь эти же данные в виде простого xml, где тегами отмечены абзацы и выделенные фрагменты.
Есть ли какой-то софт для перевода doc в xml Возможно, сможете подсказать, как можно это задачу решить (немного умею писать на java и python)?
Если сохранять сразу в xml через ворд, получается нечитаемое огромное описание версий.