Эти утилиты лежат на www.wvware.com. Умеют преобразовывать из word в
plain text,html,TeX. Оговорки: 1) кажется не понимают формул и валятся
на них. 2) преобразование в LaTeX с русским работает непонятным лично
для меня образом: вместо русских буковок - код в квадратных скобках.
При преобразовании в html можно ему сказать, чтобы выводил в заданной
кодировке --charset=<кодировка>.