LINUX.ORG.RU

Порезать RTF

 , ,


0

3

Привет ЛОР!

У меня возникла трабла с rtf файлом размером 50 мегабайт(Кто-то очень упоротый его создал). Либра такое не тянет. Можно ли такое порезать spit, или есть какой другой рецепт?


Там только текст? Форматирование сохранять нужно?

Deathstalker ★★★★★
()
Ответ на: комментарий от Woklex

картинок нет

Допустим на форматирование уходит 80%. Из 50 метров это будет 10 метров текста. Что там?

Либра зависает.

Если реально много текста, то может тупит на разбивке страниц. Лень ковырять настройки, но может её можно отменить?

PS: Именно виснет или у тебя терпения не хватает?

ziemin ★★
()
Ответ на: комментарий от CYB3R

весь текст прочитать

Если не latin-based, то ой.

frob ★★★★★
()
Ответ на: комментарий от Woklex

там просто текст

Можно попробовать catdoc. Правда выдрать текст из rtf сгенерированный либрой мне удалось только так:

catdoc file.rtf | perl -pe "s/\'3f//g" | less

arson ★★★★★
()
Ответ на: комментарий от arson

3f — это знак вопроса. На знак вопроса при сохранении оно заменяет символы, отсутствующие в кодировке сохранения (с 1252 в качестве дефолта), был такой принеприятнейший бажок, особенно злой в отношении сохранения rtf (был в сборках Инфры частично обезврежен сменой дефолта на 1251).
Так что на вашем месте очень сильно сомневался бы в полноте извлеченного текста. Если остался оригинал не в rtf, или сохраненный в rtf не ЛО, или как можно меньше раз сохраненный, стоит озаботиться его поиском.

bormant ★★★★★
()
Последнее исправление: bormant (всего исправлений: 1)
Ответ на: комментарий от bormant

3f идет через каждый символ, текст полный, озабочиваться не собираюсь т.к. это был просто тест.

arson ★★★★★
()

В google docs пробовал открыть его?

justAmoment ★★★★★
()

Ура! Я смог вчера открыть этот rtf. К сожалению ничего интересного не придумал, открыл mc office(он открывает, прсто тормозит дико минуты 2). В этом файле был не просто текст, а таблица с именами, адресами и тп. В rtf это все открывается долго, но в exel нормально идет. В итоге отец просто копировал по 1,5к строк(Всего в файле 9к строк). Как объяснили - это файл выхлоп бд. Обычно он не больших размеров, но в этом случае бд получилась большая.

Woklex
() автор топика
Ответ на: комментарий от Tigger

Спасибо большое! То что нужно.

Это намного лучше чем ms office, открывает мгновенно, скролл без проблем. Так что копирование в xls намного проще.

Woklex
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.