LINUX.ORG.RU

Перекодировка текстовых файлов

 


0

2

Доброе утро.

Нужно перекодировать эти файлы

dataparser.cpp: ISO-8859 English text, with very long lines, with CRLF line terminators
dataparser.h:   ISO-8859 English text, with CRLF line terminators
dbstruct.cpp:   ISO-8859 English text, with CRLF line terminators
dbstruct.h:     ISO-8859 English text, with CRLF line terminators
freader.cpp:    UTF-8 Unicode English text, with CRLF line terminators
freader.h:      ISO-8859 English text, with CRLF line terminators
getopt.cpp:     ISO-8859 English text, with CRLF line terminators
getopt.hpp:     ISO-8859 English text, with very long lines, with CRLF line terminators
main.cpp:       ISO-8859 English text, with CRLF line terminators
messages.hpp:   UTF-8 Unicode English text, with CRLF line terminators
misc.cpp:       ISO-8859 C program text, with CRLF line terminators
misc.h:         ISO-8859 English text, with CRLF line terminators
в читабельные. Даже не столько из-за комментариев, сколько из-за --help. Перепробовал все кодировки, которые поддерживает саблайм, ни одна не читаема.

$ iconv -f ISO-8859 -t UTF-8 dataparser.cpp dataparser.cpp.utf

iconv: преобразование из «ISO-8859» не поддерживается

Попробуйте «iconv --help» или «iconv --usage» для

получения более подробного описания.

$ iconv -t UTF-8 dataparser.cpp dataparser.cpp.utf

/******************************************************************************

ProjectName: cro2sql

FileName: dataparser.cpp 20080110

Subj: iconv: недопустимая входная последовательность в позиции 144

Перемещено JB из talks

★★★★

iconv: преобразование из «ISO-8859» не поддерживается
ISO-8859

Укажи правильную кодировку
iconv -l | grep ISO-8859

PS: и почему технический вопрос в толксах? Тут такое сносят. Задай вопрос в дженерал.

imul ★★★★★ ()
Последнее исправление: imul (всего исправлений: 1)
Ответ на: комментарий от imul

Как определить какая правильная? file пишет что UTF-8 Unicode English text, with CRLF line terminators, но в файле белиберда нечитаемая.

dnb ★★★★ ()
Ответ на: комментарий от dnb

Есть простейший частотный алгоритм, если такого добра много. Если вопрос в десятке файлов - можно и руками в редакторе разные варианты попробовать

r_asian ★☆☆ ()
Ответ на: комментарий от redgremlin

По картинке нет совпадений, enca

Universal transformation format 8 bits; UTF-8
  CRLF line terminators
  Surrounded by/intermixed with non-text data
  Doubly-encoded to UTF-8 from CP1251
dnb ★★★★ ()

Если это опенсорс - то выкладывай сырцы, их тут тебе перекодируют просто из любопытства. А если нет - велкам в Job.

Deleted ()

Без образцов это какая-то игра в угадайку.

justAmoment ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.