Перекодировка текстовых файлов

0

2

Доброе утро.

Нужно перекодировать эти файлы

dataparser.cpp: ISO-8859 English text, with very long lines, with CRLF line terminators
dataparser.h:   ISO-8859 English text, with CRLF line terminators
dbstruct.cpp:   ISO-8859 English text, with CRLF line terminators
dbstruct.h:     ISO-8859 English text, with CRLF line terminators
freader.cpp:    UTF-8 Unicode English text, with CRLF line terminators
freader.h:      ISO-8859 English text, with CRLF line terminators
getopt.cpp:     ISO-8859 English text, with CRLF line terminators
getopt.hpp:     ISO-8859 English text, with very long lines, with CRLF line terminators
main.cpp:       ISO-8859 English text, with CRLF line terminators
messages.hpp:   UTF-8 Unicode English text, with CRLF line terminators
misc.cpp:       ISO-8859 C program text, with CRLF line terminators
misc.h:         ISO-8859 English text, with CRLF line terminators

в читабельные. Даже не столько из-за комментариев, сколько из-за --help. Перепробовал все кодировки, которые поддерживает саблайм, ни одна не читаема.

$ iconv -f ISO-8859 -t UTF-8 dataparser.cpp dataparser.cpp.utf
iconv: преобразование из «ISO-8859» не поддерживается
Попробуйте «iconv --help» или «iconv --usage» для
получения более подробного описания.

$ iconv -t UTF-8 dataparser.cpp dataparser.cpp.utf
/******************************************************************************
ProjectName: cro2sql
FileName: dataparser.cpp 20080110
Subj: iconv: недопустимая входная последовательность в позиции 144

Перемещено JB из talks

Ссылка

← Верхний блин hdd это начало или конец диска?

Как подключится к скрытой точке доступа зная SSID →

iconv: преобразование из «ISO-8859» не поддерживается
ISO-8859

Укажи правильную кодировку
iconv -l | grep ISO-8859

PS: и почему технический вопрос в толксах? Тут такое сносят. Задай вопрос в дженерал.

imul ★★★★★
(11.07.16 10:44:15 MSK)
Последнее исправление: imul 11.07.16 10:45:39 MSK (всего исправлений: 1)

Ответ на: комментарий от imul 11.07.16 10:44:15 MSK

Как определить какая правильная? file пишет что UTF-8 Unicode English text, with CRLF line terminators, но в файле белиберда нечитаемая.

dnb ★★★★
(11.07.16 10:50:15 MSK) автор топика

Ответ на: комментарий от dnb 11.07.16 10:50:15 MSK

Как определить какая правильная?

enca

но в файле белиберда нечитаемая

google://кракозябры
Первая же картинка — https://hsto.org/storage2/61b/e7a/455/61be7a4552a6650bd19b526db63d4779.png

~~redgremlin~~ ★★★★★
(11.07.16 10:56:05 MSK)

Ответ на: комментарий от dnb 11.07.16 10:50:15 MSK

попробуй app-i18n/enca

Black_Shadow ★★★★★
(11.07.16 11:01:26 MSK)

Ссылка

Ответ на: комментарий от imul 11.07.16 10:44:15 MSK

Тут такое сносят

Да неужели?

r_asian ★☆☆
(11.07.16 11:03:13 MSK)

Ссылка

Ответ на: комментарий от dnb 11.07.16 10:50:15 MSK

Есть простейший частотный алгоритм, если такого добра много. Если вопрос в десятке файлов - можно и руками в редакторе разные варианты попробовать

r_asian ★☆☆
(11.07.16 11:04:20 MSK)

Ссылка

Ответ на: комментарий от redgremlin 11.07.16 10:56:05 MSK

По картинке нет совпадений, enca

Universal transformation format 8 bits; UTF-8
  CRLF line terminators
  Surrounded by/intermixed with non-text data
  Doubly-encoded to UTF-8 from CP1251

dnb ★★★★
(11.07.16 11:13:03 MSK) автор топика