LINUX.ORG.RU

По характерному признаку UTF8->smth8bit. Скорее всего в koi8 или cp1251, потому что в latin оно сверкает Đ.

PolarFox ★★★★★
()
Ответ на: комментарий от PolarFox

а поподробнее? когда я в браузере вручную выбираю кодировку, ни UTF-8, ни KOI-8r, ни CP1251 не работают - выводятся кракозябры.

opensuse
() автор топика
Ответ на: комментарий от opensuse

Изначально оригинал был в двухбайтной кодировке. Потом его походу перевели (методом dd) в однобайтную и подали. Просмотр в виде утф8 скорее всего ничего не даст. В общем тестовые прогоны iconv делай.

PolarFox ★★★★★
()
Ответ на: комментарий от PolarFox

а возможно как-то просматривать текст в браузере, не сохраняя его в файл и не перекодируя?

opensuse
() автор топика

Пиши вебмастеру, чтобы правильно настроил апач :)

Мне, чтобы быстро прочитать содержимое такой страницы, помогает что-нибудь вроде

echo 'непонятный текст' | iconv -f utf8 -t cp1251 | less

или

echo 'непонятный текст' | iconv -c -f utf8 -t cp1251 | less

И получается текст в UTF-8

Иногда вместо cp1251 нужно ставить koi8-r, cp1250, cp1252, iso-8859-1, iso-8859-5...

less нужен на случай появления в выходном потоке управляющих символов.

question4 ★★★★★
()
Ответ на: комментарий от question4

спасибо!

//там не апач, а icecast. кириллические названия треков выводит коряво.

opensuse
() автор топика
Ответ на: комментарий от opensuse

Если интересно, то точно так же выглядит страничка на UTF-8, если её загнать на narod.ru, который отдаёт её как cp1251.

lyset ★★★
()

[анабиоз]

[boris@breton ~]$ echo PёP½P¾P>test
[boris@breton ~]$ enca test
Universal transformation format 8 bits; UTF-8
Doubly-encoded to UTF-8 from ISO-8859-5

Breton
()
Ответ на: комментарий от opensuse

В Дебиан /usr/lib/enca - из пакета libenca0, от которого зависит пакет enca.

Xenesz ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.