LINUX.ORG.RU

Curl, SOAP и непонятная кодировка.


0

1

Привет, сообщество!

Вопрос такой - шлю SOAP-запрос с помощью curl, ответ, который содержит русские буквы, выглядит как " СПрВ н&#x435ятНСыз". Как с таким можно бороться?

★★★★★

Последнее исправление: alozovskoy (всего исправлений: 1)

Ответ на: комментарий от alozovskoy

это юникодовские символы. iconv какой-нить, или еще чего всезнающий ол посоветует. надо подождать ;)

aol ★★★★★
()

???

$ echo '&#x421;&#x41F;&#x440;&#x412; &#x43D;&#x435;&#x44F;&#x442;&#x41D;&#x421;&#x44B;&#x437;' | perl -Mutf8 -e 'binmode STDOUT,":utf8"; while(<>){s/&#x([0-9A-F]+);/chr hex $1/ge;print}' 
СПрВ неятНСыз
AITap ★★★★★
()

да, я тут тоже поглядел повнимательнее, это какие-то не особо русские символы. но это 100% utf-символы в виде html entities

aol ★★★★★
()
Ответ на: ??? от AITap

Спасибо огромное! Сработало!!

alozovskoy ★★★★★
() автор топика
Ответ на: ??? от AITap

Кстати, это можно реализовать нагляднее? Например, через iconv? Я не смог подобрать кодировки...

alozovskoy ★★★★★
() автор топика
Ответ на: комментарий от alozovskoy

Не думаю, что это одна из известных iconv'у кодировок.

Это XML entities: «&#xYYY;» значит «unicode-символ с 16-ричным кодом YYY». Распарсить это можно каким-нибудь XML-парсером.

AITap ★★★★★
()
Ответ на: комментарий от AITap

Понятно! Еще раз огромное спасибо тебе и aol !!

alozovskoy ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.