Python: UTF-8 to CP1251

0

1

Читаю данные из экселевского документа, который написан в утф8, но дял сайта нужно перевести его в СР1251. Задача несложная, каждой строчке сделать encode(«cp1251»), но в тексте встречаются специфические утф8 символы. Хочу записать текст просто пропуская их. Можно ли как нибудь это сделать? При обычном обращении енкод выдает ошибку и программа останавливалась Самое очевидное решение это каждую строчку разбирать в цикле и если элемент не кодируется то пропускать его, но это подозрительно похоже на костыль. Есть ли в питоне что нибудь?

Ссылка

←	Конвертация ppt в swf

sed, найти строки и заменить/удалить вторую

→

Самое очевидное решение это каждую строчку разбирать в цикле и если элемент не кодируется то пропускать его, но это подозрительно похоже на костыль.

Самое очевидное — прочитать, наконец, документацию.

~~baverman~~ ★★★
(25.08.11 17:21:18 MSK)

Ответ на: комментарий от baverman 25.08.11 17:21:18 MSK

Толсто, впрочем я читал документацию. Написана она не скзаать чтобы толково. У метода encode есть второй параметр который указывает хендлдер ошибок, токо что из себя прдеставляет этот хендлер - неясно.

Nortsx
(25.08.11 17:29:04 MSK) автор топика

> дял сайта нужно перевести его в СР1251

Но почему бы сайт не перевести в utf-8? Ведь это будет правильнее.

anonymous
(25.08.11 17:52:20 MSK)

Ссылка

Ответ на: комментарий от Nortsx 25.08.11 17:29:04 MSK

См. http://docs.python.org/library/stdtypes.html#str.encode

Что они означают: http://docs.python.org/library/codecs.html#codec-base-classes

urlin
(25.08.11 18:54:26 MSK)

Ссылка

> для сайта

юзай Ӓ

visual ★★★
(26.08.11 01:08:24 MSK)

Ответ на: комментарий от visual 26.08.11 01:08:24 MSK

юзай Ӓ

visual ★★★
(26.08.11 01:13:37 MSK)

Ссылка

Ответ на: комментарий от Nortsx 25.08.11 17:29:04 MSK

Как обычно просто дать ответ все зажопили:
string.decode('u8').encode('cp1251', 'ignore') # по дефолту - 'strict' - выбрасывает ошибки, 'replace' заменяет символ на какую-то хрень, сейчас не помню. Всё есть в _нормальных_ доках.

anonymous
(26.08.11 02:18:21 MSK)

Ответ на: комментарий от anonymous 26.08.11 02:18:21 MSK

Большое спасибо! Я уже привык что сначала начинается говнополивалка а потом находится адекватный человек который и дает ответ.

Nortsx
(26.08.11 10:30:47 MSK) автор топика

Ответ на: комментарий от Nortsx 26.08.11 10:30:47 MSK

s/находится адекватный человек/приходит anonymous/

anonymous
(26.08.11 10:53:59 MSK)

Ссылка

Ответ на: комментарий от Nortsx 26.08.11 10:30:47 MSK

> Большое спасибо! Я уже привык что сначала начинается говнополивалка а потом находится адекватный человек который и дает ответ.

Это так, но пару абзацев документации прочитать было бы быстрее.)))

anonymous
(27.08.11 13:36:30 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Конвертация ppt в swf

Development

sed, найти строки и заменить/удалить вторую

→

Похожие темы