python string -> binary

0

0

Ситуация такая: пишется скрипт на python для обмена инфой с телефоном. При скачивании картинки телефон отправляет текстовое сообщение, в котором непосредственно изображение заключено между меток. Так вот, если создать файл outfile = open (file_name, "wb") и в него записать данные, находящиеся между меток при помощи write(), получается нечитабельный jpeg файл, к тому же чуть меньшего размера, чем должно. Чую нужно преобразовывать строку в двоичный формат, но как? Эхх, может знает кто?

Ссылка

← Использование or и блока на PERL

семафоры →

если я прально тебя понял, то тебе нужно заюзать модуль struct... в частности функции pack unpack...

anonymous
(18.02.05 17:30:17 MSK)

Ответ на: комментарий от anonymous 18.02.05 17:30:17 MSK

Но в какой тип мне паковать? Если все данные паковать struct.pack ('c', data) - на выходе получается то же самое, т.е. не то; возможно, надо паковать разные части по-разному, но как узнать, какие и в какой тип? Эх, неужто всё так сложно?

anonymous
(18.02.05 17:38:01 MSK)

Ссылка

Скорее всего, проблема не при записи, а при чтении. Читать тоже надо "rb".

K_X_XyHTA
(18.02.05 19:28:31 MSK)

Ответ на: комментарий от K_X_XyHTA 18.02.05 19:28:31 MSK

>Читать тоже надо "rb"
А тут вариант только один: в python-serial возможен единственный способ чтения из порта - port.read (), возвращающий строку.

А разве здесь нельзя провести аналогию с email - там ведь тоже сообщения пересылаются в текстовом формате, а вложения могут и двоичные файлы содержать. Может кто знает как в письме сохранить octet-stream? Что-то мне кажется, что тут похоже будет.

Самое обидное, что сохранённый файл от оригинала лишь несколькими битами отличается...

anonymous
(18.02.05 23:45:37 MSK)

Ответ на: комментарий от anonymous 18.02.05 23:45:37 MSK

атачи в письмах кодируются, обычно base64

anonymous
(19.02.05 02:17:35 MSK)

Ссылка

ты посмотри сперва что за сообщение приходит с телефона.
что значит "текстовое" -- ASCII или UTF-8 или что-то еще?
какие такие метки? почему "метка" не может случиться в середине jpeg?

строка в питоне это последовательность 8-битных беззнаковых целых.
поэтому "конвертировать строку в бинарный формат" -- бессмыслица.
это совсем не то же самое что строки в java, где строка состоит из
unicode-символов; для этого есть тип unicode.

anonymous
(19.02.05 23:31:27 MSK)

Ответ на: комментарий от anonymous 19.02.05 23:31:27 MSK

>ты посмотри сперва что за сообщение приходит с телефона. что значит "текстовое" -- ASCII или UTF-8 или что-то еще?

скорее всего, это "quoted_printable" (т.е. пропустив через этот фильтр на выходе получается то же самое, что и на входе; а есть какой-нибудь другой способ определить исходную кодировку?)

>какие такие метки? почему "метка" не может случиться в середине jpeg?

когда телефону даётся запрос на получение файла, я получаю ряд ответов формы: "+FSFR: 512, 1,кусок файла (длина должна быть равна 512 kb)#OK#" "+FSFR: size,part," и "#OK#" и есть метки; ну и навряд ли #OK# встретится в середине jpeg.

Хмм, самое интересное: побитовое сравнение оригинального файла и закаченноо с телефона показало, что при чтении с порта просто "проглатываются" определённые символы (\x11 и \x13). Причём после отключения xon/xoff control порта эти символы уже "проходят", но "съедаются" другие... Так что, скорее всего, проблема либо с модулем USB->Serial конвертера, либо с python-serial, либо с настройками порта (но с любыми настройками всё равно иногда теряются _определённые_ символы).

anonymous
(21.02.05 09:45:51 MSK)