Чем лучше парсить поток XML данных из сетевых сокетов на Perl?

0

2

Подскажите пожалуйста, при помощи каких инструментов/модулей Perl лучше всего парсить поток XML данных, получаемый из сетевых сокетов для складывания его составляющих в MySQL?

Ссылка

← Сверстал страничку, но выглядит она ужасно, как поправить?

stdin →

XML::LibXML ?

bvn13 ★★★★★
(24.02.13 22:07:57 MSK)

Ссылка

а вообще, что за «поток данных»?

bvn13 ★★★★★
(24.02.13 22:08:38 MSK)

Ответ на: комментарий от bvn13 24.02.13 22:08:38 MSK

Поток XML данных реального времени, который поступает из сетевого сокета от сервера в ответ на запросы(команды) клиента. Тоесть приложение клиент-серверное соответсвенно. Эти данные надо парсить(по-возможности на лету) и складывать в соответствии с определенными правилами в базу.

ChAnton ★★
(24.02.13 22:26:03 MSK) автор топика

Ответ на: комментарий от bvn13 24.02.13 22:08:38 MSK

А XML::Simple не подойдет?

ChAnton ★★
(24.02.13 22:26:53 MSK) автор топика

Ответ на: комментарий от ChAnton 24.02.13 22:26:53 MSK

Вам дерево данных строить, или на лету обрабатывать? Для первого - XML::LibXML, для второго - XML::Twig.

Мне один хороший человек однажды посоветовал избегать в компьютерах вещей, помеченных «Simple», «Fast» и «Easy», поскольку зачастую умеют они очень мало. Так вот, XML::Simple довольно глуп и для сложных структур не подходит.

AITap ★★★★★
(24.02.13 23:41:22 MSK)

Ответ на: комментарий от ChAnton 24.02.13 22:26:03 MSK

советую складывать все входящие данные в какой-нибудь временный файл, а потом XML::LibXML скармливать.

bvn13 ★★★★★
(25.02.13 01:39:34 MSK)

Ответ на: комментарий от AITap 24.02.13 23:41:22 MSK

избегать в компьютерах вещей, помеченных «Simple», «Fast» и «Easy», поскольку зачастую умеют они очень мало

Шindows 7 Ultimate Full Enterprize x64

anonymous
(25.02.13 01:42:29 MSK)

Ссылка

Ответ на: комментарий от AITap 24.02.13 23:41:22 MSK

Нужно парсить поток данных(желательно на лету) и складывать их по определенным признакам(тегам итд) в таблицы базы, тип(страктура) данных потока реального времени почти не меняется, меняются сами данные, вот надо их складывать в таблицы, держа начальные строки этих таблиц в самом актуальном состоянии, сдвигая наиболее устаревшие данные в конец таблиц, в реальном времени.

ChAnton ★★
(25.02.13 10:12:40 MSK) автор топика

Ответ на: комментарий от bvn13 25.02.13 01:39:34 MSK

Можно и так, но желательно «на лету». Хотя попробовать все-таки следует 2 варианта и посмотреть, что подходит больше.

ChAnton ★★
(25.02.13 10:14:29 MSK) автор топика

Ссылка

Ответ на: комментарий от ChAnton 25.02.13 10:12:40 MSK

XML::Twig как раз подходит для потока данных: http://search.cpan.org/~mirod/XML-Twig-3.42/Twig_pm.slow#Processing_an_XML_do...

Задаёте хэндлеры для полей структуры данных и запускаете $twig->parse($socket). Хэндлеры по очереди выдирают поля и кладут их в базу, после чего освобождают память.

AITap ★★★★★
(25.02.13 10:56:00 MSK)

Ответ на: комментарий от AITap 25.02.13 10:56:00 MSK

Большое спасибо. Надо попробовать.

ChAnton ★★
(25.02.13 12:36:40 MSK) автор топика

Ссылка

Если уж речь идет о реал-тайме, то может лучше посмотреть на JSON вместо XML? чтобы распарсить JSON ресурсов требуется меньше

EugeneBas ★★
(25.02.13 16:43:26 MSK)

Ответ на: комментарий от EugeneBas 25.02.13 16:43:26 MSK

Речь идет именно об XML, так как решение о формате данных принимаются за «точкой демаркации» отвественности. Грубо говоря есть сокеты, есть входящий XML, и его необходимо распарсить. Никаких JSON не предполагается и не может предполагаться. Я понимаю что удобнее)))

ChAnton ★★
(25.02.13 16:53:04 MSK) автор топика

Ответ на: комментарий от ChAnton 25.02.13 16:53:04 MSK

грусть-печаль

EugeneBas ★★
(25.02.13 16:57:42 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Сверстал страничку, но выглядит она ужасно, как поправить?

Development

stdin →

Похожие темы