LINUX.ORG.RU
 

Тролледетектор v0.0.2


0

5

по следам http://www.linux.org.ru/forum/talks/3893562
для Ъ: брался топик и отрисовывался граф сообщений, кто с кем разговаривает

в новой версии берутся все сообщения одного человека, считаются кол-во вхождений разных слов и для наиболее часто встречающихся отрисовывается облочко слов, выглядит например так:
http://img-fotki.yandex.ru/get/5803/hizel.0/0_4674d_afa30cdb_orig

сразу видно, что я freebsd-эшник

исходники: https://bitbucket.org/hizel/trololo
исполняемый файл: lor-word.py
зависимости:
dev-lang/python
dev-python/pygame
dev-python/beautifulsoup
dev-python/mechanize
dev-python/simplejson

в разаботке использовался модифицированный https://github.com/atizo/PyTagCloud

лицензионная чистота продукта не известна
чтобы по десять раз не тянуть все сообщения, на каждый уникальный nick создается файл '%s.cache' % cache

надо будет еще переделать, чтобы использовался delete_comment.jsp


[#]  

Тормозит ахтунгово. Не дождался. По коду проблем, вроде, нет. Может beautifulsoup такой неторопливый? А вот это

ALSA lib pcm.c:7316:(snd_pcm_recover) underrun occurred

Вообще из колеи выбило.

** ()
[#] Ответ на: комментарий от baverman 07.09.2011 10:23:19  

не торопится, сохраняет в файлик то что стянул и в следующий раз пропускает

>ALSA lib pcm.c:7316:(snd_pcm_recover) underrun occurred

это наверно pygame козлит :-)

***** ()
[#] Ответ на: комментарий от hizel 07.09.2011 9:26:32  
moscwich

lorparser то работает...

А граф обсуждения

./trololo.py -v http://www.linux.org.ru/view-message.jsp?msgid=3892599
генерит белую картинку 11x11

* ()
[#] Ответ на: комментарий от moscwich 07.09.2011 14:36:17  

похоже сломалось где-то между 0.0.1 и 0.0.2

***** ()
[#] Ответ на: комментарий от KRoN73 07.09.2011 14:50:29  
KRoN73

Чёрт, на ЛОРе опять формат страниц меняли, так что только первая страница показывалась. Исправил. Теперь снова показывается весь топик :)

***** ()
[#] Ответ на: комментарий от KRoN73 07.09.2011 15:07:27  

кстати, а у тебя был опыт прикручивания API к сайту?

***** ()
[#] Ответ на: комментарий от hizel 07.09.2011 15:13:39  
KRoN73

>кстати, а у тебя был опыт прикручивания API к сайту?

Ну, например вот под это: https://market.android.com/details?id=com.laserservice.maks&feature=search_r... по запросу API делал.

Но это чисто односторонний вариант, по GET запрашивалось по параметрам что нужно, возвращал XML с данными.

***** ()
[#] Ответ на: комментарий от KRoN73 07.09.2011 15:25:19  

хм, нито, нам верно надо с авторизацией

***** ()
[#] Ответ на: комментарий от hizel 07.09.2011 15:45:41  
KRoN73

>нам верно надо с авторизацией

Ну так, вариантов масса. Начиная от обычного deny all в конфиге веб сервера с allow для конкретных IP или http-авторизации, кончая нормальной полноценной авторизацией в движке :)

Вот если API как сегодня в популярных социальных сетях, с предварительной привязкой приложений и т.п. — там да, уже повозиться нужно.

***** ()
[#] Ответ на: комментарий от hizel 07.09.2011 14:42:49  
moscwich

Я хотел попробовать выследить, но нифига не понял.

Вот у lorparser'а код понятный. Я его немного подделаю, допилю и заделаю deb.

* ()
[#] Ответ на: комментарий от hizel 07.09.2011 17:34:15  
moscwich

> это не мой код, я только getopt приделал :-[
Да я понял... Может попробуешь разобраться, плз?

> тут сообщают, что в debian pygame нетъ

У меня, в ubuntu, есть.

* ()
[#] Ответ на: комментарий от dismal_faun 07.09.2011 18:31:37  

ага, припоминаю, нужна версия 1.9, а она только в experemental

***** ()
[#] Ответ на: комментарий от moscwich 07.09.2011 18:27:09  

>Может попробуешь разобраться, плз?

на выходных потыкаю

***** ()