LINUX.ORG.RU
ФорумTalks

Тролледетектор v0.0.2


0

3

по следам http://www.linux.org.ru/forum/talks/3893562
для Ъ: брался топик и отрисовывался граф сообщений, кто с кем разговаривает

в новой версии берутся все сообщения одного человека, считаются кол-во вхождений разных слов и для наиболее часто встречающихся отрисовывается облочко слов, выглядит например так:
http://img-fotki.yandex.ru/get/5803/hizel.0/0_4674d_afa30cdb_orig

сразу видно, что я freebsd-эшник

исходники: https://bitbucket.org/hizel/trololo
исполняемый файл: lor-word.py
зависимости:
dev-lang/python
dev-python/pygame
dev-python/beautifulsoup
dev-python/mechanize
dev-python/simplejson

в разаботке использовался модифицированный https://github.com/atizo/PyTagCloud

лицензионная чистота продукта не известна
чтобы по десять раз не тянуть все сообщения, на каждый уникальный nick создается файл '%s.cache' % cache

надо будет еще переделать, чтобы использовался delete_comment.jsp

★★★★★

кстати картинка от которой и пошла идея сделать такое же для ЛОР-а
http://www.ljplus.ru/img4/c/a/capossquadra/88.jpg
осторожно, 16+, это из ЖЖ сообщества ru_football

hizel ★★★★★
() автор топика
Ответ на: комментарий от lognur

>Подкрути для 3 пистона.

это в todo на последнем месте :-)

hizel ★★★★★
() автор топика
Ответ на: комментарий от Artificial_Thought

Я не могу ко 2ому прикрутить pygame. Он не видит его.

//Arch

А у компа с гентой инета нету.

lognur
()

parse 1432 comments
Traceback (most recent call last):
File "./lor-word.py", line 127, in <module>
create_image(cache, imgname)
File "./lor-word.py", line 100, in create_image
counts = get_tag_counts(content)
File «/home/jfreem/Work/projects/trololo/pytagcloud/lang/counter.py», line 25, in get_tag_counts
File «/home/jfreem/Work/projects/trololo/pytagcloud/lang/stopwords.py», line 31, in is_stop_word
LookupError: No language loaded

JFreeM ★★★☆
()
Ответ на: комментарий от hizel
$ locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
JFreeM ★★★☆
()
Ответ на: комментарий от JFreeM

>сделайте для меня пожалуйста. Ужасно интересно посмотреть.

запустил, надеюсь до 18:00 MSK успеет

hizel ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

хм, надо будет сделать вариант, который будет парсить отдельную тему ЛОРа

hizel ★★★★★
() автор топика

Чудно. Провёл анализ трёх своих ников. В середине одни и те же слова. Я таки эгоист -D

раз два три

frak
()
Ответ на: комментарий от hizel

Интересно. Это уже третий человек, у которого в центре слова «можно» и «просто». Интересно, что в центре у людей с вендофорумов? Наверное, что-то вроде «упала» и «глючит»? -D

frak
()
Ответ на: комментарий от frak

ну в качестве эксперимента хорошо бы посмотреть отличия отпечатков одного человека на разных ресурсах

hizel ★★★★★
() автор топика

PyTagCloud в том числе позволяет делать выхлоп в html, менять палитру цветов для текста, цвет фона и шрифты
не знаю почему я выбрал Ubuntu шрифт :-)

hizel ★★★★★
() автор топика
Ответ на: комментарий от hizel

спасибо. Долго ржал. Супер тулза. Картинку сохранил.

JFreeM ★★★☆
()
Ответ на: комментарий от frak

похоже эти слова для ЛОРа можно всунуть в stopwords :-\

hizel ★★★★★
() автор топика
Ответ на: комментарий от yoghurt

отчего линуксоиды совсем расслабленные? :-)
посмотрел ваш профиль, всплакнул, запустил на домашней машине, к вечеру надеюсь будет результат

hizel ★★★★★
() автор топика
Ответ на: комментарий от hizel

«сейчас пожно просто, чтобы потом спасибо». Интересное гадание получется ;-)

Благодарю за картинку.

trex6 ★★★★★
()

Посмотрел себя - основные слова «просто» и «нужно». Парсю Саныча, надеюсь успеть до 18.00

wingear ★★★★
()
...
parse 1426 comments
Traceback (most recent call last):
  File "./lor-word.py", line 127, in <module>
    create_image(cache, imgname)
  File "./lor-word.py", line 109, in create_image
    crop=False
  File "/home/sqrt/hizel-trololo-8c1d790f4fc4/pytagcloud/__init__.py", line 264, in create_tag_image
    tag_store = _draw_cloud(tags, image_surface, layout, fontname=fontname, palette=palette, fontzoom=fontzoom, rectangular=rectangular)
  File "/home/sqrt/hizel-trololo-8c1d790f4fc4/pytagcloud/__init__.py", line 230, in _draw_cloud
    currentTag = Tag(tag, (0, 0), rot, fontname=fontname, fontzoom=fontzoom)
  File "/home/sqrt/hizel-trololo-8c1d790f4fc4/pytagcloud/__init__.py", line 70, in __init__
    self.mask = self.mask.convolve(CONVMASK, None, (TAG_PADDING, TAG_PADDING))
AttributeError: convolve

ЧЯДНТ?

squareroot ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.