LINUX.ORG.RU
ФорумTalks

Тролледетектор.


0

0

После скармливания скрипту

http://paste.ubuntu.com/224141/

Вот этого топика

http://www.linux.org.ru/view-message.jsp?msgid=3892599

Получаем такую картину:

http://pic.ipicture.ru/uploads/090722/21504/mIr5t2WA5U.png

Видно, что tommy проявляет активную позицию в треде, как обычно в прочем.

Кроме стандартного питоновского скрипт хочет установленный в системе w3m и питонолибу pydot.

★★★★★

Зачет! скрипт в буки.

кастую диаграмму РФВС!

k0l0b0k ★★
()
Ответ на: комментарий от Davidov

Мои регекспы и проверки — говно, я в них ничего не понимаю.

PolarFox ★★★★★
() автор топика

О, я понял, оно криво парсит забанённых.

PolarFox ★★★★★
() автор топика

http://paste.ubuntu.com/224155/

Вот, с жуткими костылями, зато не валится (:

Тред про столлмана — 16 мбайт пнгшка, мессиво из стрелочек, я не буду её выкладывать (:

Питон во время обработки начинает свопиться. Просматривалка гнома впрочем тоже не быстро запускается (:

РФВС пропускать боюсь

PolarFox ★★★★★
() автор топика
Ответ на: комментарий от zloy_buratino

Чуть менее чем дофига стрелок на JB, чуть меньше на Sherak, Sabonez и ent4jes.

PolarFox ★★★★★
() автор топика
Ответ на: комментарий от PolarFox

> Тред про столлмана — 16 мбайт пнгшка, мессиво из стрелочек, я не буду её выкладывать (:

=) ладно, сам посмотрю вечером.

zh
()
Ответ на: комментарий от Davidov

Все сообщения в главную ветку скрипт считает обращением к топикстартеру. Могу задать отключаемость этой штуки, а то в этом треде на тролля стану похож я :)

PolarFox ★★★★★
() автор топика
Ответ на: комментарий от overmind88

>ну надо же! кто бы мог подумать?!

Сам удивлён! :)

Davidov ★★★★
()
Ответ на: комментарий от PolarFox

>Все сообщения в главную ветку скрипт считает обращением к топикстартеру.

Непонятно, как различать ситуацию, когда все отвечают по теме, и когда топикстартер - тролль. Может топикстартера просто выделять другой фигурой?

Davidov ★★★★
()
Ответ на: комментарий от Davidov

Сейчас, посмотрю, может ли эта либа это делать.

А так для скрипта эти две ситуации в принципе аналогичны. Я не представляю как различить эти два случая, кроме как самому глянуть в тред.

PolarFox ★★★★★
() автор топика

Хех, забавная штукенция.

dogbert ★★★★★
()
Ответ на: комментарий от PolarFox

> Я не представляю как различить эти два случая
Лучше прошляпить десять виноватых, чем покарать одного невинного! ТС неприкосновенен!

lv ★★
()
Ответ на: комментарий от hizel

>сейчас доиграемся, макском пистон на ЛОРе зобанит ;|

хорош уже сервак досить, либо ставьте загрузку с задержкой

dimon555 ★★★★★
()
Ответ на: комментарий от dimon555

> > сейчас доиграемся, макском пистон на ЛОРе зобанит ;|

> хорош уже сервак досить, либо ставьте загрузку с задержкой

Чочо? (:

Я парсю вывод w3m, запрос которого не отличается от обычного тыка файрфоксом.

PolarFox ★★★★★
() автор топика

> http://pic.ipicture.ru/uploads/090722/21504/mIr5t2WA5U.png
> Видно, что tommy проявляет активную позицию в треде, как обычно в прочем.


Предлагаю новую забаву: "Угадай по какой теме картинка или хотя бы о чём там речь"...

http://img.flashtux.org/img1328f621b1a9x199a89ec.png
http://img.flashtux.org/img1328f621b20fxdf8770c9.png

=)

Deleted
()
Ответ на: комментарий от PolarFox

>Я парсю вывод w3m, запрос которого не отличается от обычного тыка файрфоксом.

сколько тыков в секунду?

dimon555 ★★★★★
()
Ответ на: комментарий от dimon555

> сколько тыков в секунду?

Один:

> f = os.popen("w3m -dump '%s&page=-1' -cols 200" % url)

> page=-1

Deleted
()
Ответ на: комментарий от Deleted

> > и генерация gif.

> Зачем?!

По качеству чб схема в гиф вряд ли будет чем-то отличаться. А по размеру в два раза. Я внезапно вспомнил что у меня скайлинк.

PolarFox ★★★★★
() автор топика
Ответ на: комментарий от PolarFox

сгенерь плз "экстрасенсов", посмотреть охота на схему эпичного срача.

Komintern ★★★★★
()
Ответ на: комментарий от PolarFox

8a9
> import operator
47a49,51
> ## Статистика по пользователям.
> stat = {}
> 
57a62,65
>     if stat.has_key(ansto):
>         stat[ansto] += 1
>     else:
>         stat[ansto] = 1
67a76,84
> 
> ## Выводим статистику:
> m = max(stat.values())
> for nick, score in sorted(stat.items(), key=operator.itemgetter(1),
>                           reverse=True):
>     score = score*100/m
>     if score < 50:
>         break
>     print '%s: %d%%' % (nick, score)

Davidov ★★★★
()
Ответ на: комментарий от Davidov

Выводи статистику троллости: 

davidov@theatre:~/tmp/tro$ python 3.py "http://www.linux.org.ru/view-message.jsp?msgid=3890998"
Received cookie: JSESSIONID=A5AD3157EC6A587EEB571A8285F54302
Sherak: 100%
iZEN: 72%
Cancellor: 55%
one_more_hokum: 50%

Выкладывай уже на bitbucket.org! Будем патчи писать :)

Davidov ★★★★
()
Ответ на: комментарий от hizel

> мой вариант с толстотой линий :-)

На топиках с низкостраничной структурой стрелочки под каждую красивее :)

PolarFox ★★★★★
() автор топика
Ответ на: комментарий от PolarFox

> Быдлокод всё эпичнее и эпичнее, но РФВС съел. Кстати тогда судя по всему не очень любили кнопку «ответить на это сообщение».

Я для РФВС уже свой велосипед сделал... на шелле!

$ cat trolldetect.sh 
#!/bin/sh

setel()
{
	eval "${1}_${2}=\"${3}\""
}

getel()
{
	eval "echo \${${1}_${2}}"
}

echo "digraph {"

grep -o 'id="comment-[0-9]*"\|Ответ на: <a href="view-message\.jsp?msgid=[^#]*#comment-[0-9]*"\|href="whois\.jsp?nick=[^"]*">\*' | while read l; do
	n_cid=$( echo "${l}" | sed -n 's,id="comment-\([0-9]*\)",\1,p' )
	n_replyto=$( echo "${l}" | sed -n 's,Ответ на: <a href="view-message\.jsp?msgid=[^#]*#comment-\([0-9]*\)",\1,p' )
	nick=$( echo "${l}" | sed -n 's,href="whois\.jsp?nick=\([^"]*\)">\*,\1,p' )

	[ "x${n_cid}" != "x" ] && cid="${n_cid}"
	[ "x${n_replyto}" != "x" ] && replyto="${n_replyto}"
	if [ "x${nick}" != "x" ] && [ "x${cid}" != "x" ]; then
		setel nicks "${cid}" "${nick}"
		[ "x${replyto}" != "x" ] && replyto=$( getel nicks "${replyto}" )
		if [ "x${replyto}" != "x" ]; then
			echo "    \"${nick}\" -> \"${replyto}\";"
		else
			echo "    \"${nick}\";"
		fi

		cid=""
		replyto=""
		nick=""
	fi
done

echo "}"

$ wget -O - 'http://www.linux.org.ru/view-message.jsp?msgid=307710&page=-1' | ./trolldetect.sh | dot -T png -o res.png

Вот результат: http://img.flashtux.org/img1328f621d6d5xe769837d.png

Deleted
()
Ответ на: комментарий от hizel

С толстыми линиями чем-то напоминает метастазы. Рак?

dogbert ★★★★★
()
Ответ на: комментарий от Davidov

Кстати, я так понимаю, чем больше линий исходит от чела, тем он более троллим. То есть затрачивает больше энергии в общении. Так что эти схемы могут показывать распределение пищи троллей. Хотя они никогда не выявят троллей-мастеров, которые, не стягивая внимания на себя, одной-двумя фразами, могут превратить тред в эпический :)
Ну это я к тому, что в статистике можно ещё самых троллимых отображать, плюс соотнощение вход/выход. То есть статистику саммых эффективных троллей.

lv ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.