LINUX.ORG.RU
ФорумTalks

[мерка]давайте меряться результатами поисковых запросов


0

1

http://pastebin.com/4vyJg0Rf

Скрипт делает поиск через гугло-api и печатает непосредственно количество результаов поиска. Параметр --site — необязательный, добавляет в запрос site:arg. Есть ещё параметр --summary, который напечатает несколько первых результатов поиска. Запускаем так:

$ ./ruler.pl --site linux.org.ru ruby perl python java javascript
Searching site linux.org.ru
java => 33300
python => 21100
perl => 19800
javascript => 8000
ruby => 6780
$ ./ruler.pl --site linux.org.ru gnome kde xfce lxde openbox fluxbox awesome
Searching site linux.org.ru
kde => 62900
gnome => 48800
xfce => 11400
fluxbox => 7060
openbox => 6740
awesome => 3960
lxde => 2150
$

Мне тоже показалось странным, что если искать через сайт google.com, то количество результатов будет отличаться, но при померке ведь главное — это пользоваться одной линейкой, так что всё норм.

Можно придумывать, чего бы погуглить и потом гордиться результатами.

★★

$ ./ruler.pl --summary 'linux глючит' 'linux рулит'
68800 results for query [linux+глючит]
most recent results: 
[*] А по Вашему Linux глючит меньше чем windows? - есть ответ ... [http://otvety.google.ru/otvety/thread?tid=0d3c6fc67d5f6116]
[*] Форум - Linux-hardware - Мышка глючит [http://www.linux.org.ru/forum/linux-hardware/29951]
[*] CentOS 5.6 Xen глючит xm console (Страница 1) — Red Hat Linux ... [http://linuxforum.ru/viewtopic.php?id=14864]
[*] глючит второй икс сервер с дровами fglrx AMD • Русскоязычное ... [http://archlinux.org.ru/forum/viewtopic.php?f=18&t=6309]
31600 results for query [linux+рулит]
most recent results: 
[*] こんにちは! Линукс рулит! А как (без переустановки ОС) вводить ... [http://otvety.google.ru/otvety/thread?tid=013eb38197fee5c1]
Wide character in print at ./ruler.pl line 41.
[*] инÑÐºÑ Ð ÑÐ»Ð¸Ñ Ubuntu forever - YouTube [http://www.youtube.com/watch?v=5-Pb257GNyU]
[*] Линукс рулит | Мои записки [http://vasiliystoleicov.ru/tag/linuks-rulit]
[*] Форум - General - Линукс рулит, а как из под винды ? [http://www.linux.org.ru/forum/general/6470707]
linux+глючит => 68800
linux+рулит => 31600
name_no ★★
() автор топика
Ответ на: комментарий от Un

показать всем, что что-то одно популярнее другого. Для этого нередко применяют метод: «что-то одно: 5000000 результатов в гугле, другое: 20 результатов в гугле».

Из примера в первом каментарии можно сделать вывод, что линукс глючит в два раза больше, чем рулит. При чём рулит почему-то именно убунта.

$ ./ruler.pl 'ubuntu рулит' 'debian рулит' 'gentoo рулит' 'arch рулит' 'slackware рулит' 'red hat рулит'
ubuntu+рулит => 8970
debian+рулит => 3860
arch+рулит => 3210
gentoo+рулит => 2380
red+hat+рулит => 1670
slackware+рулит => 1140
name_no ★★
() автор топика
Ответ на: комментарий от name_no

Хотя, глючит тоже именно она:

$ ./ruler.pl 'ubuntu глючит' 'debian глючит' 'gentoo глючит' 'arch глючит' 'slackware глючит' 'red hat глючит' 
ubuntu+глючит => 19000
red+hat+глючит => 15300
debian+глючит => 7200
gentoo+глючит => 4200
arch+глючит => 3890
slackware+глючит => 2330
name_no ★★
() автор топика

Ну и что за ...., почему текст копируется вместе с этими идиотскими номерами строк?

Un
()
Ответ на: комментарий от name_no

Отсюда делаем вывод об удовлетворённости дибустрибутивом:

gentoo        2380    4200      0.567
slackware     1140    2330      0.489
ubuntu        8970    19000     0.472
debian        3210    7200      0.446
arch          1670    3890      0.429
redhat        3860    15300     0.252
Sadler ★★★
()
Ответ на: комментарий от Sadler

Отсюда делаем вывод об удовлетворённости дибустрибутивом:

Ты что-то скосил. Я вижу
arch+рулит => 3210
arch+глючит => 3890
в своих результатах, то есть у арча удовлетворённость самая высокая, почти единица.

name_no ★★
() автор топика
frag@nona /media/home/frag/Trash $ ./search.pl 'arch помойка'
Can't locate JSON.pm in @INC (@INC contains: /etc/perl /usr/lib64/perl5/site_perl/5.12.4/x86_64-linux /usr/lib64/perl5/site_perl/5.12.4 /usr/lib64/perl5/vendor_perl/5.12.4/x86_64-linux /usr/lib64/perl5/vendor_perl/5.12.4 /usr/lib64/perl5/site_perl /usr/lib64/perl5/vendor_perl/5.12.3/x86_64-linux /usr/lib64/perl5/vendor_perl/5.12.3 /usr/lib64/perl5/vendor_perl /usr/lib64/perl5/5.12.4/x86_64-linux /usr/lib64/perl5/5.12.4 /usr/local/lib/site_perl .) at ./search.pl line 5.
BEGIN failed--compilation aborted at ./search.pl line 5.
Un
()
Ответ на: комментарий от name_no

> в своих результатах, то есть у арча удовлетворённость самая высокая, почти единица.

Ой, блин. Вот что значит спросони.

Sadler ★★★
()

А ты, кстати, знаешь, что если в результатах поиска перейти на страницу этак тридцатую-сороковую (или дальше), то количество этих самых результатов вдруг резко уменьшается?

SoulThreads
()
Ответ на: комментарий от Un

Can't locate JSON.pm

Можно переписать на жабаскрипте, но вы ж не позволите ))) Гугол возвращает результат в JSON, извини ((( Если что, вот он: http://pastebin.com/R59BgkfP или из CPAN’а

name_no ★★
() автор топика
Ответ на: комментарий от SoulThreads

71-я страница. «Результатов ппоиска, примерно 1 270 000», как и на первой странице. И предложение показать их все.

name_no ★★
() автор топика
frag@nona /media/home/frag/Trash $ ./search.pl 'arch помойка'
arch+помойка => 1360
frag@nona /media/home/frag/Trash $ ./search.pl 'gentoo помойка'
gentoo+помойка => 730
frag@nona /media/home/frag/Trash $ ./search.pl 'фрактал гений'
фрактал+гений => 19500
frag@nona /media/home/frag/Trash $ ./search.pl 'фрактал идиот'                                                                          
фрактал+идиот => 4260
Un
()
Ответ на: комментарий от Sadler

Fixed

Я раньше реально думал, что на первом месте будет debian. Или red hat. Ну, понятно, что никто не пойдёт писать в интернеты «red hat рулит», но всё-таки, он глючит почти как убунта :-)

name_no ★★
() автор топика
Ответ на: комментарий от Un
./search.pl 'фрактал гений'
фрактал+гений => 19500

Это win, я считаю :-D

name_no ★★
() автор топика
Ответ на: комментарий от name_no

> red hat рулит

глючит почти как убунта

Не накручивай мне тут голосов! :)

Sadler ★★★
()
Ответ на: комментарий от Un

Ну, кроме меня некому опровергнуть:

$ ./ruler.pl --site linux.org.ru --summary 'фрактал гений' 'фрактал идиот'
Searching site linux.org.ru
38 results for query [фрактал+гений]
most recent results: 
[*] Форум - Talks - Звезда взошла на горизонте, сверхновой станет вот-вот [http://www.linux.org.ru/forum/talks/6585945]
[*] Форум - Talks - Звезда взошла на горизонте, сверхновой станет вот-вот [https://www.linux.org.ru/forum/talks/6585945/page1?lastmod=1312784177883]
[*] Форум - Talks - ЛОРовцы и музыка . [http://www.linux.org.ru/view-message.jsp?msgid=5983759&page=3&filter=show]
[*] Форум - Talks - а у животных бывают неврозы? [http://www.linux.org.ru/jump-message.jsp?msgid=5072508&cid=5074292]
64 results for query [фрактал+идиот]
most recent results: 
[*] Галерея - Скриншоты - Почти фрактал. [http://www.linux.org.ru/gallery/screenshots/422805]
[*] Форум - Talks - [непонятки] А за что Fracta1La забанили? [http://www.linux.org.ru/forum/talks/5176158/page2]
[*] Форум - Talks - Предлагаю новую игру - лороквэйк или охота на флауэрса [http://www.linux.org.ru/view-message.jsp?msgid=6216273&page=0&filter=anonymous]
[*] Форум - Talks - [непонятки] А за что Fracta1La забанили? [http://www.linux.org.ru/forum/talks/5176158/page3]
фрактал+идиот => 64
фрактал+гений => 38

И по всему интернету:

$ ./ruler.pl --summary 'фрактал гений' 'фрактал идиот'
19500 results for query [фрактал+гений]
most recent results: 
[*] Обсуждение:Эвентологические фракталы - Викизнание [http://www.wikiznanie.ru/ru-wz/index.php/%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%AD%D0%B2%D0%B5%D0%BD%D1%82%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5_%D1%84%D1%80%D0%B0%D0%BA%D1%82%D0%B0%D0%BB%D1%8B]
[*] Nr. 17 : Бенуа Мандельброт: рождение новой научной дисциплины [http://profi-forex.org/journal/number17/page1.html]
[*] ФРАКТАЛ: адрес, телефон, сайт | Отзывы о фрактал компьютеры ... [http://www.spr.ru/ostankinskiy/fraktal.html]
[*] Главная страница | Создавая... (бес)полезное [http://darkslave.net/]
4260 results for query [фрактал+идиот]
most recent results: 
[*] Шизофрения - лечение общением. • Просмотр темы - фракталы [http://www.schiza.org/viewtopic.php?f=122&t=7509]
[*] Галерея - Скриншоты - Почти фрактал. [http://www.linux.org.ru/gallery/screenshots/422805]
[*] Форекс советник и эксперт ы стратегии - Индикаторы фракталов ... [http://zawmr.ucoz.ru/index/indikatory_fraktalov_fractal/0-230]
[*] Трехмерные фракталы (30 фото) | Релаксик [http://relaxic.net/3d-fractals-incendia/]
фрактал+гений => 19500
фрактал+идиот => 4260
name_no ★★
() автор топика
Ответ на: комментарий от Un

> Кем меня там только ни назвали

Дак ты знач фрактал. Помню тебя с lorcode. Я-то думал, новичок, потому такой активный.

Sadler ★★★
()
Ответ на: комментарий от Un

> Ты что-то путаешь, меня там не было никогда

ОК, мож и путаю.

Sadler ★★★
()

Спасибо за скрипт. Сейчас попробуем ...

$ ./ruler.pl "азбука" "букварь" "школа" "универ" "детский сад" 
школа => 19300000
азбука => 1210000
универ => 736000
букварь => 106000
детский+сад => 449

$ ./ruler.pl "linux" "windows" "виндоус" "линакс" "линукс"
windows => 277000000
виндоус => 143000000
linux => 89100000
линукс => 50900000
линакс => 1370

$ ./ruler.pl "линукс математик" "линукс физик" "линукс гуманитарий" "линукс историк" "линукс филолог"
линукс+математик => 154000
линукс+физик => 152000
линукс+филолог => 40200
линукс+историк => 16900
линукс+гуманитарий => 1710

$ ./ruler.pl "linux баг" "линукс баг" "windows баг" "виндовс баг"
linux+баг => 124000
виндовс+баг => 
(обрывается вывод программы)

$ ./ruler.pl "linux bug" "windows bug"
windows+bug => 
(обрывается вывод программы)

$ ./ruler.pl linux
linux => 89100000

$ ./ruler.pl linux windows
windows => 
(обрывается вывод программы)

Видать, гугль меня за поискового спам-бота принял.

pacify ★★★★★
()
Ответ на: комментарий от pacify

> линакс => 1370

Детектор саныча?

(обрывается вывод программы)

Просто результатов столько, что поисковик захлёбывается.

Sadler ★★★
()
Ответ на: комментарий от name_no

посчитай отношение рулит к глючит

кстати, а рулит и глючит - точно противоположности? У меня арча и глючит и рулит (трололо), хочу даже на генту переходить (трололо)

stevejobs ★★★★☆
()
Ответ на: комментарий от pacify

виндоус

потести слово «виндовс» и «шиндошс»

stevejobs ★★★★☆
()

./ruler.pl «linux скачать бесплатно»

linux+скачать+бесплатно => 1490000

dikiy ★★☆☆☆
()
Ответ на: комментарий от Un

[dikiy@linuxhost tmp]$ ./ruler.pl «Un тролль и мудак»
Un+тролль+и+мудак => 784
[dikiy@linuxhost tmp]$

dikiy ★★☆☆☆
()
drull@ubuntu:~$ ./1.pl "linux bug" "windows bug"
windows+bug => 11100000
linux+bug => 4610000
drull ★☆☆☆
()
Ответ на: комментарий от pacify
$ ./ruler.pl linux macos windows
windows => 277000000
linux => 89100000
macos => 3780000

$ ./ruler.pl "linux рулез" "macos рулез" "windows рулез"
windows+рулез => 36000000
linux+рулез => 12100000
macos+рулез => 4690000

коэффициент «рулежа»:

windows: 36000000/277000000 = 0.1299
linux: 12100000/89100000 = 0.1358
macos: 4690000/3780000 = 1.2407
Вывод: MacOS рулит со страшной силой, в десять раз превосходящей Windows и Linux.

pacify ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.