LINUX.ORG.RU

Статья о поисковике search.wikia.com

 ,


0

0

В статье рассказывается о поисковике, созданном автором Википедии Джимми Вэйлсом (Jimmi Wales) и перезапущенном в июне. Основные идеи:

  • Причина создания — идеологические разногласия с Гуглом, который не раскрывает свой поисковый алгоритм. Wikia search engine построен полностью на открытом ПО.
  • Wikia поощряет наполнение базы поисковика пользователями. Тогда как большинство поисковиков целиком полагаются на поисковый алгоритм.
  • Помимо пользовательского ввода Wikia также использует поисковик Nutch.
  • Для индексирования и работы с базой данных используется библиотека Lucene Java.
  • В качестве «паука» — сканирующей WWW программы — используется Grub. Wikia не может тягаться с Гуглом числом серверов, поэтому Вэйлс предлагает всем желающим скачать клиент Grub и поучаствовать в наполнении базы по примеру проектов распределённых вычислений (например SETI@Home).
  • Презагруженная AJAX-ом страница результатов поиска. Результаты подгружаются на лету, имеется система рейтингов, пользователи могут редактировать, рецензировать, комментировать, выделять и удалять результаты.
  • Желающие могут установить тулбар для Firefox.
  • Проект коммерческий, ориентирован на получение прибыли. Пока источник средств — реклама от Google (sic).

«На сегодня счётчик показывает около 8 миллионов запросов и более двух миллионов пользовательских сообщений. Не много, но как выглядела в первый день Википедия?»

>>> Подробности на сайте freesoftwaremagazine.com

Велосипед яндекс рулит. Алгоритм поиска раскрывать неься во избежания читеров-SEOдрочеров.

wfrr ★★☆
()

жабоскрипт онли => в биореактор.

maloi ★★★★★
()

> В качестве «паука» — сканирующей WWW программы — используется Grub.

mono o_O

FHunter
()

>Проект коммерческий, ориентирован на получение прибыли

Представляются орды баннеров или сайты спонсоров на первых местах.Нафиг не нужно.

anonymous
()

>эйлс предлагает всем желающим скачать клиент Grub и поучаствовать в наполнении базы по примеру проектов распределённых вычислений (например SETI@Home)

>Проект коммерческий, ориентирован на получение прибыли. Пока источник средств — реклама от Google (sic).

Перевожу на русский:
Вы нам помогайте, а мы на вас денег заработаем (и гуглу тоже поможем заработать).

anonymous
()
Ответ на: комментарий от anonymous

> Представляются орды баннеров или сайты спонсоров на первых местах.Нафиг не нужно.

Имхо, будет лента текстовых баннеров, крутимая джавоскриптом.

question4 ★★★★★
() автор топика
Ответ на: комментарий от anonymous

> Перевожу на русский: Вы нам помогайте, а мы на вас денег заработаем

Логично. Но если бы за наполнение базы платили хоть символические деньги, ты согласился бы поставить Grub?

question4 ★★★★★
() автор топика

>ты согласился бы поставить Grub?

У меня и так он стоит.Он у меня систему загружает.Так-то!:-) Кстате,где судебные процессы Grub vs Grub?Кто-то должен к названию прицепится.

anonymous
()
Ответ на: комментарий от anonymous

> где судебные процессы Grub vs Grub?

Загрузчик — GRUB, поисковый робот — Grub. Разный регистр. Всё чисто.

question4 ★★★★★
() автор топика

> Причина создания — идеологические разногласия с Гуглом, который не раскрывает свой поисковый алгоритм

> Проект коммерческий, ориентирован на получение прибыли. Пока источник средств — реклама от Google

бугага

dhameoelin ★★★★★
()

Наверное надо подключится, а то всё равно неясно куда девать безлимитку.

> Проект коммерческий, ориентирован на получение прибыли. Пока источник средств — реклама от Google (sic).

Всем, кому это не нравится, напоминаю: на вас постоянно делают деньги, даже когда вы в туалете.

sv75 ★★★★★
()

Нещадно тормозитъ.

Но нашёл что нужно, в отличие от ББ.

Dimka-Bo
()
Ответ на: комментарий от Dimka-Bo

> А кто пробовал регистрироваться? И у кого это получилось?

Я пробовал, получилось, но с трудом. :) Всё время выскакивала какая-то ошибка или же просто ничего не происходило при нажатии кнопки «Зарегистрировать» в окне регистрации. Попробовал несколько раз, использовал разные логины и пароли. В конце концов получилось, правда логин получился не такой как хотел изначально (кстати, начальная буква логина автоматически капитализируется).

После регистрации всё работает нормально, никаких глюков не заметил. Поставил себе Grub (Ubuntu 8.04 x86_64) - работает без проблем, за полчаса обработал уже более 6000 линков. Пока продолжу «играться» с проектом.

SKYRiDER ★★★
()

>имеется система рейтингов, пользователи могут редактировать, рецензировать, комментировать, выделять и удалять результаты.

набигают сеошники, можно делать дорвеи...

legolegs ★★★★★
()
Ответ на: комментарий от legolegs

> >имеется система рейтингов, пользователи могут редактировать, рецензировать, комментировать, выделять и удалять результаты.

> набигают сеошники, можно делать дорвеи...

Идея борьбы с сеошниками здесь такая же как и с вики - пользователи сами быстро исправят результаты действий «вандалов». Т.е. чем больше пользователей системы, тем лучше, чище и корректнее получаемый результат. Может ещё какие-то специальные методы борьбы придумают, но пока такой проблемы нет, то и нечего над сейчас ломать голову.

SKYRiDER ★★★
()
Ответ на: комментарий от SKYRiDER

Результат работы паука-Grub'а у меня: за 5 часов было обработано почти 90 тысяч ссылок.

SKYRiDER ★★★
()

Хлам, тормозит нереально... Да и нафиг изобретать велосипед... Кому не нравится гугл, идут на яндекс, яху, нигму и т.д.

anonymous
()
Ответ на: комментарий от anonymous

>за вами уже выехали.

Ха, на Child Porno второй ссылкой идет Fullmetall Alchemust. Отмажусь, что я онеме искал.

redgremlin ★★★★★
()

Зарегился без каких либо проблем :)

anonymous
()

"Шукати". Фтопку, пожалуй.

anonymous
()

Error 503 Service Unavailable

^_^ за ними не только выехали. к ним уже приехали ^_^

anonymous
()
Ответ на: комментарий от anonymous

> Перевожу на русский: Вы нам помогайте, а мы на вас денег заработаем (и гуглу тоже поможем заработать).

И чё, тебя это коробит? Более правильный перевод: Вы нам помогайте, а мы на вас денег заработаем (и гуглу тоже поможем заработать), и вам тоже польза будет.

VladimirP ★★★★
()
Ответ на: комментарий от anonymous

+1
Error 503 Service Unavailable
Эффект форумов в действии.

nevsky
()
Ответ на: комментарий от question4

> Загрузчик — GRUB, поисковый робот — Grub. Разный регистр. Всё чисто.

Отлично, пошел создавать дистрибутив GNU/Linux под названием Ms WiNdOwS Xp - не подкопаешься, все чисто.

fpga
()

Спасибо, подрочил. Ищет лучше гугля. И не фильтрует.

Нефильтрованное ЦП - наше всё.

anonymous
()
Ответ на: комментарий от anonymous

>Представляются орды баннеров или сайты спонсоров на первых местах.Нафиг не нужно.
Банерорезалка рулит. Я уже привык к Интернету без баннеров.

fractaler ★★★★★
()

>Пока источник средств — реклама от Google (sic).
Ох подгребёт их под себя Братишка.

Correctnoe_imya_polzovatelya ★★★★★
()

Странно, что до сих пор не создали реальный GNUтый поисковик с распределённой индексацией и распределённым хранением результатов. Одной из фишек можно было бы сделать подписку на результаты поиска. Участникам программы распределённой индексации и хранения, набравшим определённое количество "баллов" рекламу не показывать.

TOHbl4
()
Ответ на: комментарий от VladimirP

Да, коробит. По крайней мере пока.

Вот когда польза ощутимая от этого появится, тогда и посмотрим.

И идеологические разногласия с гуглом и при этом впихивание гугловской рекламы — это сильно, да.

anonymous
()
Ответ на: комментарий от cap838383

Для Firefox есть Wikia Toolbar - https://addons.mozilla.org/en-US/firefox/addon/8267
Можно производить поиск непосредственно через этот тулбар или, если он мешает (занимает много места на экране), то отключить тулбар и пользоваться стандартным окошком поиска в Firefox (для него данный аддон установит соответствующий поисковый плагин).

SKYRiDER ★★★
()
Ответ на: комментарий от bioreactor

> поис по запросу = 15 секунд

Расскажите что за запросы такие вы вводите? У меня максимальное время обработки запроса (до появления первых результатов) составляло не больше 3-4 секунд. Это я такой везучий или с вами что-то не так?

А может вы пытаетесь аяксовую страницу с результатами прокрутить до самого конца (с постепенной инкрементальной подгрузкой результата) и называете это временем "поиска по запросу"?

SKYRiDER ★★★
()

>Grub

Вот в этом вся суть дотнетчегов - спижжена не только идея, но и название! И как обычно, всё глючид безбожно!

anonymous
()
Ответ на: комментарий от anonymous

> попробуй зарелизить чёнть типа W.I.N.D.O.W.S.

Оно должно быть в непересекающейся с MS Windows области. Из-за претензий MS Windows на универсальность это должно быть что-нибудь непрограммное или даже некомпьютерное. Потому, что иначе оно, скорее всего, пересечётся с функционалом имеющейся части Windows.

Существует марка нижнего белья MicroSoft, довольно долго существовал сайт о вебкамерах windows-2000.com (сейчас там финские киберсквоттеры).

question4 ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.