LINUX.ORG.RU
ФорумTalks

Distributed Google


0

0

А кто-нибудь уже пытается сделать распределённый поисковик на основе идей p2p?

1. Юзер открывает страницу - она у него индексируется и хранится определённое время.

2. Из отдельных юзеров организуем DHT.

3. ???

4. Профит!

Надо быстрее это провернуть, пока гугль ещё не скупил все интернеты, и тогда ему наконец-то хана. Ибо темпы роста гуглевских вычислительных мощностей меня очень пугают.

> Ибо темпы роста гуглевских вычислительных мощностей меня очень пугают.

+1024!

acetone
()

А то я на минутку представил себя на месте хозяина гугля, и вдруг с ужасом ощутил, что интернет растёт всё быстрее и быстрее, и чтобы google.com продолжал эффективно искать, придётся разворачивать всё новые и новые дата-центры, всё больше и больше их, до бесконечности. Грубо говоря, развивать свою вычислительную сеть размером с интернет. И следующей мыслью стало: эта гонка может кончится только тем что либо гугль подминает под себя интернет и процветает, либо таки в конце концов проигрывает, не в силах поддерживать такие темпы роста.

dark_mikhail
() автор топика

О, вот нашёл какое-то проприетарное говнище. http://www.faroo.com/ Но всё-таки, надо что-то свободное.

dark_mikhail
() автор топика
Ответ на: комментарий от Bod

> Та ты шо?! Диагноз такой?

Рассказать сказку на ночь о ориентации девела sendmail?

acetone
()

Имхо, будущее как раз за децентрализованными p2p сетями и распределёнными вычислениями. Так что, рано или поздно, оно полюбому так и будет :)

AiLr ★★
()

/me как-то на уроке химии ляпнул, что поскольку космос состоит из водорода из него можно добывать воду.

Syncro ★★★★★
()

Вы сначала первую задачу решите, на предмет качественного индексирования. Чтобы не хуже гугля/яндекса работало, потом можно остальным заняться.

anonymous
()

> Надо быстрее это провернуть, пока гугль ещё не скупил все интернеты, и тогда ему наконец-то хана. Ибо темпы роста гуглевских вычислительных мощностей меня очень пугают

Скоро электромагнитное поле от гуглевских вычеслительных мощностей вызовут мегаТорнадо, и все подохнут. Ура свидетелям 2014 года! Ура Торнаде разрушителю!

vasily_pupkin ★★★★★
()
Ответ на: комментарий от anonymous

> Вы сначала первую задачу решите, на предмет качественного индексирования. Чтобы не хуже гугля/яндекса работало, потом можно остальным заняться.

Дуралей. Проиндексировать - задача тривиальная, все сложности связаны только с огромными объёмами информации.

dark_mikhail
() автор топика

интересная идея.
хреново только то, что доверять источникам страшновато :/

stave ★★★★★
()
Ответ на: комментарий от stave

В этом главная проблема, но в распределённых вычислениях обычно от этого защищуются перепроверкой результатов на нескольких нодах, и тут можно что-то подобное придумать.

Ну или так: каждый сайт пускай сам отвечает за свой индекс. Заодно его и для локального поиска можно использовать. А кто будет мухлевать, того банить, или какую-нибудь там карму понижать.

dark_mikhail
() автор топика
Ответ на: комментарий от dark_mikhail

А как в осле поиск сделан? Там же тоже по клиентам шарится п2п вроде?

stave ★★★★★
()
Ответ на: комментарий от dark_mikhail

> Проиндексировать - задача тривиальная, все сложности связаны только с огромными объёмами информации.

За слова отвечаем? Ноги в руки и вперёд. Желаю видеть тривиальный пример тривиального кода, соизмеримого по возможностям поиска с yandex.

atrus ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.