LINUX.ORG.RU
ФорумTalks

Распределенные поисковые системы как альтернатива Империи Добра


0

2

Вчера беседовал с одним человеком про монстрические корпорации, паранойю, свободу и удобства. Сказал, что если кого возмущает политика фэйсбука или там скайпа, нужно в первую очередь перестать использовать фэйсбук или скайп самому.

Потом задумался - у меня самый посещаемый ресурс - гугль, а гугль - большая корпорация, которая при желании может учинить такое, что microsoft покажется борцом за свободу и открытые стандарты.

И загуглил про распределенные поисковые системы. Пока планирую посмотреть, что за зверь YaCy: http://www.yacy-websuche.de/wiki/index.php/Hauptseite

Что коллективный разум имеет сказать по поводу таких решений?

★★★★★

распределённые поисповые системы это очень хорошо в двух случаях:
1. Они выполняют возложенную на них функцию поиска нужной информации (яндекс, например, всё время ищет какую-то фигню, не верю что только я такой уникум).
2. см. п.1.

OldWiseCat ★★
()

Не собираюсь жертвовать удобством гугла ради идеологии и паранойи, для этого есть linux.

alltiptop ★★★★★
()
Ответ на: комментарий от OldWiseCat

Насколько я понял, клиент YaCy индексирует страницы, которые вы смотрите, плюс может индексировать страницы в фоновом режиме. Индексы хранятся в виде DHT и к ним имеют доступ все.

Hoodoo ★★★★★
() автор топика
Ответ на: комментарий от unnamed

Во-первых, на то она и паранойя.

Во-вторых, когда она будет подкреплена, будет поздно.

В-третьих, интересно посмотреть, что оно за зверь.

Hoodoo ★★★★★
() автор топика
Ответ на: комментарий от stevejobs

Хранение вареза и порнушки - тоже. Однако bittorent работает же.

Hoodoo ★★★★★
() автор топика
Ответ на: комментарий от Hoodoo

> Вы так говорите «завышенное ЧСВ», как будто это что-то плохое.

Плохого в этом ничего нет, просто оно не нужно :)

unnamed
()

>Что коллективный разум имеет сказать по поводу таких решений?

Сетевая часть довольно неплоха но алгоритмы поиска там хромают. Хотя гугл в этом вопросе читерит - веса вроде слышал настраивают вручную

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от stevejobs

>Поиск — это централизованная операция по своей сути.

Как раз таки нет. Поиск это хождение по дереву а по деревьям кластеры бегают великолепно

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от alltiptop

Так где провести черту? У каждого она своя. И вообще старый враг лучше новых двух. Мелкософт - враг старый, ничего нового не выкинет. А Гугл пожет поиметь так что поймешь что с тобой сделали лишь когда это произошло

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от KRoN73

Спасибо за наводку.

Но там получается, что индексация распределенная, но результаты хранятся на центральном сервере.

Hoodoo ★★★★★
() автор топика
Ответ на: комментарий от DNA_Seq

Разве что внезапно сделать почту платной, а корме этого ничего смертельного не представляется, кроме патентов.

alltiptop ★★★★★
()
Ответ на: комментарий от DNA_Seq

Вот-вот.

Мне кажется довольно логичным шагом хотя бы поинтересоваться, что может такая система и чего она требует. Думаю, погоняю неделю и отчитаюсь, что оно жрет по памяти, процессору, месту на диске и каналу. Сама идея мне определенно нравится.

Hoodoo ★★★★★
() автор топика
Ответ на: комментарий от alltiptop

> Не собираюсь жертвовать удобством гугла ради идеологии и паранойи

+1. А то развелись тут паникеры...

drull ★☆☆☆
()
Ответ на: комментарий от overmind88

Редкостная гадость.

//Раньше был search.wikia.com со своим опенсорсным пауком

devl547 ★★★★★
()
Ответ на: комментарий от DNA_Seq

> Слежка, манипулирование общественным мнением, замашки монополии и прочее это мелочи??

Да. Следить лично за тобой никто не будет, ты никому не нужен. Если есть голова на плечах, то манипулировать твоим мнением будет сложно.

drull ★☆☆☆
()
Ответ на: комментарий от drull

Ты забываешь про окружающих. Если будут манипулировать мнением окружающих то это манипуляция неизбежно отразится на тебе

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от KRoN73

Но там свои зеркала поднимать можно? Исходников даже не увидел, пофиг что на моно написано

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от Hoodoo

ждём! особенно интересно узнать насколько точно ищет, т.е. было бы здорово увидеть табличку вроде «поисковый запрос - первые 10 результатов»

OldWiseCat ★★
()
Ответ на: комментарий от hibou

Я стараюсь не думать об этом, быстрее засыпаю и не ограничиваю себя в данный момент отказом от продуктов из-за паранойи.

alltiptop ★★★★★
()
Ответ на: комментарий от hibou

И что же он такого секретного обо мне может продать, что нельзя найти с помощью гугла?

alltiptop ★★★★★
()
Ответ на: комментарий от OldWiseCat

Кстати если кто знает, как можно качественно измерять такие вещи, напишите, потому что я пока планирую тестировать так:

- Сделать пару запросов по archlinux - Заскриншотить выдачу - Отдать поисковику гигов двадцать на винте и четверть пропускной способности канала (четверть мегабайта в секунду) - Натравить свой клиент на bbs.archlinux.org и wiki.archlinux.org - Посмотреть, сколько проца/оперативы оно на этом будет жрать - Через неделю повторить те же запросы и посмотреть, куда оно меня выведет: - С моей машины - С произвольной другой машины

Hoodoo ★★★★★
() автор топика
Ответ на: комментарий от Hoodoo

да, но я бы ещё к сравнению добавил то, что ищут альтернативные поисковики типо гугля и яндекса по русским и английским сайтам. т.е. получается так: запрос про арч: скрин этого поисковика, гугля и яндекса. далее натравление и через неделю всё тот же запрос и такие же скрины. и можно будет оценить. как-то так

OldWiseCat ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.