LINUX.ORG.RU
ФорумTalks

Что случилось с поисковиками?

 , ,


0

2

Если сокрытие ссылок на всякий варёз вполне понятное решение, то ограничивание поисковой выдачи максимумом 20 страницами и карусели из одних и тех же сайтов мне в голову не лезут. И это же не один Google такой а все. Почему–то показать Spec ops the line в ответ на стрелялка с укрытиями в дуае Google может а вот отправить в путешествие по миллионам или хотя бы тысячам и тысячам сайтов уже нет. Вбить например, слово блогосфера и сидеть до посинения копаться в выдаче не получиться никак. И почти всюду вездесущая парочка из Wikipedia и YouTube. Раньше пользоваться USB–модемом с 2G которое иногда сменялось более быстрым 3G и в том же Google на каком–нибудь четвёртом десятке страниц таки можно было найти ссылки на интересующую игруху поделённую на части Winrar и выложенную на стрёмном файлообменнике с кучей рекламы, но главное что не торрентом и её таки действительно можно было скачать Download master. Сейчас такое непрдеставимо и даже не из–за того что сорка страниц уже нету а потому что после третьей почти наверняка пойдёт полная белиберда. Пока существовала nigma.ru пользовался ею. Кому это выгодно? Им жалко пустить дальше пятой страницы или показать васянские блоги васянов с Tumblr или там Blogger. Или показать видео не с YouTube. В мире же существуют не порнушные сайты с видео кроме YouTube. Наверняка же оно всё есть в индексе.

Можно попробовать посмотреть на это с другой стороны. Много сейчас интересных индивидуальных сайтов? Сколько сайтов, существовавших в прошлом, сегодня мертвы?

Ещё народ, кажется, разбежался по социальным сетям и пользователи именно туда чаще всего переходят. Зачем мне искать видео в emacseo vimeo, если я, скорее всего, хочу youtube? Иногда так и хочется написать “cmr vs pmr reddit”.

kaldeon
()
Последнее исправление: kaldeon (всего исправлений: 1)

все убили алгоритмы и «бабки», на эту тему уже даже какие никакие исследования не один год назад провели

nerfur ★★★
()

Что случилось с поисковиками?

У меня печалька, что после добавления ИИ в duckduckgo, он стал хуже работать с конкретными запросами, например:

site:example.site.com "exact phrase"

Раньше выдавало все варианты. Сейчас почему-то не все и приходится лезть в гуголь. Он пока что справляется, но он не работает без js.

Jullyfish
()

Просто уже никто не ищет по словам на странице. Боты складывают сайты по группам а потом уже тебе выдают результат из ближайшей группы, т.к. для 95% это даст правильный ответ. Остальные 5% не стоят потраченных на сложный поиск ресурсов.

ya-betmen ★★★★★
()
Ответ на: комментарий от Jullyfish

Сейчас подумал, чего я ною. Им можно оставить feedback (в отличие от того же гугля). Сообщил о проблеме. Вдруг сработает.

Jullyfish
()
Ответ на: комментарий от nerfur

да если бы хотя бы алгоритмы. а то куча говна, которая втюхивает рекламу и ничего более. раньше гугл хоть что-то находил, а теперь он уже не то, чтобы не торт, а прямо вот пипец какой второсортный шлак. и ведь были у них и возможности, и бабло. но просто взяли и всё просрали.

Iron_Bug ★★★★★
()
Ответ на: комментарий от Jullyfish

да, кавычки у них перестали работать. и никогда не было исключений - это большая проблема. «ИИ» и здесь всё испортил.

есть mojeek. они слабее в плане объёма данных, пока умеют только в английский язык, но на жалобы и предложения юзеров реагируют, что большая редкость. можно ещё его юзать.

Iron_Bug ★★★★★
()

Экономия ресурсов. Они начинали вообще с полноценного поиска по словам, потом перешли к цепочкам, теперь вообще «ИИ». Потому что сайтов стало слишком много, ну и бабло решает, конечно. Подавляющее большинство людей такой говнопоиск устраивает, а на остальных несколько процентов им насрать.

Странно только что они платно не продают услугу поиска «старого» типа.

CrX ★★★★★
()

Боятся они все. Исков и потери прибыли.
Неужели кто-то ещё не понимает в 2025 году...Это было понятно ещё с закрытия geocities, потому что миллионы домашних страничек нарушали американский копирайт.

novus ★★
()
Последнее исправление: novus (всего исправлений: 1)
Ответ на: комментарий от CrX

Странно только что они платно не продают услугу поиска «старого» типа.

есть подозрение, что полимеры давно просраны. и продавать уже нечего.

Iron_Bug ★★★★★
()

Подожди, вот-вот с ними ИИ случится - будешь вспоминать сегодняшние времена как благословенные.

По специальным сайтам локальный поиск стал лучше гугла или яндекса, хотя несколько лет назад было наоборот, то ли еще будет.

aiqu6Ait ★★★★
()
Последнее исправление: aiqu6Ait (всего исправлений: 1)

А чо ты сделаешь? Используй утку, perplexity или site:reddit.com

Lordwind ★★★★★
()

Скатились, вестимо.

yars068 ★★★★★
()

Что случилось с поисковиками?

Случился очередной мировой финансовый кризис, который заставляет резать потери и фиксировать прибыль.

somemong
()
Ответ на: комментарий от CrX

Странно только что они платно не продают услугу поиска «старого» типа.

Ты как себе это представляешь? То есть, эти прекрасные люди с восьмизначными зарплатами должны признать, что их работа только испортила то, что нормально работало, и теперь они предлагают доплатить им денег, до девятизначной зарплаты, чтобы они хотя бы отдали то, что изгадили?

lenin386 ★★★★
()
Последнее исправление: lenin386 (всего исправлений: 1)

Поиск уже не торт и давно. Я помню, как искал сериал, который смотрел в начале 90стых с рекламой Lucky Strike и как гугл сразу меня понял и выдал ссылку на коммерсант 95 или 94 года с описанием и сериала и рекламной компании! И это было нереально круто. 10 лет назад я засунул туда такой же поиск и он выдал мне унылую выдачу ваще не про то. К тому времени я давно уже заметил, что гугель перестал меня понимать и это была просто проверка.

В нулевых поиск там был заточен под людей, которым надо найти инфу, а сейчас он заточен на зарабатывание бабок.

vtVitus ★★★★★
()
Последнее исправление: vtVitus (всего исправлений: 1)

Короткий ответ - кэширование. Там все запросы кешируются, потому гугл и такой быстрый, а поиск по базе дорогая операция. Там скорее всего эти 20 страниц и в кэш кладутся. Точнее первые 200 результатов поиска. Это для тебя страница на самом деле это просто 200 ссылок.

rtxtxtrx ★★★
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)

Что случилось с поисковиками?

Полное и окончательное забивание на последнюю важную для поиска вещь - релевантность. В конце этого великого пути выдача поисковика вообще перестанет быть как-то связана с запросом и превратится в банальное СМИ, где будут выдавать только то, что требуется владельцам поисковика и их бизнес- (и не только) партнёрам. Возможно даже строку для поискового запроса уберут вообще (тестовые варианты такого поиска уже обкатаны)

Возможно, настоящие поисковики всё-же сохранятся в виде каких-нибудь распределённых p2p систем, других альтернатив пока не видно даже на горизонте.

Stanson ★★★★★
()
Ответ на: комментарий от lenin386

То есть, эти прекрасные люди с восьмизначными зарплатами должны признать, что их работа только испортила то, что нормально работало, и теперь они предлагают доплатить им денег, до девятизначной зарплаты, чтобы они хотя бы отдали то, что изгадили?

Они прекрасно понимают, что и зачем делали. Возможность нормального полнотекстового поиска для всех требует на несколько порядков больших вычислительных ресурсов, чем вот эта хрень. Эти люди с восьмизначными зарплатами прекрасно это понимают и могут объяснить руководству, показав, сколько сэкономлено благодаря этому на датацентрах. При этом за деньги можно было бы и дать возможность гораздо более тяжёлого, но полноценного, поиска небольшому количеству клиентов (тем, кто готов её оплатить) — в таком виде много ресурсов оно не сожрёт (потому что 99% устраивает бесплатный поиск, который есть), но при этом есть дополнительная возможность заработать.

Возможно, впрочем, они считают, что потенциальных клиентов настолько мало, что смысла с этим возиться нет никакого…

CrX ★★★★★
()
Ответ на: комментарий от CrX

Погоди, а процесс индексации, под полноценный поиск и под современное фуфло - он один и тот же? Или для полноценности, надо индексировать иначе?

James_Holden ★★★★★
()
Ответ на: комментарий от James_Holden

Смотря что ты называешь индексацией. Конечно, сам по себе кравлинг и кэширование происходит так же. А вот размечается документ по токенам иначе. Когда поиск был прям совсем-совсем годным, что было? Искалось либо полное вхождение подстроки, либо текст делился на слова, и искалось каждое из них. Но это медленно, и чем больше документов проиндексировано, тем медленнее. Я в принципе не уверен, что это реально осуществить на тех объёмах, что есть сейчас даже на всех их суперкомпьютерах — может потому и не продают даже за деньги. Перешли на вектора и цепочки. Поиск стал хуже, но что-то более-менее похожее искал, и расставление повсюду кавычек помогало, и было хоть понятно, как оно в принципе сработает. Теперь вот перешли на «ИИ», и там вообще хрен поймёшь, как теперь токенизация работает. Не факт, что и сами гуглояндексы понимают, а если и понимают, то не раскроют.

CrX ★★★★★
()

Это чтобы больше рекламы тебе показать.

hateyoufeel ★★★★★
()

https://ru.wikipedia.org/wiki/%D0%94%D0%B5%D1%80%D1%8C%D0%BC%D0%BE%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F

  1. Сначала платформа хороша для пользователей (чтобы их привлечь).
  2. Затем она становится хороша для бизнеса (чтобы заработать на пользователях).
  3. В конце она становится хороша только для себя, извлекая всю ценность и из пользователей, и из бизнеса, в ущерб качеству сервиса.
wandrien ★★★
()

Это да, временами даже ИИ гугеля выдает более толковые результаты, чем поисковик. Впору возвращаться к прямому индексированию вроде соулсика или еще какой ретрошары.

Irma ★★★
()
Ответ на: комментарий от Bad_ptr

Не помню в каком году maxcom подкрутил поиск, но в 00-х он вообще не работал по сравнению с текущим состоянием, а сейчас неплохо ищет

Kolins ★★★★★
()

Ну конкретно по варезу - DMCA ударил, особенно когда держатели копирайтов научились делать свои краулеры и автоматизировать поиск нарушений копирайта. А с остальным согласен, поисковики скатились :(

leave ★★★★★
()

Поиск уже давно сломан, теперь его ещё добивают нейросети, которые выдают сразу ответ. Только насколько он будет верный, большой вопрос. Но хомячки ведутся.

th3m3 ★★★★★
()

Теория мертвого интернета.

Интернет состоит из ботов, сейчас ещё и llm-ботов. Настоящие люди (боты тут тоже везде) сконцентрированы лишь на нескольких площадках из соцсетей, стримерских сервисов и гитхабе. По этой причине поисковики больше не показывают миллионы мертвых страниц.

mamina_radost
()
Ответ на: комментарий от peregrine

ну, может разве что в рунете. но это также значит, что в других местах их количество возросло. а поисковики ищут по всем сайтам, не только в рунете. я вот в рунете обычно ничего не ищу, и вообще в 99% это англоязычный поиск. но я вижу, что поиск похужал по всем параметрам, причём очень заметно.

кстати, ограничивание поиска какой-то локалью - это ужасное зло, но гугл этим вроде пока не страдает. а вот недавно зашла на change.org через прокси (по понятным причинам) и не нашла там нигде перехода на английскую версию сайта. её там просто не оказалось! принудительное навязывание локали и интерфейса в зависимости от айпишника, с которого идёт обращение. вот это прямо настоящее зло.

Iron_Bug ★★★★★
()
Последнее исправление: Iron_Bug (всего исправлений: 3)
Ответ на: комментарий от aiqu6Ait

это хорошо, если локальный поиск есть и если он честный и полнотекстовый. а сейчас же многие делегируют поиск по сайту тому же гуглу. и всё, конец поиску вообще.

но да, времена до этой «ИИ»-шной заразы мы будем вспоминать с ностальгией.

Iron_Bug ★★★★★
()
Ответ на: комментарий от yars068

так потому что «с Алисой». за такое не только посылать, а вообще банить надобно.

а если бы продавали нормальный поиск, без «ИИ», с честной индексацией сайтов - нашлось бы много желающих купить такой нормальный сервис. но есть подозрение, что ничего нормального у них уже не осталось и продавать просто нечего.

Iron_Bug ★★★★★
()
Последнее исправление: Iron_Bug (всего исправлений: 1)
Ответ на: комментарий от Stanson

всё так, но на p2p надеяться не стоит: он вообще не приспособлен для таких задач, в принципе. так что поиска в сети в общем смысле просто не останется, как понятия. на отдельных локальных сайтах, возможно, останется локальный поиск, если его не выдавит замена нормального поиска на отсылки к гуглу.

Iron_Bug ★★★★★
()
Ответ на: комментарий от CrX

Странно только что они платно не продают услугу поиска «старого» типа.

Могу предположить, что это теперь «утерянные знания».

anc ★★★★★
()
Ответ на: комментарий от lenin386

Неее, ты так годовой бонус не обоснуешь. Они не сломали работающее, они модифицировали бесплатный сервис не приносящий прибыли и создали на нем точку возможного получения выручки.

Вот теперь это тянет на девятизначную зарплату.

P.S.: Нет, меня не покусали в сбере и тинькове, я просто много наблюдаю за эффективными менеджерами и продуктологами

no-dashi-v2 ★★★★
()
Ответ на: комментарий от Stanson

Интернет стремительно заполняет сгенеренный LLM-шит. Никаких возможностей не хватит его индексировать и искать в нем. Но с другой стороны - если этот шит сгенерирован - значит, его можно не индексировать - а также просто генерировать! Ну и всё - генератор шита заменяет поиск для 95% пользователей. На оставшихся 5 посрать, они расходный материал и своё отработали

no-dashi-v2 ★★★★
()
Ответ на: комментарий от no-dashi-v2

в штатах все еще забавнее. понастраивают датацентов везде где только могут. получают налоговые каникулы под это дело (т.е. платят за это все обычные налогоплательщики, а не триллиардные корпорации). а они жрут электричество и питьевую воду как не в себя.

у простых американцев то воды из-за этого толком в кране нету, то электричество внезапно в 2 раза дороже стало и это только за последний год, лол.

регулярно то блекауты, то еще что-то. обоссака!

AI - не только вайтишных дебилов без работы оставил, но и простых жителей тоже уже уделывать начинает, судя по небывалому росту счетов за коммуналку и прочее.

n_play
()
Последнее исправление: n_play (всего исправлений: 1)

Забавно читать про экономию ресурсов, глядя на это: https://ibb.co/RTRSGfgL

Видимо все ресурсы ушли на создание ШГ в зависимости от контекста поиска.

Искать CP (Central Processor) теперь вообще боюсь.

windows10 ★★★★★
()
Ответ на: комментарий от windows10

Ты еще в гугле поищи wizard of oz, а потом кликни по красным туфелькам

no-dashi-v2 ★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.