LINUX.ORG.RU
ФорумTalks

Утечку с docs.google.com ещё не обсуждали?

 , информация должна быть свободной,


0

1

Яндекс проиндексировал docs.google.com. Утверждают, что из-за неправильных настроек в robots.txt. Когда это выяснилось, поиск по ним отключили.

Кто-нибудь что-нибудь интересное скачать успел?

★★★★★

Ответ на: комментарий от pacify

Внезапно, но в гуглдокс можно делать и публично доступные документы. Почему владельцы ставят такой доступ это уже не к гугляшам вопрос, а к владельцам файлов.

imul ★★★★★
()

Кто-нибудь что-нибудь интересное скачать успел?

Они в свободном доступе до этого были. Кому надо всё уже скачали.

crutch_master ★★★★★
()
Последнее исправление: crutch_master (всего исправлений: 1)

Когда это выяснилось, поиск по ним отключили.

Хм. Действительно, отключили.

пароли site:docs.google.com
По вашему запросу ничего не нашлось
pacify ★★★★★
()

Когда это выяснилось, поиск по ним отключили.

Яндекс отключил. Гугль показывает норм.

https://www.google.ru/search?q=мои пароли

6. Одноклассники, e-dostavka@list.ru, vbataree12sekciy123, wZj7s9k3rn. 7. Мой мир, e-dostavka@list.ru, vbataree12sekciy, Битрикс 24. e-dostavka@list.ru. 8.

indotdel mail ru пароль i912519 расписание занятий.

REG.RU, Aiad*58Aia//d*58. 24. 25. ПОЧТЫ ДЛЯ РАССЫЛКИ, MAILCHIMP.com. Создать письмо. Импорт из базы. База2. 26. Почта 1, sd-kenguru@mail.ru ...

Дюкова Ирина Вячеславовна, МАОУ «СОШ №15», ivdyukova@mail.ru, ivdyukova7@gmail.com ... Пароль 123. 19.

pacify ★★★★★
()
Ответ на: комментарий от pacify

вооот, а ещё над админами локалхостов потешаются, ироды !

Spoofing ★★★★★
()
Ответ на: комментарий от darkenshvein

По идее эти файлы не должны индексировать поисковики. Но, получилось так, как получилось. А вот что там в файлах, которые из доксов попали в поисковую выдачу — это уже отдельный разговор.

imul ★★★★★
()
Ответ на: комментарий от imul

По идее эти файлы не должны индексировать поисковики

чёйта? всё там можно было индексировать, оно и проиндексировалось. в херандексе вообще сказали, что это нормальная работа поисковика, а не какие-то особенности.
вопрос только в одном, доколе эти поисковики ушлёпки будут индексировать на основе сбора персональных данных через своего жопа-зонда под названием браузер.
не их ссаное дело, что там Ирина Вячеславовна в документах пишет, вот только ссылка есть у неё и внезапно у блядского херандекса.

system-root ★★★★★
()
Последнее исправление: system-root (всего исправлений: 1)
Ответ на: комментарий от imul

Должны. DOC/PDF же индексируют, чому гуглдоки вдруг нельзя, если они публичные? Более того, надо бы и публичные чаты во всяких мессенджерах индексировать, этого очень не хватает.

bodqhrohro_promo
()
Ответ на: комментарий от pylin

реклама — это отдельно.
Васян положил какие-то данные к одному дяди, а всякие ФЗ и GDPR не рассматривают вопрос, что ссылку на сенситив данные «украдёт» другой дядя, просто потому что ты используешь другой браузер.

system-root ★★★★★
()
Последнее исправление: system-root (всего исправлений: 1)
Ответ на: комментарий от system-root

чёйта? всё там можно было индексировать, оно и проиндексировалось

man robot.txt
Хотя, конечно на него можно и наплевать.

imul ★★★★★
()
Ответ на: комментарий от vertexua

нечего сказать - докопаюсь до орфографии

Там две буквы «ё» должно быть, ещё Тёма говорил, что в них самая мякотка слогана.
А то получается, что найдутся все, что тоже правда (особенно для Яндекса), но всё же не то.

dogbert ★★★★★
()
Ответ на: комментарий от system-root

Может быть ты поизучаешь сначала для чего и для кого нужен robot.txt? А потом поизучаешь какой доступ можно раздавать в гуглдоксах?

imul ★★★★★
()
Ответ на: комментарий от imul

По идее эти файлы не должны индексировать поисковики.

Поисковик может индексировать все, что в публичном доступе.

cvs-255 ★★★★★
()
Ответ на: комментарий от cvs-255

Сломался security through obscurity. В Google Docs пользователь получает то, что запросил - публичный доступ по ссылке если он это включил. Пусть он после этого протупил и запостил ссылочку на какой-то форум в котором как-то стояли криво настройки доступа к ветке. Но когда после этого можно написать «вася пупкий site:docs.google.com» и найти все его доки, то это открывает доступ к его файлам любой школоте

vertexua ★★★★★
()
Последнее исправление: vertexua (всего исправлений: 1)

Проблемы домохозяек нам не интересны. Но можно бизнес-план намутить в области «Консультации в сфере IT - дорого».

Promusik ★★★★★
()

https://www.youtube.com/watch?v=As9sKOeyl1Q

У них одна лишь цель
Индексация до конца
Это новые, ректальные
Роботы яндекса!

И если ты спишь, не прижавшись спиной к стене
Можешь быть уверен, они уже спешат к тебе!
По паутине из оптоволокна
Они придут проиндексировать тебя!

StReLoK ☆☆
()
Последнее исправление: StReLoK (всего исправлений: 1)
Ответ на: комментарий от system-root

доколе эти поисковики ушлёпки будут индексировать на основе сбора персональных данных через своего жопа-зонда под названием браузер

потому что через телефон и умную колонку можно узнать меньше ссылок чем через браузер и дополнение к браузеру.

onon ★★★
()
Ответ на: комментарий от system-root

доколе

А что лично ты делаешь для того, чтобы это прекратилось? Например, не перешёл на зондохромиум, как многие смирившиеся тут?

bodqhrohro_promo
()
Ответ на: комментарий от system-root

Задай вопросы в дженерал. В толксах мне больше нечего сказать, кроме того уже сказал выше — что пользователь доксов сам решает какие ему права на свои документы в облаке назначить, а робот может следовать правилам в robots.txt а может и не следовать.

imul ★★★★★
()
Ответ на: комментарий от imul

Почему поисковики не могут индексировать вообще все, до чего дотянутся?

cvs-255 ★★★★★
()

Яндекс проиндексировал docs.google.com. Утверждают, что из-за неправильных настроек в robots.txt

А если злоумышленник сделает свои поисковый робот, который будет сканировать все до чего дотянется и выкладывать ссылки на публично доступные документы с паролями, то это тоже утечка, да?

На всякий случай напомню, что любой делающий запрос к твоему серверу - потенциальный злоумышленник и надеяться на честность странно.

cvs-255 ★★★★★
()
Последнее исправление: cvs-255 (всего исправлений: 1)

Что за бред?

robots.txt - это не защита от парсинга. Это подсказка поисковику, что не должно быть более релевантным чем весь остальной контент.

Выложил в общий доступ - значит сам дятел!

Serg_HIS
()
Ответ на: комментарий от cvs-255

А если злоумышленник сделает свои поисковый робот, который будет сканировать все до чего дотянется и выкладывать ссылки на публично доступные документы с паролями, то это тоже утечка, да?

Разумеется. Выложил нежелательное — значит утечка. Вопрос о степени вины выложившего и того, кто положил в доступное место — отдельная тема. Причинённый вред это не меняет.

question4 ★★★★★
() автор топика
Ответ на: комментарий от Serg_HIS

robots.txt - это не защита от парсинга. Это подсказка поисковику, что не должно быть более релевантным чем весь остальной контент.

При условии добропорядочных поисковиков это срабатывает именно как защита от индексации. Точнее — защита от дураков, выкладывающих в открытый доступ что попало.

И кстати, на некоторых сайтах делают ловушки для роботов, нарушающих robots.txt. Делают ссылки, по которым банят, и запрещают эти ссылки в robots.txt.

question4 ★★★★★
() автор топика
Ответ на: комментарий от question4

Вообще кто угодно может написать свою парсилку и лазить по данным робота.

Не?

Serg_HIS
()
Ответ на: комментарий от vertexua

Там есть предположение, очень похожее на правду, что ссылочки эти утекли через Yandex Browser.

zloelamo ★★★★
()
Ответ на: комментарий от question4

«Утечка» произошла когда документ был выложен в публичный доступ. Все, что произошло позже это уже к теме не относится

cvs-255 ★★★★★
()
Ответ на: комментарий от imul

По идее, эти файлы не должны индексировать поисковики.

Ну, почему не должны? Они торчат в интернет? Торчат. Зайти на них кто угодно может? Может. Так почему их не индексировать, если их владельцы не позаботились об ограничении доступа?

Wizard_ ★★★★★
()
Ответ на: комментарий от cvs-255

Индексирование повредит технически безграмотным пользователям Гугла. Поэтому Гугл делает защиту от дураков, а Яндекс после обнаружения бреши делает вид, что защита всё-таки работает.

question4 ★★★★★
() автор топика
Ответ на: комментарий от cvs-255

Утечку с docs.google.com ещё не обсуждали? (комментарий)
Хотя, как уже там написано, никто не запрещает роботу игнорировать этот файл.
Но тебе объяснить этого не получится, ты же всё-равно не поймёшь, или упрёшься как баран. В любом случае мои сообщения стоят рядом. И раз уж ты прочитал первое, то наверняка прочитал и второе, но всё-равно полез доказывать свою «правоту». Так что барана только шашлык исправит.

imul ★★★★★
()
Ответ на: комментарий от question4

Гугл специально позволяет шарить доступ к файлам в доксах тем у кого есть точная ссылка на эти файлы. То, что эта ссылка проиндексирована из-за кривого robots.txt происшествие отдельное и никак не связано с тем, что пользователи шарят таким образом то, что шарить не надо.

imul ★★★★★
()
Ответ на: комментарий от bodqhrohro_promo

Ну они не публичные, были доступны по хеш-ссылкам и эти ссылки нигде не публиковались. Подобрать хеш не реально. Так можно твои пароли спарсить и добавить в выдачу, раз вводишь их на сайте значит публичные :)

Просто яндекс насобирал их через стринги, скормил краулеру и не хочет признаваться.

KillTheCat ★★★★★
()
Ответ на: комментарий от imul

robots.txt это такая же защита, как табличка «просим не входить» на входной двери вместо замка.

Это исключительно РЕКОМЕНДАЦИЯ, а не защита.

cvs-255 ★★★★★
()
Последнее исправление: cvs-255 (всего исправлений: 1)
Ответ на: комментарий от question4

А если я в этом треде выложу десяток своих паролей, то гугл и яндекс должны срочно прекратить индексировать этот тред?

cvs-255 ★★★★★
()
Ответ на: комментарий от cvs-255

В который раз убеждаюсь, что ты баран. У тебя реально огромные проблемы либо с чтением, либо с пониманием прочитанного.

РЕКОМЕНДАЦИЯ

Я в общем-то то же самое здесь написал неоднократно.

а не защита.

Покажи где я сказал что это защита и не приписывай голоса в твоей голове мне.

imul ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.