LINUX.ORG.RU

Предлагается метод отделения персональной информации в Интернете от всей остальной и соответственно простой протокол


0

0

http://siberean.livejournal.com/4317.html

На самом деле я всегда удивляюсь - почему это до сих пор не придумали и браузеры не имеют чекбокса: "Public"/"Personal"

Комментарии велкам.

На самом деле я всегда удивляюсь - почему это до сих пор не придумали и браузеры не имеют чекбокса: "персонал,
где по нажатию "Personal" - человек соберёт всю свою персональную информацию (постинги) - со всего интернета (и только своё).

Я в процессе посылки RFC.

Предлагается метод отделения персональной информации в Интернете от всей остальной и соответственно простой протокол

Говорил пока со знающими людьми, правда проприетарщиками: говорят - надо.
Но я не хочу отдавать это проприетарщикам.

Написать комманд-лайн утилиту на C (мд5+base64enc) - несколько вечеров. Надо только устаканить протокол и что ещё будет полезно в будущем (в какую сторону раширять) вообще.

Ответ на: комментарий от www_linux_org_ru

> Подделка с целью спама (лично вам в руки, да), и даже просто цитирование этих НИД-ов заставят их расползтись как нефтяное пятно по воде :-)

Да, кажется будет возможна такая очень направленная реклама - для опеределённых читателей топика или статьи. Спасибо за то - что обратили внимание.
Может дополнить в стринг после хеша - что-то уникальное для страницы и не делать по нему поиск (из хедера - не надёжно - могут поменять, УРЛ - длинно и ненадёжно, генерировать ещё один NID на каждую страницу?) и результат приходящий с других ресурсов - считать спамом (аналогия с проверкой реверс-DNS).
Можно использовать чужие NIDы (как ИД ресурса, отвязанный от УРЛа), но это даст чужую информацию, которая не имеет смысла (какая разница тогда со всем интернетом?)


Пока для подобной (описанной в этом топике) группировки - я ничего не могу придумать иного - кроме как поддержание сервера индексов, где левая часть - ассоциации (keys), справа - большие чанки текста, уникально идентифицирющие страницу (что менее надёжно чем NID).
С точки зрения спама - текстовые чанки конечно понадёжнее (никто не знает - что я там просмотрел/заприметил/забукмаркил). Но это не мобильно (я хочу иметь доступ ото всюду и иметь "расширение" своего мозга там-же, в интернете, а не держать отдельный сервер и молиться за сохранность базы).
В любом случае надо думать о других вариантах, спасибо за комменты.

siberean
() автор топика
Ответ на: комментарий от siberean

> Да, grep'анье вашего кэша - может помочь

Где я сказал про греп??? У меня там то ли htdig то ли mnogosearch

> я руководствуюсь следующим законом: для вас (и меня, и любого другого) - важны в любом документе/страничке только лишь те ассоциации - которые у вас появились в момент прочтения

Ну это прямой путь к кастомной искалке. Остается еще добавить, что есть несколько человек, по ответом которых я ТОЖЕ бы хотел искать. Особенно тут, на ЛОРе, в завалах говна в толксах можно найти интересные темки, если следить, где постят некоторые :-)

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от siberean

Задумайтесь о том, что НИД-ом ваши желания кастомного поиска вероятно не ограничатся. Потом захочется *свою* весовую функцию, в которой учавствуют веса друзей по сложным зависимостям.

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от siberean

>Односторонний хэш - не нарушает анонимность

1. Анонимность не совместима с возможностью идентификацией автора. Т.ч. нужно определиться, что нужнее.

2. Использование имени никаким образом не нарушает анонимность. Анонимность нарушает публикация личных данных. Не предлагалось, хотя, это и несущественно IMHO. 

3. Свои "произведения" легко искать и без того -- оставляя копии  "дома".

4. Проблема китайцев, как раз, именно так легко решается -- только, я слышал, их язык не любит кластеров согласных, что легко чинится.

>Вы наверное держите огромную базу данных букмарков, да? 

Уже нет - они устаревают быстрее, чем становятся нужными. Т.ч., может статься, что вообще эта вся идея не нужна. Нетленку по любому нужно хранить в более надёжных местах, а временное - вообще "завтра" удалять нафиг.

DonkeyHot ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

я хочу подчеркнуть - что я разделяю 2 разных функциональности: искалку и запоминалку.

Искалка - позволяет сформировать запрос и искать в ещё неизведанном (т.е. ассоциаций ещё нет).
Ответов будет миллион из интернета, или греп будет трудиться часами. И потом понадобятся подзапросы, анализ, разочарования - что не "выходит камменный цветок", не находится то что нужно.

После того как мы посмотрели, распарсили и сформировали несколько ассоциаций - нам нужна запоминалка. Используя которую и те построенные ассоциации - мы быстро доступимся до той-же информации в будущем.
(потому что раз сформированные ассоциации - с нами почти навсегда)
Вот такой мгновенный доступ - и нужен.

Какие-то проприетарщики уже сделали очки с коммандной строкой и ассоциативным сервисом примерно год назад в калифорнии (мне говорили - они из МИТа, не знаю): пишешь кейворд - возвращает твою инфу, записную книжку, типа того. А я кажется это предлагал здесь на лоре под другим ником или анонимусом году в 2003. Именно в виде очков с коммандной строкой :) казалось наверное крези.

Но там нужна поддержка отдельной базы индексов.
Мне кажется облачные метки "в интернете как облаке" в виде НИДов (или чего-то другого) - это по-сегодняшнему и намного получше локального индекса.
Поэтому и пытаюсь сынициировать коллективный интеллект для критики.

siberean
() автор топика
Ответ на: комментарий от www_linux_org_ru

>Задумайтесь о том, что НИД-ом ваши желания кастомного поиска вероятно не ограничатся. Потом захочется *свою* весовую функцию, в которой учавствуют веса друзей по сложным зависимостям.

это вписывается.
я могу иметь и private/скрытые кейворды, засунув под хэш:

$ echo "Вася" | nid
$ 43HjCqnkmP4yZa1OiQ==

и соединить NIDs
и так как посковик будет иметь тот-же протокол - то введя "Вася" и чекнув бокс "привате кейворд" будет искать по чему-то такому:

XQgYnkSBwZXZXZlcmwmyu43HjCqnkmP4yZa1OiQ==

и никто не будет знать - и под какими кейвордами я храню тоже.

Веса можно раздать уже на уровне аппликации-клиента-поисковика.

Что-то типа этого.

siberean
() автор топика
Ответ на: комментарий от DonkeyHot

1. ну да, я конечно согласен - что любая группировка даст гораздо бОльшие возможности идентификации. Группа, даже если она анонимная - несёт дополнительную инфу для анализа. Тут скорее потеря анонимности - для возможности быстрого доступа.

2. Публикация имени для меня не сильно отличается от публикации НИДа (только гораздо слабее в смысле коллизий и даже менее анонимно так как 64-ричное число - не несёт инкакой информации вообще - само по себе).

3. хранение дома порождает проблему поддежания многих версий, проблему синхронизации, необходимость платить за ЭЭ, хардваре. "Облако" Интернета бесплатно. К этому всё движется.
Вы и не доступитесь до вашего стореджа - если интегратор вашего мобильного устройства - не поддержит этого. Ролики на ютюбе, контент на ЖЖ и подобных - доступен всегда и отовсюду и будет таким и после нашей смерти и может быть - и через миллион лет (этот контент расползается по датацентрам на всех континентах и есть самый надеёжный способ хранения информации).

> Нетленку по любому нужно хранить в более надёжных местах


Где? утверждается что "облако" где-то у амазона или гугла - и сеть то самое надёжное место.

> временное - вообще "завтра" удалять нафиг.


сколько я себе локти кусал через сколько то лет - что что-то потёр раньше. Сегодня кажется лажа, а потом - оказывается - было-бы полезно. От курсача, решённых заданий и диплома (которые казались устарели) - до вещей которые отметил, забыл, а потом вспомнил - что "я это уже встречал". Если-бы сохранял всё с хуками - то всё видимое и помеченное - находилось бы за секунды.

siberean
() автор топика
Ответ на: комментарий от siberean

> "Облако" Интернета бесплатно. К этому всё движется.

Халявщик ты Вася. Гугль на профилактически работы отключит 0.01% своих компов с базой, там окажется твой НИД -- и все, кусай локти. Запоминалка должна быть своя или платная. Я свои "расширенные букмарки" храню у себя. При наличии бэкапа можно не "молиться".

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

И часто гугль вас так банит, возвращая 500?
Даже корпорации и говернменты уже походу завязываются на гуглы или яху-мейлы, сервисы ибмов и амазонов. Уже все большие компании имеют свои "облачные" стойки на всех больших разводиловах^Wпрезентациях - уже пару лет как. Народ кажется тоже ведётся.
Последнее время я тоже повёлся. Из практических соображений.
Отключат электроэнергию в раёне - я поеду в универ или кафе в другой раён - и продолжу пользоваться всеми своими ресурсами. В том то и дело - что база у них распределённая и хоть вы не только 0.01% отключите, а все 50% - если телекомы и главные транки стоят - то доступ будет. Выйдем под другим провом, от Пети, из другого города.
Ваша база как - в текстовом виде (греппабле) на USB, или реляционка на лэптопе? (каюс - много лет делал то же самое. Теперь понимаю - что лучше быть свободным от железок, "человеком мира" так сказать, не нося с собой ничего - и по хукам и связкам - иметь возможность откопать из глобальной помойки всё что мне надо за конечное число итераций)

siberean
() автор топика
Ответ на: комментарий от siberean

Предлагаю ввести мем: "почётный бомж интернета". Что безусловно прогрессивнее - чем иметь привязку к кому-то одному, свой сайт, свой мейл-сервер, свой DNS итд.
Я свои домашние сервера погасил несколько лет как. А так да, хранил всё там. Сейчас я "бомж интернета" и ровным слоем намазываю информацию по всему интернету.

Это как-то старомодно - иметь ИТ инфраструктуру дома. "У меня дома - жужжат сервера". 90-е годы было круто. "Я захожу на них и апдейчу свои базы". Это производило когда-то неизгладимое впечатление во времена виндовс 95 и даже 2000, но не сегодня - так как это и неудобно и накладно. Некоторые погасили домашние сервера уже давно (я - в их числе).
Датацентры дешёвого железа превращают хранение информации - в коммодити.
Особенно во времена хендхелдов и нетбуков.

вот мне как "бомжу интернета" - теперь надо NID :)

siberean
() автор топика
Ответ на: комментарий от siberean

> Ваша база как - в текстовом виде (греппабле) на USB, или реляционка на лэптопе?

Читать научись сначала, писатель RFC ты наш. Уже говорил -- ни в одном из этих видов. Кэш прокси, проиндексирован (повторю для нечитателей -- проиндексирован) htdig. При желании можно, хотя обычно и не нужно, погрепать.

Кстати, а как ты из гуглевого кэша достанешь пред-пред-предидущую версию страници по данному урлу пятилетней давности? *Ровно* ту, на которую ты сделал букмарк, и сейчас удаленную по всему миру? Я у себя могу. Хотя и нет у меня удобного механизма вытянуть старое содержимое данного УРЛа (приходится руками лезть, не из браузера). Почему я и подумываю написать свой прокси без данного недостатка.

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

> Хотя и нет у меня удобного механизма вытянуть старое содержимое данного УРЛа (приходится руками лезть, не из браузера).

В смысле содержимое, отличное от последнего скэшированного.

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

/и сейчас удаленную по всему миру/и уже 3 раза отредактированную с полной пропажей интересной инфы/

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от siberean

> вот мне как "бомжу интернета" - теперь надо NID

А как быть, если интересная страница, suitable for bookmark, не имеет возможности ее откомментировать? Или жизнь ограничена ЖЖ? Тогда тебе надо не RFC писать, а feature request в ЖЖ.

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от siberean

> Это как-то старомодно - иметь ИТ инфраструктуру дома.

vds 10GB спасет :-)

_____________________________

Кстати, гугль ЕМНИП не кэширует картинки (thumbs не в счет). А я кэширую.

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от siberean

>3. хранение дома порождает

Не дома а "дома". Грубо говоря, бекапишь всё, кажущееся ценным в N доверенных/арендованных/и т.п. местах, хоть в том же google, в своём личном "каталоге" с обязательной авторизацией. _Там_ _же_ и ищешь. И у тебя не возникает вопросов со "злонамеренным" использованием чужих ID. Спамеры не спят, и как только схема станет популярной, они начнут искать методы добавить "твой" ID в публикуемые сообщения.

>утверждается что "облако" где-то у амазона или гугла - и сеть то самое надёжное место

Вопрос в том, _кем_ утверждается. "Гугл" тебе _лично_ пообещал? Даже если да, бекапы в _независимых_ местах держать нужно, и репликацию всё равно настраивать. Это ести ты данными дорожишь (если нет - вс' проще).

>Если-бы сохранял всё с хуками - то всё видимое и помеченное - находилось бы за секунды

Зато в процессе поиска ты не натыкался бы на новые сведения. Так ты, нет-нет да и наткнёшься на информацию, которой "тогда" не заметил, не придумали, не опубликовали, с тех пор исправили, etc. В результате ошибка в твоих знаниях будет исправляться. Да, дольше -- такова цена знаний.

DonkeyHot ★★★★★
()
Ответ на: комментарий от DonkeyHot

> Да, дольше -- такова цена знаний.

ммм... все не так грустно. И локальный кэш можно использовать для ускорения глобального поиска *многими* интересными способами (правда у меня руки не дошли).

Например, кэш 2-го уровня, куда тянутся найденные АВТОпоиском по гуглу аналогичные страницы по автору, ключевым словам, ...

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

окей, спасибо за дискуссию - вы меня аргументированно убедили - что на RFC по крайней мере сейчас - не стоит больше тратить время (есть чем - более срочным заниматься - например, дочитать книги которые возвращать в библиотеку:).
Я подумаю насчёт NID ещё. И попробую использовать подписи для себя - где это удобно (и как опцию - хранить стринг заглавия например - в локальной базе).
Может и вернусь опять когда-нить к этой крези идее.

Спасибо ещё раз - что откликнулись и потратили время на аргументацию и ценные инпуты.

siberean
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.