LINUX.ORG.RU

Масштабируемый репозиторий букмарков...


0

0

- это самое простое использование программы которая пишется для поддержания огромных life-time архивов и быстрого нахождения по ключам, которые вы вводите _сами_ (вручную или скриптом) - а не кто-то за вас индексирует всё и вся.
Скриншоты здесь:
http://sourceforge.net/project/screen...
только конструктивно пожалуйста...

>>> а проект конечно на сорсфорже



Проверено: Demetrio ()

Несмотря на серьезные разногласия с автором в прошлый раз, хочу поздравить с продолжением проекта!

macavity
()
Ответ на: комментарий от Anode

Ну вы,блин, даёте... :)
Сохраню тред, буду перечитывать, на сон грядущий... :)
Чё-то я до конца идею так и не осознал в полной мере,
но судя по всему какое-то рациональное зерно в этом всём есть... :)

Renso ★★
()

Для упорядочения порно я использую download sort - хватает за глаза :-)

anonymous
()
Ответ на: комментарий от Anode

ну вот, ещё пара таких тредов и вы придёте к закономерному выводу - надо писать всё в ассоциативную память, а пока нет дешёвой ёмкой АП, будут появляться и исчезать всевозможные костыли...

anonymous
()
Ответ на: комментарий от Anode

Интересно было почитать.... Василий, мне иногда кажется что Вы пишете Репозитарий ради самого процесса написания. Ну, напрочь отсутсвует постановка задачи, требований и ограничений, их обоснование. Кстати, может я плохо читал, но я не увидел ни одного ОБОСНОВАНИЯ с вашей стороны:
- зачем создан Репозитраий;
- чем он отличается от существующих решений.
Мне вообще не понятно откуда Вы взяли эту мистическую цифру в милиионы и миллиарды?

Свои измышления, еще по предыдущему треду, я изложил отдельно. Могу напомнить -- http://forth-j.narod.ru/note.htm Хотя, каюсь, до сих пор его не обновил. Но там хоть приведена предельная оценка цифры количества документов, доступная при РУЧНОМ индексировании.

Вы говори об обмене букмаками... Простите, а какой формат представления этих самых букмаков вместе с метаинформацией? Вы свой собственный предлагаете или существующий? Какой?

Опять же, повторю вопрос, он действительно важный -- какая ваша личная статистика использования Рубрикатора (Вы же его используете, не так ли)? Кол-во ежедневно помещаемых документов (букмаков), среднее кол-во ключ. слов на каждый документ, общее кол-во ключ. слов в Рубрикаторе, среднее время ручного индексирования нового документа...

Я по настоящее время использую ScrapBook. Руссифицировал его и отправил автору. Моя личная статистика -- 10..57 документов ежедневно. Это проиндексированных. Правда и то что время жизни различных документов разное -- одно становится не нужным и уходит....

Вы сокрушаетесь, что вам не помогают в кодировании. Но это просто следствие, того что не можем понять как он впишется в личную инфрастуктуру. У каждого что-то уже есть. Есть сложившиеся подходы, сложившейся, набранный инструментарий под ЭТОТ подход. И для начала нужно чтобы человек принял подход к работе с информацией, который Вы предлагаете. И _только_ после этого можно разговаривать о реализации. Кстати, если обратите внимание, то большая часть высказываний здесь носит концептуальный характер.

Извините уж, если где-то резкова-то выразился....
___________
Алексей

anonymous
()
Ответ на: комментарий от Anode

>а вот вы пришли к товарищу и он дал вам кучу всяких референсов.

>Вместо того чтобы записывать на бумажку или слать мылом домой - вы

>откроете браузером свой домашний репозиторий и накидаете всё сразу под

>Придя домой вы сможете достать всё данное Петей как одна группа, но

>также сможете в будущем восстановить _все_ замечания, заметки сделанные

>Петей по ходу, ничего не забыв и не переписывая с бумаги и не копируя

>из мыла. Время дорого! Займитесь лучше с семьёй, а к инфе 2 раз

>Как такой сценарий?

В рассуждениях юного пионера меня забавляет только одно -- представляет ли он себе, что создает "помойку" из ключей над файлопомойкой. Как, скажем, спустя год, он будет вспоминать что был какой-то Петя, с каким-то днем рождения и там какие-то данные давали... А когда таких дней рождения наберется десяток? Впрочем, он еще очень юн и не понимает, что годы идут, а инфа копится... И что знание о том, где лежат знания -- тоже знание 8)

anonymous
()
Ответ на: комментарий от anonymous

>Репозитарий ради самого процесса написания.
честно говоря, частично - вы правы:
только на 20% - мне нужен репозитарий (он у меня уже есть, UTF там неоптимально хранится и пр. - это мелочи), как бы я уже с этим могу жить и постепенно за годы зафиксаю.
80% моих тайных целей - это отлаженная фреймворк и надёжный персистент-хэш сколь-угодно большого размера (текстовый аналог [gn]dbm, но чтобы xml-ем не пахло;). База данных. Хорошая, текстовая, эмбеддед, из API. Не раздутый клиент-сервер с sql-прослойкой, а просто in-process платформо-независимая файл-система, с возможностью индексировать ключами. Другими словами - берклидб но текстовая которую можно и в коммерческие проекты забесплатно впихивать. Но на фреймвок никто не "поведётся" - народ интересуют игрушки как хранилище закладок, чтобы фильмы смотреть по сетке - с файло-сервака на чердаке и возможность вытянуть старые файлы из помойки. Если бы последнее пошло - то проект автоматически отладил бы и базу (сущ. аналоги которой пока плохи кто из-за лицензий, кто - формата или масштабируемости).
Потом я буду (на старости лет) экспериментировать с этой базой на предмет семантических сетей, реализаций поисковых алгоритмов (выше упомянуты хопфилды, больцманы, нейро-сети, пролог перепишу - там один алгоритм и охеренное дерево, которое удобно хранить как-раз в таком хэше, экспертная система требует такого хэша итд). Для тех будущих экспериментов-проектов - мне прежде всего нужна бесплатная, моя терабайтно-петабайтная база со скоростью не сильно отличающейся от скорости доступа к файлу.
Вот такие тайные цели. Но для того чтобы что-то кушать, заработать на эксперименты - надо повпаривать клиентам какое-нибудь супер-решение, и игрушки типа персонального браузера могут помочь отладить то супер-решение. Только братвой навалившись можно сделать что-то большое (ну, или деньгами, у кого их много).
Хотя опять же не факт что букмарки-архивы пойдут, но похоже же на то.

Anode
() автор топика
Ответ на: комментарий от anonymous

>В рассуждениях юного пионера

если вы вдруг annonymous - прошу вас быть честным и не выступать уже как anonymous. Извините если не так.

Anode
() автор топика
Ответ на: комментарий от anonymous

>Но там хоть приведена предельная оценка цифры количества документов, доступная при РУЧНОМ индексировании.

док хороший - его можно использовать для стандартизации частного решения.
Цели же - глобальны, как я описал выше и мне надо будет _очень_ много документов хранить. То что мы пытаемся сделать - ничто по сравнению с будущими задачами анализа днк, да даже более приземлённая задача - создание персональных библиотек. Я хочу долго делать запрос, написать его возможно в коде - один раз запустить - и иметь свой срез всех существующих например в машкове книг. _Свою_ эвристику буду запускать, а не довольствоваться тем что мне дадут в стандартном каталоге.
Лабораторию для экспериментов хочу.

Anode
() автор топика
Ответ на: комментарий от anonymous

2 Алексей

>Вы говори об обмене букмаками... Простите, а какой формат представления этих самых букмаков вместе с метаинформацией? Вы свой собственный предлагаете или существующий? Какой?

примитивный текст, который вы можете поправить (и многие юзера это _будут_ делать).

>какая ваша личная статистика использования Рубрикатора (Вы же его используете, не так ли)?
очень маленькая - 2.5 индекса (~1600 ключей). Но 1)я им пользуюсь 2)это у меня нет времени пока на это. Подозреваю что средний юзер вобъёт больше.

Anode
() автор топика
Ответ на: комментарий от anonymous

>ну вот, ещё пара таких тредов и вы придёте к закономерному выводу - надо писать всё в ассоциативную память, а пока нет дешёвой ёмкой АП, будут появляться и исчезать всевозможные костыли...

я такую память вам предлагаю. Берите. Дешёвая - менее доллара за гигабайт.

Anode
() автор топика
Ответ на: комментарий от anonymous

>Вы говори об обмене букмаками...

он возможен уже сейчас только сложно (через find/grep/sed - получить пары key->value и сохранить в файл, принести его домой и для каждой строки сделать 'put -k "key" -v "value").
Мне этого достаточно. Если будут пользовать - напишут дополнительные и более удобные тулы (если это конечно надо - я не знаю...).

Anode
() автор топика
Ответ на: комментарий от anonymous

>Кстати, если обратите внимание, то большая часть высказываний здесь носит концептуальный характер.

потому что моим собеседникам выше было прекрасно известно, что тот кто умеет обрабатывать информацию правильно - рулит в будущем. Я не хочу полагаться на кого-либо.

ИМХО, но тсс, большой секрет:
поисковые публичные сервисы - это следующие после майкрософта. Вы делаете запросы, а статистика запросов - обучает чьи-то нейросети, добавляет данные в экспертные системы итд.
Когда линукс победит во всём мире - вы проснётесь с праздничного похмелья и удивитесь что тот кто накопил большие базы знаний в любом структурированном виде - превращается в большего большого брата.

Давайте, в соседнем треде - рассуждайте про эшелоны. Эшелон - рядом с вами. И имя ему - знания.

Я преджлагаю разрабатывать _открытый_ фреймвок накоплений и обмена такими знаниями. Как - пока сам не знаю. Но и не начав - ничего не будет.

Anode
() автор топика
Ответ на: комментарий от anonymous

>И что знание о том, где лежат знания -- тоже знание 8)

напоминает "все люди равны но одни - более равны чем другие"

это как раз в подтверждение моих слов.
Если яху спрячет от меня знание - завтра я его не получу. Или получать буду медленно и не то и за деньги.
Если у меня знания на винтах, а также у знакомых - то я его могу уже гарантированно получить, пусть долго ища. Если я имею стопку закладок - то получаю те данные быстрее чем поиском по иерархии. Или использовать или написать язык для экстрагирования данных.

Anode
() автор топика
Ответ на: комментарий от annonymous

> Описание Ледового Побоища различается у историков противостоящих
> сторон с точностью до наоборот ;)
Т.е. немецкие историки утверждают что русские ополченцы
утонули в Чудском озере? Хмм...
Не подбросите ссылку на источник вашей информации?

А вообще, глядя на новостные ленты CNN и Аль-Джазиры, наши потомки
несомненно будут клясть нагадивших им древних историков ;)

anonymous
()
Ответ на: комментарий от Anode

> Если яху спрячет от меня знание - завтра я его не получу.
> Или получать буду медленно и не то и за деньги.

Кстати, миграция знаний из публичного в коммерческий сектор -
всеобщая тенденция. Пять лет назад доступ к патентному серверу был
бесплатен. На днях я попытался посмотреть некий патент.
Мне выдали первую страницу, чтобы посмореть остальные - надо оформить
подписку. Недорого, всего $420 в месяц ;)

anonymous
()
Ответ на: комментарий от anonymous

>Пять лет назад доступ к патентному серверу был
бесплатен. На днях я попытался посмотреть некий патент.

я эту тенденцию наблюдаю последние 3 года.

<шутка>
Срочно всем "wget -r" тырнет какой он есть сегодня! (разбившись на группы) - как минимум по генетике/кибернетике/биотехнологиям и прочее
</шутка>

Anode
() автор топика
Ответ на: комментарий от Anode

Не могли бы на пальцах обяъяснить, что есть "фреймворк" и для чего он нужен.

Насчет "надёжный персистент-хэш" -- я так и не понял, для чего он нужен и чем он лучше других структур... Свои проработки я тоже с хэшей начинал, но потом отказался... А чем SleepyCat не удовлетворяет?

"База данных. Хорошая, текстовая..." -- не стоит путать формат _хранения_ со _внутренней_ структурой данных. Разные цели (требования) -- различное и решение.

Для меня более важна задача _структурированного_ накопления информации. ЗДесь мы с вами пересекаемся. И боюсь, что для многих она тоже актуальна. Когда будет понятна общая концепция тогда можно будет заняться и реализацией. Но думаю, что в том виде в каком она мне представляется и сущетсвующих структур данных будет более чем достаточно, что ставит под вопрос необходимость в вашей разработке библиотеки хешей именно в этой прикладной области...

___________
Алексей

anonymous
()
Ответ на: комментарий от Anode

ага, а поимев инфу о технологиях получения оружейного плутония много пользы тебе будет? все кому это надо давно уже её имеют. иметь инфу _не_значит_ иметь возможность её использовать. ну узнаешь ты например как реализовать ассоциативную память (необходимый компонент ИИ) с помощью биотехнологий http://www.rusbiotech.ru/article/1c.php, ну и что? построишь в гараже заводик по её производству?

anonymous
()
Ответ на: комментарий от anonymous

2Алексей
>фреймворк

библитотеки+тулы, иными словами. Для других проектов/экспериментов.

>надёжный персистент-хэш

о каких структурах вы говорите? О тех которые в памяти или всё же персистент. Последнее слово - ключевое. База данных.
Слипикэт плагин там есть. Ненравится 1)несвободность для будущих коммерческих решений, когда подаётся именно как хэшная база. 2)бинарность внутреннего формата - самое неудобное.
Пока я пользовался бинарным файлом - я не мог себе позволить не поддерживать и текстовый вариант. импорты - много времени на прописывание тулов и страшно потерять (не хочу проверок делать). Текстовый формат - необходим для _стандартных_ тулов (unix) и как я уже сказал - надёжности хранения. Только когда я вижу данные через многие тулы (и я могу их фикснуть в эдиторе) - я могу спать спокойно. 3)внутр. формат хр.данных слипикота,ndbm,gdbm уже менялся не раз и опять оворится о смене. Не хочется. Тем более что вроде говорится вообще об xml. Мы можем иметь надёжный формат _уже_сейчас_ и на века имхо.

>Но думаю, что в том виде в каком она мне представляется

я и запостил - чтобы искать и получать фидбеки.
Всегда есть противоречие между желанием программиста сделать что-то общее/универсальное (не "плодить сущности", как здесь правильно заметили) и уже сейчас, быстро получить реально-используемое другими приложение.
Как кто-то сказал, для программиста существует 3 числа: 0,1 и бесконечность. И если надо сделать гую - он вгрохает кучу времени на поддержку возможности создания 2^32 (или 2^64) окон :)
Но с данными - это немного другое и истории создания таких тулов как gnu awk,sed,diff подтверждают (разрабатывались когда память была порядка на 4 меньше) что у хороших тулов - не должно быть искуственных границ. Кстати, многие коммерческие аналоги уже канули в лету именно из-за этого. С дисками - уже на нашей памяти рост - почти на 5 порядков. Если так будет развиваться, то и петабайтов на нашей памяти будет не хватать. Я хочу хорошее, универсальное, масштабируемое, открытое решение хранения-поддержания-доставания.
Давайте обсуждать.

Anode
() автор топика
Ответ на: комментарий от anonymous

>ага, а поимев инфу о технологиях получения оружейного плутония много >пользы тебе будет? все кому это надо давно уже её имеют. иметь инфу >_не_значит_ иметь возможность её использовать. ну узнаешь ты например >как реализовать ассоциативную память (необходимый компонент ИИ) с >помощью биотехнологий http://www.rusbiotech.ru/article/1c.php, ну и >что? построишь в гараже заводик по её производству?

нет, первое 1)меня лично не интересует 2)обязано быть закрыто и контролироваться соответствующими организациями

Заводик я строить не хочу, но чтобы учится и тем более заниматься наукой - необходима информация и много. Желательно статьи а не только туторы для ширпотреба. И чем больше - тем лучше. И доступ к ним - быстрый.

Anode
() автор топика
Ответ на: комментарий от anonymous

насчёт биотехнологий - это ещё и готовые решения которые природа _уже_ продумала и отладила генетическим алгоритмом.
Надо только научиться эти решения брать - для использования в технике. Я не говорю - для познания себя вообще.

Anode
() автор топика
Ответ на: комментарий от anonymous

да, к предыдущему. Чтобы предупредить вопрос - почему не существующие RDB - для персистенса.
хотите использовать mysql - нет проблем - там плагин есть. Хоть с hibernate.
Но мне кажется (пока;) что использовать RDB для хранения только текстового хэша - это тоже самое что использовать weblogic для домашней статической странички. И usability для массового юзера совсем иная.

Anode
() автор топика
Ответ на: комментарий от anonymous

> ага, а поимев инфу о технологиях получения оружейного плутония

Дело не в производстве плутония или био-ассоциативной памяти.
Речь идет о том что количество информационного шума (устаревшей
информации, рекламы, архивов форумов, и т.д.) в Интернет растет
экспоненциально. Google сейчас чемпион по бегу среди черепах,
а Ахилл (Интернет) все увеличивает отрыв. Черепаха никогда не
догонит Ахилла, что бы нам не втирали древние.
Отсюда мораль: личные архивы со временем будут все важнее,
т.к. концентрация информации в них на порядки выше любого поиска
в гугле и иже с ними (и разрыв будет все увеличиваться - см. выше)
Иметь надежный *личный* инструмент по их поддержанию, независимо
от их объема - очень важно.



anonymous
()
Ответ на: комментарий от anonymous

>Отсюда мораль: личные архивы со временем будут все важнее,
т.к. концентрация информации в них на порядки выше любого поиска
в гугле и иже с ними (и разрыв будет все увеличиваться - см. выше)

хочу ещё вас чуть-чуть дополнить здесь: концентрация _узконаправленной_ нужной информации, как результат проделанной специалистом (уникальным индивидуумом) работы. Это если хотите - результат оператора действия данного индивидуума на окружающие хаотические данные выраженные в виде вытаскивания и перетасовке нужных данных, разбития их на группы-подгруппы и присвоение этим группам - символьных (значимых другим гомосапиенсам) переменных. Вот ;)

Anode
() автор топика
Ответ на: комментарий от Anode

Насколько я правильно понял -- вы хотите в однм флаконе сделать импорт/экспорт хэша в текстовую форму, прочем делать это на этапе старта/окончания работы приложения. Для чего сие нужно объяснено очень туманно. Но можно понять только одно, что автору очень интересно заниматься реализацией очень больших хэшей.

С другой стороны мы имеем смешение двух различных задач: одной очень важной практической, действительно актуальной для многих -- ведение личных архивов. Заметьте, с вами никто не спорит об их целесообразности! Интересует многих предлагаемая модель работы с ним (архивом). Для которой (модели) автором и был создан некий инструмент. Якобы. Но на самом деле, как выясняется, сей инструмент был создан совершенно в других целях -- а именно в рекламных.

Что в остатке? РАЗОЧАРОВАНИЕ. Я считаю, что вы сделали грубейшую ошибку -- занялись не решением задачи, а подгонкой задачи под решение! И на свою голову выбрали, еще к тому же, актуальную задачу, блин....

Так почему бы сразу об этом не сказать? Не написать истинные цели своей разработки?

__________________
Алексей.

anonymous
()
Ответ на: комментарий от anonymous

>Насколько я правильно понял -- вы хотите в однм флаконе сделать
импорт/экспорт хэша в текстовую форму, прочем делать это на этапе старта/окончания работы приложения. Для чего сие нужно объяснено очень туманно. Но можно понять только одно, что автору очень интересно заниматься реализацией очень больших хэшей.

да, прямо внутри сохранения, доставания.

>Для чего сие нужно объяснено очень туманно.

я уже говорил что для своего пролога (возможно), неограниченной ассоциативной памяти и экспериментов. Может - база данных выльется из этого также. Ведь есть уже работающие, отлаженные ФС, поддерживающие сотни петабайт. Я не способен переписать один те структуры (а мне как раз надо именно то же самое реализовывать - Btree*) что уже проделано SGI и IBM в их ФС и последние - свободны. Всё равно ведь будет какая-то ФС подо мной так я просто использую нужную (имхо, пусть меня поправят старшие товарищи - если это проедположение неверно) - и причём без работы с моей стороны в направлении программирования тех деревьев. Я только делаю другой интерфейс для вышеупомянутых структур (пока есть 3: скрипты, java api и веб. Нужно будет и С API тоже, но только когда подтвердится, что всё работает с жавой и проект кому-то нужен и как-то себя окупает. Т.к. на С я буду делать это значительно медленнее чем на жаве).

>Но можно понять только одно, что автору очень интересно заниматься реализацией очень больших хэшей.

да.

>С другой стороны мы имеем смешение двух различных задач: одной очень важной практической, действительно актуальной для многих -- ведение личных архивов. Заметьте, с вами никто не спорит об их целесообразности! Интересует многих предлагаемая модель работы с ним (архивом). Для которой (модели) автором и был создан некий инструмент. Якобы. Но на самом деле, как выясняется, сей инструмент был создан совершенно в других целях -- а именно в рекламных.

естественно. Программисты меня поймут. Если можно решить сразу 2 или больше задачи неплохо - это очень хорошо. Тем более я его начинал _действительно_ для архивов, но понял что могу реализовать и другие вои планы. А как делаются библиотеки, позвольте вас спросить - для самих себя? Кто-то вам будет платить за библиотеки или абстрактные структуры? Они обычно делаются для решения бизнес-проекта, шлифуются, полируются (чаще в голове) и компания специализирующаяся на каком-то своём продукте, в виде побочного продукта получает библиотеку.
Читаем
http://bugtraq.ru/law/articles/cauldron/part1.html#_toc76997834

>Что в остатке? РАЗОЧАРОВАНИЕ. Я считаю, что вы сделали грубейшую ошибку -- занялись не решением задачи, а подгонкой задачи под решение!

вы что не программист что-ли?
ещё раз - читаем Реймонда.

>И на свою голову выбрали, еще к тому же, актуальную задачу, блин....
Я вам уже почти решил вашу частную задачу, о которой Вы говорите. Подумайте. Возьмите и посмотрите как всё работает. Детали (какие поля вам нужны) - это частная бизнес-логика, которую при наличии небольшого времени дописать можно за конечное время. Поддержка плагинов во все браузеры, эксплореры - немного сложнее, но и то возможно.

>Так почему бы сразу об этом не сказать? Не написать истинные цели своей разработки?

Какие? Цель (ближайшая) остаётся. И я её определил изначально - поддержание сколь-угодно больших архивов.
Лично Вам: Если Вы менагер, задумавший поднять свой подобный проект в одиночку - попробуйте сами - желаю удачи. Но надеюсь всё-же что вы просто меня неправильно поняли и в конце концов присоединитесь если это вам действительно нужно (не отрицаю что и я виноват и мог плохо преподнести идею без общения лично - из-за ограниченности коммуникации в одном треде)

anonymous
()
Ответ на: комментарий от anonymous

Ух-ты, забыл логиннутся. Извиняюсь. Предыдущий пост - мой.

Алексей, я попробую за тебя бороться :)
Это непростительная расточительность - терять людей, которые заинтересованы в _том-же_ самом, желающих двигаться в общем-то кажется в том же направлении. Ты написал отличный док и совсем немногие смогут так сформулировать и упорядочить спек. По-крайней мере, я знаю мало таких программистов кто может/хочет это делать. И порядок в голове - это редкое качество. Различие в выборе каких-то структур и конкретной логики - это всего наверное процентов 10 по отношению к подавляющему большинству вещей, по которым мы согласны и их можно обсудить (я их тоже взял не с потолка и я объясню что и почему взято, соглашусь - если не прав). Если ты или мы увидим что из-за каких-то споров работа неэффективна - ты всегда сможешь форкнуть проект. Но надо попробовать имхо. Подумай. Мы ещё не начинали ничего вобщем-то обсуждать - так, прикидки мнений (и даже последнее не начинали).

Anode
() автор топика
Ответ на: комментарий от Anode

> Алексей, я попробую за тебя бороться :)

Это правильно! При любом раскладе! Могу только громко приветсвовать :)

Моя позиция на сегодня проста -- лучше шевелить мозгами, нежели двигать ногами, т.е. руками :) Посему, иду от проблем. Проект затрагивает мои частные проблемы -- поэтому мне интересен. Но я готов говорить о реализации только после _четкого_ принятия тех аргументов, которые образуют его основу. Это как на флоте -- пока принмается ршение, все высказываются, а потом все делают.

Я очень активно пользуюсь плагином ScrapBook. Уж не знаю как там его японец спроектирвоал -- по наитию, по своим потребностям или как продолжение некоего своего коммерческого проекта, но попал в яблочко. Очень сильно помогает в работе. Именно поэтому я его и перевел. Кстати, тот документ тоже в нем и готовился. И этот пост тоже в нем лежит. Да, многое что в плагине не достает. Но он служит отличной базой что бы начать нормально работать... Вырабатывать и использовтаь новые подходы, более эффективные.

Кстати, о личных архивах -- очень, очень важнейшая и сверактуальнейшая тема. Я бы предпочел сосредоточиться именно на ней. На выявлении проблем и методов их решений. Механизмы и проч вещи по их реализации подскажут -- главное было бы ЧТО реализовать. Вернее -- понятно, кратко, лаконично и внятно описано ЧТО предлагается и для ЧЕГО.

Сегодня, вот искал интервью Новодворского, которое он дал в Казахстане -- уже нет.... а жаль, был бы на то время удобныйинструмент по захвату страниц в личный архив бы: а) не кусал бы локти; б) сэкономил время; в) успел бы попить пива... :( (А вы --- Хэши. Пиво по пятницам!)

____________
Алексей
ЗЫ. Я -- не программист. По образованию. Проектировщик. По складу характера.

anonymous
()
Ответ на: комментарий от anonymous

Алексей,
сразу насчёт пива: вот _только_сейчас_, после твоего постинга - я могу наконец попить пива! :)

ты прав во всём&#184; кроме одной мелочи: написав основу - пусть не на 100% удовлетворяющее именно твоим требованиям (а может - многое вообще мигрирует к чему-то другому в будущем) - я преследовал единственную цель: показать мой стандарт (ведь кто-то может быть не согласен уже на этом уровне) и скорость разработки (чтобы всё не выглядело трёпом).

к стандартам обещаю вернуться завтра а сейчас - пиво, как ты и сказал ;)

Anode
() автор топика

Я предлагаю заинтересованных переместится на
http://sourceforge.net/projects/ais/

Я создал 2 мейл-листа (большее количество будет напрягать читать, может даже эффективно будем постить только в какой-нибудь один). Дальше будет видно.

1) ais-general at lists.sourceforge.net
-- для всех вопросов _не_ касающихся кода (видимо пока всё будет здесь)

2) ais-devel at lists.sourceforge.net
-- для вопросов касающихся кода


там ещё есть т.н. "тракер" - им я не пользовался, но подозреваю что не сложнее багзиллы. Надо попробовать. Это для bugs, support requests, patches and feature requests. Если как у багзиллы - то можно и там жить :)

Кто заинтересован: пошлите пож. по мейлу на general list.
Если есть вопросы или проблемы - посылайте мыло мне на vasili эт srcportal net (последний адрес не вечен, но какое-то время проработает - пока всё не устаканилось)

до встречи в мейл-листах

Anode
() автор топика
Ответ на: комментарий от Anode

хм, интересно - rто-то знает почему на сорсфорже мейл-листы показывают всегда (0 Total), хотя всё в принципе - всё работает?

и почему в графике запросов (статистике) всё так запущено...

Anode
() автор топика
Ответ на: комментарий от Anode

Алексей,

Как насчёт отладки документации на сорсфорже?
Там всё будет в одном месте и мы тоже сможем делать какие-то пометки - как в wiki (пока не зафиксируем финальную версию). Ты мог-бы взяться за порядок и централизации документации в
http://sourceforge.net/docman/?group_id=124759
?

Необходимо наверное и русский перевод "What is it"

Зарегистрируйся тогда пожалуйста на sourceforge.net - и я тебя добавлю в лист.

Предлагается в док по спорным вопросам - вставлять какой-нибудь таг типа:

Example: This is some text <NOT_AGREE who=Oleg> this is questionable block </NOT_AGREE> and more and more and more and more text

а также таг <TO_BE_SOLVED assigned_to="vasili,andrew"> или типа этого.

как насчёт такой идеи?

Anode
() автор топика

1. Я против файло- и других помоек. Даже с оглядкой на "благодарных потомков". Один интернет у нас уже есть :) Локально? Я могу найти свои сообщения в net news даже много лет назад, и с трудом то, что писал в форумах пару месяцев назад.

2. Автоматические индексы не ассоциативны, (?) но, во всяком случае, не ассоциативные графы, и тем более, не имеют следов индивида. Они могут потребляться (и потребляются :) индивидуумом, как первичный (сырой) продукт.

3. Интернет, скорее всего, не прикарманят, хотя торговать информацией будут во все возрастающих масштабах. Следствие -- ценность вовремя утянутых страниц/картинок/пдф-ок _для_данного_конкретного_индивидуума_ будет возрастать.

4. Ценность личных архивов -- вещь двоякая. Скорее всего это никогда и никому больше не понадобится, но иногда приятно пощекотать прошлыми воспоминаниями захандревшие чувства. Однако, для восприятия идей лучше те первоисточники, при прочтении которых что-то пришло в голову. (Опять человеческая ассоциативность)

5. Идеи лучше оформлять отдельно от файлопомойки, из которой они выросли, и применять, иначе они останутся просто идеями, пока их кто-нить инженерно/деньгоизвлекательно не прикрутит к чему-нить полезному для более чем 5 человек :) (Следствие -- идеи, которые человек отложил на потом, и "это мне будет нужно в дальнейшем", в 99.99% никогда больше им самим не используются см. двойственность личных архивов).

6. Знания должны передаваться иным способом, нежели добротно хэшированная файлопомойка. Тем не менее, помойка как способ хранения может быть акутальна для многих видов информации -- картинки, плэйн-тексты и пр. никогда изначально не содержащих мета-информации (вам почти ничего не даст знание размера картинки и алгоритм джейпега, если вас интересует то, что изображено)

7. Идея плодотворна в четко очерченной области -- персонифицированный доступ к хаотично накапливаемой информации и решает лишь небольшую часть проблем, особенно для мигрирующего пользователя. КПК и Ноутбук пока что имеют ощутимые преимущества для решения проблемы "все мое ношу с собой" Древние монахи Тибета обходились двумя-тремя постоянно носимыми с собой вещами. :) Налицо нежелание автора учиться отделять зерна от плевел, что подтверждается образцами его письменной речи на русском (это русский?!) и английском языках :))

PS Василий, ничего личного, просто мысли по прочтению второго треда на ЛОРе на эту же самую тему :)

PPS Накапливать знания -- это фетиш. Знания нужно воплощать во благо живущим сейчас рядом с тобой людям, а не каким-то там мифическим потомкам. Практика -- критерий истинности заблуждений :) В природе вещей революция не заложена, а заложена эволюция. Если человек стал тупее компьютера, значит те, кто этого очень хотел, добились своей цели. И последнее. Жадность -- это следствие неотработанного страха невыживания. Проблема в человеке, а не петабайтах ненужной ему информации.

Sir
()
Ответ на: комментарий от Sir

2 Sir

категорически не согласен.

ваши 1. и 3. - явно противоречат друг другу.
1 - не правильно. Чтобы избежать 3 - и необходим 1. И не только. Необходимость файлопомоек даже не обсуждается - это факт. Каждый большой проект (область) имеет свою файлопомойку, своего рода концентрированную базу знаний. Обучение на какую-то определённую специальность - тоже подразумевает подбор какого-то подмножества источников информации. Любой научный труд имеет в конце почти самодостаточный набор оригинальных источников, взятых за основу. Итд.
2: не граф ассоциативен, а хэш. Последняя позволяет строить и графы тоже, как опцию. Хотя бы способом предоставления юзеру выбора - куда идти дальше.
4 - не согласен. Было много моментов, например, когда объясняешь большую облать кому-то более одного раза (я подрабатывал преподаванием и натаскиванием когда-то) - ткнуть RTFM, для чего 10 лет назад использовал бумагу и много ксерокопировал. Фактически, копируя из уймы книг и из головы - я организовывал группу знаний (для конкретного предмета/студента/случая). Я не хочу более это делать на бумаге. Также знаю что люди давшие какой-то вклад в науку (я, к сожалению, нет - имею в виду некоторых кого я знаю) - имеют бесценное количество информации просто в обычных записях (иногда подводная часть айсберга), сделанных совсем по другому поводу. Многие идеи часто бывают не опубликованы, не до конца оформлены. Историки науки подтвердят. Если вместо рукописных записок мы имеем оцифрованный текст - анализ проводить гораздо проще.
С 5 - никто не спорит, файлопомойка - лишь инструмент. 6 - и иным тоже, и группированием. В 6 вы подтверждаете нужность сами.
7: именно для персонифицированного доступа к информации аппликация и делается. Можно использовать как серверную версию, так и чисто клиент - для ноута, где нет соединения с удалённым сервером.

>Налицо нежелание автора учиться отделять зерна от плевел, что >подтверждается образцами его письменной речи на русском (это >русский?!) и английском языках :))

Я как-раз и пытаюсь объяснить своё видение - в этом треде. Может, иногда тороплюсь отправить, не проверяю отправляемый текст.
Буду иметь в виду и работать над собой и в этом направлении, спасибо.

В PPS - тоже довольно банальные вещи. Любую клаузу можно и подтвердить и опровергнуть. Группировка позволяет и передавать другим, сейчас (поисковые машины тоже группируют), и эффективно использовать, так что не выдёргивайте только лишь фразу про "передачу потомкам". Эволюция не работает без второй своей противоположности - революции. Итд.

Anode
() автор топика
Ответ на: комментарий от Anode

я так понимаю, что принижение значимости отдельного индивидуума (по сравнению с тем что нам дают абстрактные коллективные ресурсы, дядя Интернет) - это у нас в крови.

Недавно (благодаря мысли высказанной anonymous (*) (10.02.2005 23:28:31)) в голову пришло следующее определение деятельности человека по группировке знаний:

Деятельность отдельного человека (специалиста) - это ОПЕРАТОР ДЕЙСТВИЯ (или проекция, если хотите) НА СРЕДУ (environment) с результатом, выраженным как малое подмножество той среды (в формализованном виде). В нашем случае - мы помогаем сгруппировать это подмножество в более гибком виде (чем это позволяет иерархия) и присваивать (группам) символические (значимые и другим индивидам) метки (labels, keys).

Anode
() автор топика
Ответ на: комментарий от Sir

> 1. Я против файло- и других помоек.
Сильно и красиво сказано. Ценность любой помойки в том что она -- муссорка. Поэтому любое ее улучшение не изменяет ее сути. Была помойкой -- помойкой и останется.

> 2 Они могут потребляться (и потребляются :) индивидуумом, как первичный (сырой) продукт.

Утверждение спорно и бездоказательно уже хотя бы в силу отсутствия модели работы человека с информацией, на которую оприается (?) данное утверждение...

4.

В целом могу согласится. По определнию, архив -- _упорядоченное_ _хранение_ информации. Накопление данных было, есть и будет. а) проверено на собственном личном опыте б) любой, кто админит подтвердит наличие на компах юзеров накопления информации. Но здесь Василий прав -- лучше хранить все с чес столкнулся и иметь _надлежащие_ _надежные_ механизмы нахождения уже виденной информации. См. пример с Новодворским моего пред. сообщения.

5. Идеи лучше оформлять отдельно от файлопомойки

Лучше сказать трудно. Только вот идея -- есть результат переработки Н-ого количества документов, с целью решения определенной проблемы.

6.
Со знаниями вообще перегиб. А вот про обмен документами и определенными сведениями о них -- задача имеюящая практическую ценность. В библиотечном деле, к примеру, один из основоных вопросов.

7. Идея плодотворна в четко очерченной област

Правильно. Вот и я пытаюсь тоже самое сказать автору....

>> Накапливать знания -- это фетиш

Упс... Речь идет о накоплении данных. Здесь уже Вы подменяете понятия.

------ Сообщение следующее ---------
> Необходимость файлопомоек даже не обсуждается - это факт.

Это ЗАБЛУЖДЕНИЕ!!!!! Блин!!! Людям не нужна мусорка! Нужна кладовка, но не нужна муссорка! Ответьте для себя что есть библиотека (в общечеловеческом смысле).

>> Каждый большой проект (область) имеет свою файлопомойку, своего рода концентрированную базу знаний.

cp /dev/null -- такой проект со спокойной душой. Мы не бомжи, чтобы лазить по мусорке

Далее автор прав. Но в абзаце отсутствует связь между приведенными фактами.

-------------------------
Спасибо за приглашение принять участие в Вашем проекте, Василий, но сначала предлагаю Вам не торопится, и попытаться все-таки понять ЧТО мы говорим. Мне придется повториться, несколько сокращенно и по другому:
а) меня интересует ЗАКОНЧЕННАЯ КОНЦЕПТУАЛЬНАЯ модель ведения личного архива. Подчеркиваю личного! Объем его попытался оценить. Возражений не последовало.
б) меня не интересует "бег ради самого бега"
в) Вы имеете скрываемое противоречие между Вашими реальными целями и целями задекларированного Вами проекта.
г) Ваши реальные цели находятся в более глобальной и масштабной плоскости, чем я могу себе позволить и чем то что меня сейчас реально кусает за .....
д) я трачу непозволительно много времени на попытки понять ваши позиций.Вместо того чтобы наконец дописать обновленную документацию. (Это будыжник в мой огород -- никак не могу организоваться...)

и поэтому я не смогу на сегодняшний момент присоединиться к Вашему проекту.

ЗЫ. Спасибо за ссылку.
ЗЫ2. Кодирование и проектирование -- совершенно разные виды работ.

__________________
Алексей

anonymous
()
Ответ на: комментарий от anonymous

да, не придирайтесь к словам (не занимайтесь морализмом) - вы прекрасно понимаете - что под файлопомойкой я имею в виду какой-то нетривиальный набор файлов. Так админы например часто называют то что они выкладывают на samba shared drive (или через web) - какой-то группе людей. Часто для большого проекта проще выложить огромную кучу вырезанных доков, манов, тулов, программ - чтобы любой входящий в проект (за конечное время) мог въехать и быстро начать делать полезное. Когда много таких проектов - такие группы пересекаются, доки надо апдейтить (поддерживать только 1 версию, то-есть держать в 1 месте). Итак файлопомойка в моих устах - это жаргон (я думал, понятный) для нужных файлов, но не мусорка.


>меня интересует ЗАКОНЧЕННАЯ КОНЦЕПТУАЛЬНАЯ модель ведения личного архива.

создайте. Дайте более совершенный спек. Кто проектировщик в конце концов? Помогите нам. Результат будем оттачивать.

>Кодирование и проектирование -- совершенно разные виды работ.

дык проектируйте. Сделали отличный док - давайте дальше его оттачивать! Я же предложил поместить его на сорсфорж для общей модификации.

Anode
() автор топика
Ответ на: комментарий от anonymous

>а) меня интересует ЗАКОНЧЕННАЯ КОНЦЕПТУАЛЬНАЯ модель ведения личного архива. Подчеркиваю личного! Объем его попытался оценить. Возражений не последовало.

если без единого напряга одновременно можно быть полезным и корпоративным архивам (потому что разницы никакой нет - тем более как показывает практика - все корпоративные IT решения переползают в быт) - почему нет? Это _никак_ не усложняет задачу. Более того - проект именно благодаря тому - может получить какую-то подпитку и продолжать развиваться. Не надо искуственно себя ограничивать, тем более если это не ограничено технолошией.

>б) меня не интересует "бег ради самого бега"

меня тоже. мне как и вам _на_ближайшую_ перспективу нужен _надёжный_ _личный_ архив, полностью автоматизированный. (а не делать массу rsync'ов, echo'ов итд)

>в) Вы имеете скрываемое противоречие между Вашими реальными целями и целями задекларированного Вами проекта.

нет

>г) Ваши реальные цели находятся в более глобальной и масштабной плоскости, чем я могу себе позволить и чем то что меня сейчас реально кусает за .....

это никак не связано, сложность не прибавляется от того. Забудьте - что я вам сказал про хэши, библиотеки итд.
МЫ ДЕЛАЕМ ПРОСТОЙ ЛИЧНЫЙ АРХИВ (букмарков, файлов, знаний если хотите)

>д) я трачу непозволительно много времени на попытки понять ваши позиций.Вместо того чтобы наконец дописать обновленную документацию. (Это будыжник в мой огород -- никак не могу организоваться...)

вы помогли с определением конкретной потребности, конкретным USE-CASE, то что скорее всего будет необходимо и другим. Это уже очень много.
Если будет время - помогайте пожалуйста ещё!
Зарегайтесь на сорсфорже и сделайте строгие доки для нас. И если все согласятся - это будет строгой спецификацией продукта.

Anode
() автор топика
Ответ на: комментарий от anonymous

Алексей, скажем ещё так.
У меня нет времени на доки. Если поставишь свой док на сорс-форж - назовём его так:

USE-CASE ALEX

и обязательно (если проект будет жить) рано или поздно сделаем его имплементацию или по-крайней мере будем к нему стремиться - насколько позволят технологии и балланс с юз-кейсами других.

Anode
() автор топика
Ответ на: комментарий от Anode

короче, я попробую что-то сделать, и отвечать до следующих выходных - не обещаю, какая-бы критика ни раздавалсь (ну разве что только - если совсем outstanding)

Anode
() автор топика
Ответ на: комментарий от Anode

Вот назидательный пример для отрезвления Верующих в Гугл.
(этот email пришел ко мне по рассылке на тему computer chess в декабре 2004)

> Two years ago, Your Move Chess & Games was #1 or #2 on keyword searches for
> "chess sets", "chess board", "chess pieces", "chess software", "chess
> computers", etc. on Google and all the other major search engines.
>
> Then, about 18 months ago we disappeared completely from Google. We made no
> changes (that we were aware of) that would have cause such a reaction. Nothing
> was different, but we were gone. And since they offer no help in telling you why
> you were removed or how you can get back on, we were out of luck.
>
> Several months ago we hired a consultant from the Netherlands (no, not Ed) to
> help us get back on, and we succeeded, but we are so far down on the various
> keywords that no one would ever find us, so we are spending a fortune for paid
> placement which gets us at or near the top.

Для тех, кто не читает по английски, краткое содержание:
Компания, торгующая шахматным софтом, привыкла быть в первых строках результатов Googl'а по запросу "chess software".
Внезапно она исчезла из результатов Гугла. Совсем. Гугл отказался что-либо объяснять.
Им удалось вернуться только путем проплаты Гуглу за размещение в верхних строках
(я так понимаю, это легальный бизнес Гугла).

Я никогда не покупал у них и их коммерческая судьба меня мало заботит.
Но после этой истории я не жалею времени на сохранение результатов запроса. В локальном архиве, ессно.



kalessin_o
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.