Масштабируемый репозиторий букмарков...

Ответ на: комментарий от MiracleMan 09.02.05 02:16:34 MSK

дык я его начинал давно, бросал, уезжал на проект в штаты, а вернувшись - решил попробовать продвинуть (пока могу это позволить тем более что какой-то минимальный заработок за счёт старых поддержек - ещё есть). Суммарно (с середины ноября) наверное трудился недели так 2.5-3 включая диаграммы, доки (7k строк кода пока). Один явно не справлюсь. Интересно, если сделать GPL, народ потянется охотнее, при условии если это конечно кому-то нужно?
Хотелось бы конечно что-то выжать - чтобы как всегда не появилось коммерческой имплементации - для всех одной.

Anode ★
(09.02.05 02:31:03 MSK) автор топика

Ссылка

Ответ на: комментарий от Anode 09.02.05 01:46:10 MSK

> Это же метадата - дополнение к уже существующей файлопомойке

Если бы мне сильно-сильно понадобилось бить инфу по категориям/ключам,
я бы всё равно автоматизировал этот процесс. Например, с применением
bayesian filters. То есть, ручной труд всё равно бы остался, но только
на начальной стадии обучения фильтра.

> КАК ВЫ ХРАНИТЕ БУКМАРКИ когда их много

Я храню в Мозилле. Опять же характерный пример. Складываются они типа
по категориям (каталогам), а ищутся как обычно по подстроке.

annonymous ★★
(09.02.05 02:33:31 MSK)

Ответ на: комментарий от annonymous 09.02.05 02:33:31 MSK

>я бы всё равно автоматизировал этот процесс. Например, с применением
bayesian filters. То есть, ручной труд всё равно бы остался, но только

а вот вы пришли к товарищу и он дал вам кучу всяких референсов.
Вместо того чтобы записывать на бумажку или слать мылом домой - вы откроете браузером свой домашний репозиторий и накидаете всё сразу под теми ключами которые вам говорятся по ходу дела (заметки, закладки, мемо-кардз) и добавляя один групповой ключ ко всему: "петя_день_рождения".
Придя домой вы сможете достать всё данное Петей как одна группа, но также сможете в будущем восстановить _все_ замечания, заметки сделанные Петей по ходу, ничего не забыв и не переписывая с бумаги и не копируя из мыла. Время дорого! Займитесь лучше с семьёй, а к инфе 2 раз обратитесь _только_ когда она понадобится.
Как такой сценарий?

Anode ★
(09.02.05 02:45:50 MSK) автор топика

Я правильно понимаю, что это хороший способ развести хорошую, жирную помойку? Лично у меня за десять лет пользования компьютером сформировалась весьма стройная и не слишком сложная иерархия каталогов, и все находится без гугла. Не думаю, что через двадцать лет что-то кардинально изменится. А мусор я не коллекционирую.

anonymous
(09.02.05 03:05:15 MSK)

Ссылка

Ответ на: комментарий от Anode 09.02.05 02:45:50 MSK

> Вместо того чтобы записывать на бумажку или слать мылом домой - вы откроете браузером свой домашний репозиторий и накидаете всё сразу

Хм, а чем мыло не устраивает? У меня вся почта автоматом индексируется...
Не вижу особой разницы. Даже проще как-то. Не задумываешься ни о
ключевых словах, ни о какой-то спецпрограмме.

> и добавляя один групповой ключ ко всему: "петя_день_рождения".

Проблемы начинаются не отходя от кассы. 1) У меня три друга Пети и
у каждого я бываю на Дне Рождения. 2) Через пару лет я забуду о каком
Пете шла речь, а через десять я (вероятно) даже не вспомню, кто такой
Петя ;)

> Время дорого!

Это верно. Только в поисках сокращения его потребления, можно легко
запутаться, и реально проматывать его впустую ещё больше.

annonymous ★★
(09.02.05 03:11:40 MSK)

Ответ на: комментарий от annonymous 09.02.05 02:33:31 MSK

>Я храню в Мозилле. Опять же характерный пример. Складываются они типа
по категориям (каталогам), а ищутся как обычно по подстроке.

0. вы делаете _работу_
1. не масштабируемо (букмарк файл - один html)
2. разбиение только по одной группе
3. в винде и под всеми браузерами - не работает

для цели хранения только букмарков (архив - это немного более сложное применение) - вы можете использовать прогу уже сейчас. Сразу идя по нужному линку.

Anode ★
(09.02.05 03:11:40 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 03:11:40 MSK

> 1. не масштабируемо (букмарк файл - один html)

И что? Букмарк индексируется как и любой другой документ.

> 2. разбиение только по одной группе

По какой одной? Как минимум он лежит в некоем подкаталоге в дереве
закладок. Это раз. И два: у закладки есть осмысленное название, которое
берётся автоматически из html title и по этому title'у так же
производится индексация/поиск.

> 3. в винде и под всеми браузерами - не работает

В винде Мозилла тоже работает.

annonymous ★★
(09.02.05 03:17:14 MSK)

Ответ на: комментарий от annonymous 09.02.05 03:11:40 MSK

>Хм, а чем мыло не устраивает? У меня вся почта автоматом индексируется...
Не вижу особой разницы. Даже проще как-то. Не задумываешься ни о
ключевых словах, ни о какой-то спецпрограмме.

это Вы - такой гений и можете procmail фильтры написать, а как же все под виндой? Будут ждать пока их посадят на удобный интерфейс баксов за 100 с регулярными обновлениями? _вам_ проще. Мне - пока тоже фан, но уже начинаю лениться, с моей организованностью - когда надо с семьёй побыть - оставляю там файлы, здесь тары незабэкапированные, там какие-то ссылки, треды с лора вот ещё не забекапил.

> У меня три друга Пети
в таком случае у вас железное правило: Петя[1-3]
но стринг Петя - тем более "в печёнках сидит", не так?

> Это верно. Только в поисках сокращения его потребления, можно легко
запутаться, и реально проматывать его впустую ещё больше.

надо найти, давайте искать. Иначе - труба. Всё хуже и хуже будет.

Anode ★
(09.02.05 03:25:57 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 03:17:14 MSK

>> 1. не масштабируемо (букмарк файл - один html)
>И что? Букмарк индексируется как и любой другой документ.
под немасштабируемостью имеется в виду нелинейное падение производительности при увеличении количества записей до тысяч, миллиона итд. - вплоть до падения после какого-то объёма и требования редизайна метода хранения. Если всё - в одном файле - попробуйте раздуть этот файл через скрипт и посмотреть как браузер его будет парсить. То-есть там уже формат когда-нибудь сменят на какую-нить берклидб (от формата последней будет зависеть сможете ли вы работать с букмарком так-же как работаете сейчас).

>2.
нельзя сделать пересекающиеся группы. Посмотрите картинку на сайте проекта. Подкаталоги - зло, они постоянно отнимают время из-за перемещения-переосмысления вами.

> В винде Мозилла тоже работает.
IE пока рулит у большинства моих соседей, непрограммеров - даже технарей.

Anode ★
(09.02.05 03:37:30 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 03:25:57 MSK

> это Вы - такой гений и можете procmail фильтры написать

Какой нафиг гений? И procmail я совсем не использую. Для сортировки
контента давно придумано правильное средство - Bayesian фильтры.
Это тупая работа для машины, которую один раз обучают, и дальше она
работает сама. Существуют реализации (в том числе свободные) почти
для любых вменяемых ОС и прикручиваются к любым вменяемым почтовым
коиентам. И при чём тут какие-то виндовс-пользователи? И индексаторов
содержимого диска для винды полно.

> в таком случае у вас железное правило: Петя[1-3]

Оригинально. Осталось узнать, как грамотно держать в голове таблицу
соответствий "Петя/его номер" ;)

annonymous ★★
(09.02.05 03:38:51 MSK)

Ответ на: комментарий от Anode 09.02.05 03:37:30 MSK

> нелинейное падение производительности при увеличении количества записей до тысяч, миллиона итд.

Неверно. Как минимум не учитывается 1) линейный рост производительности
железа на том же промежутке времени 2) улучшение алгоритма поиска в
конкретном браузере. Смотрим:
$ wc -l bookmarks.html
8863

Ничего не тормозит.

> То-есть там уже формат когда-нибудь сменят на какую-нить берклидб

Дык и я про то. Не дай бог, конечно, берклидб. Гадость ещё та. А вообще
надо исходить из реалий. В названии указано life-time? То есть одна
жизнь одного человека. Ну, и к чему миллионы/миллиарды? Нужна трезвая
оценка возможностей.

> нельзя сделать пересекающиеся группы

Ну, на самом деле их роль играют слова-описания закладки, по которым и
произволится поиск.

annonymous ★★
(09.02.05 03:48:05 MSK)

Ответ на: комментарий от Anode 09.02.05 03:25:57 MSK

> можете procmail фильтры написать

Опс. Про procmail я неправильно понял ответ. Точнее, я был не так понят.
"Индексация почты" означает именно индексацию по типу гугла, а не
сортировку по папкам по типу того, что делает procmail.

annonymous ★★
(09.02.05 03:53:49 MSK)

Ссылка

Ответ на: комментарий от annonymous 09.02.05 03:38:51 MSK

ок, если я получаю мыло на любую машину, за которую я сажусь (щас скажут - пользуй IMAP;) - есть ещё веб-мейл и я не хочу заниматься потом второй раз разборкой - если я это уже разобрал мейл один раз. Я, как программер, как частный пример могу работать на любой машине которую мне дадут, при условии что есть ssh, vi, cvs итд и я допустим могу поддерживать под конец дня - всё накопанное-наработанное - в одном репозитории, на старом линукс сервере (P166), делая еженедельный бекап. Но и я хочу меньше времени тратить - на сохранение, скажем, нужных страниц тредов лора или кусков кода или линков на будущее - с любого компа включая с работы. А что делать тем у кого в каждой комнате по винде или маку или первому пентюку стоит, они наконец с помощью знакомых подняли сетку и скоро начнут покупать или купили нетворк диск? У них не просто файлопомойка - у них количество версий букмарков по количеству компьютеров + с работы и в запмсной ещё небось книжке. Как они мержить будут своё богатство?

Anode ★
(09.02.05 03:56:10 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 03:38:51 MSK

>> в таком случае у вас железное правило: Петя[1-3]
>Оригинально. Осталось узнать, как грамотно держать в голове таблицу
>соответствий "Петя/его номер" ;)

вы поняли меня - про первую букву фамилии (стандарт кот. не нужно вспоминать) - через точку ;)

Anode ★
(09.02.05 03:58:27 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 03:56:10 MSK

> щас скажут - пользуй IMAP

Это раньше так говорили. Сейчас говорят по-другому: юзай gogle mail!
Видишь, и тут гугл за нас подумал ;)

annonymous ★★
(09.02.05 03:58:53 MSK)

Ответ на: комментарий от annonymous 09.02.05 03:48:05 MSK

>$ wc -l bookmarks.html
>8863
>Ничего не тормозит.

попробуйте 650000000 - у меня - 0.5 секунды :)))

Anode ★
(09.02.05 03:59:57 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 03:58:27 MSK

> вы поняли меня - про первую букву

Честно говоря я ничего не понял. И это радует, ибо в сотый раз
подтверждает правильность того, что я говорю о вреде частных ключей-определителей ;)

annonymous ★★
(09.02.05 04:01:19 MSK)

Ответ на: комментарий от Anode 09.02.05 03:59:57 MSK

> попробуйте 650000000 - у меня - 0.5 секунды :)))

Ну, начнём с того, что у гугла всё равно быстрее. А потом подумаем:
а сколько life-time нужно для введения такого количества закладок, а?

annonymous ★★
(09.02.05 04:02:49 MSK)

Ответ на: комментарий от annonymous 09.02.05 03:48:05 MSK

>Ну, и к чему миллионы/миллиарды? Нужна трезвая
оценка возможностей.

мне кажется что в идеале - если все смогут моментально получить _любую_ инфу пусть за несколько итераций, за секунду - из того что они насохраняли, насмотрели итд - было бы не просто круто, но и получился бы реальный подъём производительности труда например людей готовящих сводки/отчёты, делающих анализ большого количества даты. Это просто форма оцифровки инфы прошедшей через данного человека.
Потом мне как я сказал - почти неинтересен автоматически генерённый индекс, но я бы взял индексы моих друзей мог-бы переключаться между ними зная их профиль, степень компетенции итд. Экспертная система из знаний моих друзей так-сказать. Срезы отдельных областей. Ведь люди советуя прочитать какой-то набор или посмотреть какие-то книги - могут обмениваться букмарками по темам.
В вашем случае вы их не сможете мержить. Я думал сделать интерфейс для этого.

Anode ★
(09.02.05 04:12:10 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 03:58:53 MSK

опять сливать данные третьим лицам. А они будут обсчитывать маркетинг, делать анализ ключевых слов, ваших пристрастий, покупательной способности и продавать. Имхо не должно быть сильной централизации данных. Да кто-то четвёртый может те данные хакнуть.

Anode ★
(09.02.05 04:15:36 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 04:01:19 MSK

>> вы поняли меня - про первую букву
>Честно говоря я ничего не понял. И это радует, ибо в сотый раз
>подтверждает правильность того, что я говорю о вреде частных >ключей-определителей ;)

извините - думал о другом. Первую букву фамилии. Как-бы протокол "Петя Г." Не говорите только про положение впереди или сзади. Если че-к всю жизнь ваших петей, то он выучит вводить их одним способом.

Anode ★
(09.02.05 04:19:41 MSK) автор топика

Ссылка

Ответ на: комментарий от annonymous 09.02.05 04:02:49 MSK

>Ну, начнём с того, что у гугла всё равно быстрее. А потом подумаем:

с беркли будет летать как даже и с mysql.
я оптимизацией не занимаюсь пока. если надо производительность - напишем на С, но сразу упустим удобства такой быстрой разработки. Вам принципиально - когда это доли секунды в браузере даже на больших базах.

>а сколько life-time нужно для введения такого количества закладок, а?

а опыт дедушек и бабушек? И друзей?
а спервыми у вас вообще генотип почти один, так что и ключи скорее всего будут похожие как и способ разбиения ;)

Anode ★
(09.02.05 04:27:08 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 04:12:10 MSK

> Это просто форма оцифровки инфы прошедшей через данного человека.

...и интересная только для данного человека в данное время. Она
составлена с его ошибками и специфическими взглядами на предметную область. Через десять лет он сам выбросит большую часть за
непригодностью, а кто-либо другой вообще едва ли там что-то поймёт,
так как понятийная база и методы группировки у всех разные. Не найти
двух одинаковых человек с одинаковым деревом каталогов/ключей в закладках.

> но я бы взял индексы моих друзей мог-бы переключаться между ними зная их профиль

Наивно. 90% повтор, 9.99% - ненужных данных, 0.01% действительно новой
и интересной информации. Вот, что можно найти в букмарках друзей. И то,
учитывая, что их интересы очень схожи с моими. При чём этот 0.01% они
и сами расскажут, если мы знаем друг-друга давно, и понимаем, что кому
интересно.

> Ведь люди советуя прочитать какой-то набор или посмотреть какие-то книги - могут обмениваться букмарками по темам.

Сразу же напорятся на различие подходов в выборе ключей. Ценность
такой информационной системы будет крайне невелика. Только для очень
редких случаев и для очень редких специалистов. Но такие как правило
издаются отдельными книгами ;)

> В вашем случае вы их не сможете мержить.

В нашем случае в распоряжении богатство всего WWW ;) То есть, по
определению уже замерженный (какое плохое слово) продукт ;)
Локальная база документов с индексов лишь небольшое подспорье.
Повторюсь, что отсутствие интернета - очень слабая причина. Через
десять лет интернетом будет покрыт буквально каждый квадратный метр
Земли и стоить, он будет по цене снега зимой.

annonymous ★★
(09.02.05 04:31:56 MSK)

Ответ на: комментарий от Anode 09.02.05 04:27:08 MSK

> с беркли будет летать как даже и с mysql.

Берклидб крайне ненадёжна. Я бы не рискнул доверить ей ни байта
более-менее ценной информации. Особенно будет больно, когда она
накроется с сотней гиг инфы.

> а опыт дедушек и бабушек? И друзей?

Ну опять повторимся. Если даже современники не находят общего языка
при составлении ключей для поиска, то с бабушками-дедушками ситуация
ещё хуже. Меняется семантика слов, меняется словарный состав, меняется
понятийная база. Никакого толка без полной индексации по словам не
будет.

> а спервыми у вас вообще генотип почти один, так что и ключи скорее всего будут похожие как и способ разбиения ;)

Ага, надежды юношей питают, - говорил классик. Но не кормят... добавим от себя ;)

annonymous ★★
(09.02.05 04:41:24 MSK)

Ответ на: комментарий от annonymous 09.02.05 04:31:56 MSK

я не случайно заговорил о дедушках-бабушках. Так-же как с 20 века появилась хоть какая-то возможность перенести реальные образы (фотографии) реально живших людей в будущее, книги - раньше, то наша задача сейчас - попробовать перенести _знания_ в будущее. Не в принципе - знания человечества, а знания, опыт отдельного маленького человека. Я думаю, уже скоро все начнут копаться в своём генотипе, сравнивать стринги, матчить их итд, но нужно и другое знание (не только фото, фильмы), которое имхо не должно потеряться и которое представляет информационную ценность (пусть для будущего анализа).

Anode ★
(09.02.05 04:47:18 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 04:15:36 MSK

> опять сливать данные третьим лицам. А они будут обсчитывать маркетинг, делать анализ ключевых слов, ваших пристрастий, покупательной способности и продавать.

Я почему-то доверяю этим ребятам. Они очень культурно делают красивый
бизнес. Даже аналогов не найду, кто бы ещё так же работал. И я не против
узконаправленной рекламы, заточенной под интересы пользователей.
В конце-концов это просто вид новостей по интересующей меня теме.
Никаких памперсов с крылышками, только компьютеры, сети, программы.
Я бы на их месте даже давал бы пользователям самим выставлять рейтинг
увиденнйо рекламы по N-бальной системе, тем самым ещё более подгоняя
её под свои нужды. К примеру, собираюсь я обновить компьютер. Я не прочь
получать свежайшие данные о лучших ценах на них в любой момент времени.
Более того, я буду поощрать подачу такой инфы.

annonymous ★★
(09.02.05 04:51:30 MSK)

Ответ на: комментарий от Anode 09.02.05 04:47:18 MSK

> Не в принципе - знания человечества, а знания, опыт отдельного маленького человека.

Поверь, этот опыт ровно ничего не стоит. Он имеет смсл только в рамках
одной семьи/рода, и то не как знание, а как историческая лента событий.
Веди семейный дневник, купи хорошую цифровую камеру с максимально большим разрешением и много фотографируй. Это всё, чем в наше время ты
можешь помочь будущим поколениям. А настоящие знания пишут профи, и
эта инфа нуждается вовсе не в индексации, а в элементарной широкой
доступности. Лекции, книги и т.д. Они не так доступны, как хотелось бы.

annonymous ★★
(09.02.05 04:58:22 MSK)

Ответ на: комментарий от annonymous 09.02.05 04:31:56 MSK

есть фильтры которые оценивают ценность информации почти обратно пропорционально частоте встречаемости :)
т.е. если это везде - это не ценно. Если это в одном месте - это очень ценно :)

а веря человеку, если я знаю что он спец например в том, я могу взять набор его букмарков, которые он для меня подготовит. Для меня это _гораздо_ более ценное чем интернет который будет попсеть и попсеть и наполняться персональными страницами, шумом. Или же индексаторы Гугла, Яху нас будут обманывать и просто вручную поднимать рейтинги на коммерческой основе. За счёт чего они живут кстати? И это всё рекламмный банер столько стоит? Я правда не знаю. Но я не верю в благотворительность коммерческих компаний, особенно в условиях кризиса экономики вдруг.

для отдельного человека - ценна его персональная информация, генеология семьи возможно, оцифрованные фильмы итд итд.
Я знаю многих - у кого _очень_ много музыки и фильмов. Ну нельзя это автоматически проиндексировать!
мейлы, мейлы, персональные мейлы!

Anode ★
(09.02.05 05:00:35 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 04:41:24 MSK

>Берклидб крайне ненадёжна. Я бы не рискнул доверить ей ни байта
более-менее ценной информации. Особенно будет больно, когда она
накроется с сотней гиг инфы.

поэтому я и переключился на plain-text файлы кстати.

>бабушками-дедушками
наша задача - перетащить _максимум_ инфы. Потомки или мы на старости лет - разберёмся. Запустим AI ;)
Поток с камер, видео, почты, высказываний, деталей, книг становится настолько велик что уже захлёбываемся. Но это всё - ценность которую мы упускаем. Я помню всю жизнь, например, анекдоты которые рассказывали мне и в детстве (кстати о памяти). Так же и с инфой, которую я видел, переработал, протащил через себя. Была бы возможность ещё и достать.

Anode ★
(09.02.05 05:09:41 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 04:51:30 MSK

>Я почему-то доверяю этим ребятам. Они очень культурно делают красивый
бизнес. Даже аналогов не найду, кто бы ещё так же работал. И я не против
узконаправленной рекламы, заточенной под интересы пользователей.
В конце-концов это просто вид новостей по интересующей меня теме.
Никаких памперсов с крылышками, только компьютеры, сети, программы.
Я бы на их месте даже давал бы пользователям самим выставлять рейтинг
увиденнйо рекламы по N-бальной системе, тем самым ещё более подгоняя
её под свои нужды. К примеру, собираюсь я обновить компьютер. Я не прочь
получать свежайшие данные о лучших ценах на них в любой момент времени.
Более того, я буду поощрать подачу такой инфы.

Cергей, признавайся, это ты? ;)

Anode ★
(09.02.05 05:12:44 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 05:00:35 MSK

> который будет попсеть и попсеть и наполняться персональными страницами, шумом.

Грамотный индексатор по типу гугла учитывает количество ссылок на ресурс
при определении его веса/рейтинга. Это естественный и самый правильный
способ. Ресурсы с по-настоящему важной информацией всегда очень быстро
привлекают внимание специалистов, и автоматически увеличивают его право
быть подданым в первых строках результата поиска.

> Или же индексаторы Гугла, Яху нас будут обманывать и просто вручную поднимать рейтинги на коммерческой основе.

Такие вымерли или находятся на грани исчезновения.

> За счёт чего они живут кстати?

Гугл отлично живёт за счёт узконапраленной текстовой рекламы для заранее
определённой категории пользователей. Это самый дорогой вид рекламы.
Она очень точна и очень эффективна.

> Ну нельзя это автоматически проиндексировать!

Можно. И то и другое индексируется прекрасно по метаданным.
Фотографии по exif-информации, музыка по тегам внутри mp3.

annonymous ★★
(09.02.05 05:19:02 MSK)

Ответ на: комментарий от Anode 09.02.05 05:12:44 MSK

Нет, не я.

annonymous ★★
(09.02.05 05:20:34 MSK)

Ответ на: комментарий от annonymous 09.02.05 04:58:22 MSK

в генотипе такое...

мне вчера сказали что 3 первых деления клетки зародыша - совершенно эквивалентны. Потом - вдруг (через несколько итераций) появляются почти все основные органы.

Вы думаете просто так в healthcare так деньги кидают. Это (50 на 50) - следующий бум как было с хайтеком. Все начнут себя рассматривать, генотип рассматривать. А это так - из-за этой цепи генов, а это - дедушка постарался. Ну, и индекс и здесь тоже будет кстати. Сколько там гигабайт DNA? А что - очень скоро. Если же вторые 50% - глобальный кризис и маразм будет крепчать, то Машкова будете на локальном диске на огороде закапывать. Тоже надо всё собирать пока дают. Шутю ;)

Anode ★
(09.02.05 05:20:51 MSK) автор топика

Ссылка

Ответ на: комментарий от annonymous 09.02.05 05:20:34 MSK

Ага, я так и понял...

Anode ★
(09.02.05 05:23:03 MSK) автор топика

Ссылка

Ответ на: комментарий от annonymous 09.02.05 05:19:02 MSK

ну всё автоматически хотите...
Не бывает так!!!

поговорка такая есть
"Everybody cares about his own stuff first"! -- природа человека!!!

EVERYBODY CARES ABOUT HIS OWN STUFF FIRST!

что на это скажете? против природы?

Anode ★
(09.02.05 05:27:00 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 05:09:41 MSK

> наша задача - перетащить _максимум_ инфы. Потомки или мы на старости лет - разберёмся. Запустим AI ;)

Ха! А тогда зачем сейчас корпеть над алгоритмами её поиска и
структурирования? Пусть она будет просто в сыром виде. Потомки лучше
разберутся! Знаешь, чем нагадили нам древнии историки? Тем, что они не
описывали чётко, регулярно и беспристрастно наблюдаемые ими события, а
пропускали их через свою или идеологически принятую призму внутренней оценки. Описание Ледового Побоища различается у историков противостоящих
сторон с точностью до наоборот ;) При том, что они были очевидцами, и
вроде бы должны были видеть одно и то же!

annonymous ★★
(09.02.05 05:29:10 MSK)

Ответ на: комментарий от Anode 09.02.05 05:27:00 MSK

> ну всё автоматически хотите...
> Не бывает так!!!

Должно быть. Надо стремиться. Человек создан для творчества, а не для
индексации каких-то букмарков ;)

> поговорка такая есть
"Everybody cares about his own stuff first"! -- природа человека!!!

Нерусская поговорка. Не про нас. У нас по-другому говорят и с другим
смыслом. Мало ли что инопланетяне придумали ;)

annonymous ★★
(09.02.05 05:34:09 MSK)

Ответ на: комментарий от annonymous 09.02.05 05:29:10 MSK

>Ха! А тогда зачем сейчас корпеть над алгоритмами её поиска и
структурирования? Пусть она будет просто в сыром виде. Потомки лучше
разберутся!

в сыром - она и так есть - в виде фацлопомойки. Кстати и то что мы делаем через cron, rsync и братия - скоро понадобится юзеру на винде - ведь нетворк диски уже вон - от линксиса в ширпотребной продаже! Я имею в виду бекап-процедура, стандартная и прозрачная для юзера, чтобы он знал из гуи что сейчас вот его сокровище пошло сюда, а через неделю он зазеркалирует это к бабушке в деревню, для бекапа, в залитый бетоном компьютер в погребе:)
Но она (эта инфа) - желательна мне и сейчас, очень быстро.
Потом я же не трогаю оригинальную дату - пусть потомки оригиналы рассматривают. Но сейчас я хочу из тысяч кусков скажем видео или фильмов быстро находить все куски - с одним ребёнком, потом другим ключом (другая группа/категория) - я в калифорнии, по третим - я на северном полюсе но достаточно фотогеничен да ещё и в фас - чтобы можно было повесить на памятник (и тот ключ как-бы введён в последний раз просмотра всего добра - прошлым летом, когда всё равно приходилось просматривать - вы понимаете идеологию введения:), ну и так далее. Не расходовать время на поиски - только по-ходу, невзначай, по-пути!

Anode ★
(09.02.05 05:51:57 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 05:34:09 MSK

>Должно быть. Надо стремиться. Человек создан для творчества, а не для
индексации каких-то букмарков ;)

золотые слова, но не перелопачивать интернет заново а опираться на то что уже было проделано и найдено. Дальше, дальше надо работать, эффективней! Вставать на уже построенное и создавать свою сеть!

>Не про нас

;)))

Anode ★
(09.02.05 05:58:00 MSK) автор топика

Ссылка

Ответ на: комментарий от Anode 09.02.05 05:51:57 MSK

> Но она (эта инфа) - желательна мне и сейчас, очень быстро.

Тогда не надо красивых фраз про потомков, а? :) Скажи честно: нужно мне
любимому в данный конкретный момент.

> с одним ребёнком, потом другим ключом (другая группа/категория) - я в калифорнии

Я уже говорил про мультимедиа информацию. Она должна индексироваться по
метаданным наравне с другими документами. Любая приличная программа
просмотра/редактирования позволяет работать с метаданными
мультимедийного файла.

annonymous ★★
(09.02.05 06:01:09 MSK)

Ответ на: комментарий от annonymous 09.02.05 06:01:09 MSK

>Тогда не надо красивых фраз про потомков, а? :) Скажи честно: нужно мне
любимому в данный конкретный момент.
Ну и то и то: и я любимый попользуюсь и значимо так передам такскзть опыт отпрыскам :)

насчёт мультимедии. Не из той, одной из многих, программы, а из моего желательно интерфейса (удалённого) чтобы стянуть фильм через сетку. "Зеркало" давно не смотрел. Тяну из архива. Но категории - мои. Пишу Тарковский и получаю семь строк. Кликаю - гружу фильм: будь то по сетке дома, будь то к приятелю домой от себя напосмотреть. Сегодняшняя версия это позволяет (https подкрутить ещё). Видео он-деманд или любой-личный-документ-он-деманд, мануал-он-деманд. Мой. По моему ключу, а не каталогам, куда я безусловно обращусь для нужного мне "View" индекса. То что мне не надо. Зачем ненужная инфа мне? Я хочу только по названию и только по автору. Захочу по актёрам - скажу специально.

Anode ★
(09.02.05 06:15:36 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 06:01:09 MSK

то-есть из существующих каталогов - грузим через фильтры (попрошу vm написать умный парсер html для наполнения того что хочу я а не всё возможное). Можно и кастом веб-интерфейсов настрогать для ручного ввода фильмов, другая страничка - книг. Таких форм в принципе - немного - для массового юзера. Я имею в виду - себя массовым юзером, так как то что удобно мне (если действительно) - скорее будет тут-же использовано и другими. У меня жутко требовательный подход к юзабилити. MS школа :) - научили как тестинг делать надо. (Я видел кстати реально как надо тестить. Бить по клавишам случайно и очень сильно и долго - и чтобы ничо не зависло даже на время перерисовки)

Anode ★
(09.02.05 06:25:47 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 06:15:36 MSK

> Я хочу только по названию и только по автору. Захочу по актёрам - скажу специально.

Проблема в том, что когда будет нужно по актёру (а аппетит приходит во
время еды), то при отсутствии данного ключа придётся заново
просматривать тонну фильмов и помечать их нужными ключами.
Короче, якобы ускорение превращается в постоянный адский труд. Кто там
говорил про свободное время, семью и т.п.? ;)

annonymous ★★
(09.02.05 06:37:54 MSK)

Ответ на: комментарий от annonymous 09.02.05 06:37:54 MSK

ну ведь нельзя, нельзя логарифм энтропии - всё дать - на все случаи жизни.
Я даже хотел юникс-вей: только персистент хэш, но _очень_ хорошо, лучше чем беркли, лучше чем RDB. Но чиста фреймвоки делать - дело неблагодарное: упрут и спасибо не скажут. А Гую навесют - за мульон продадут. Сам так делал (спасибо не говорил;)

Anode ★
(09.02.05 06:44:48 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 06:25:47 MSK

> настрогать для ручного ввода фильмов, другая страничка - книг. Таких форм в принципе - немного

Боюсь, что потомки в нескольких поколениях будут только материться глядя
на такое сокровище, а на могиле добавится табличка в назидание
остальным:

ОН ПЛОДИЛ СУЩНОСТИ БЕЗ НАДОБНОСТИ

> У меня жутко требовательный подход к юзабилити. MS школа :) -

Тогда появится ещё одна:

ОН БЫЛ ИДОЛОПОКЛОННИКОМ СЕКТЫ МЕЛКОМЯГКИХ

Короче, не завидую, сколько раз ты перевернёшься ;) Проклянут потомки.

annonymous ★★
(09.02.05 06:45:40 MSK)

Ссылка

Ответ на: комментарий от Anode 09.02.05 06:44:48 MSK

Льзя. Нужно только хорошенько подумать.

annonymous ★★
(09.02.05 06:47:35 MSK)

Ответ на: комментарий от annonymous 09.02.05 06:37:54 MSK

нет, здесь с актёрами я может погорячился - они скорее нужны будут всем. Но как остановится и не пихать всё?

А я захочу такую классификацию - которой нет. Мой знакомый пишет. Я думаю - у него пополнее будет, чем у многих официальных изданий.

Номер минуты от начала фильма можно индексировать. Сцены. Промотать я думаю можно подумать как. Здесь я не знаток но даже если нельзя, то всё равно можно если постараться - сырцы есть :)

И интерфейс вывести - индексировать - этот момент, под етим ключом. Чтобы потом найти - можно автоматом общую группу, как уже говорил, типа все снэпшоты. Ключ "ванна". Ну сколько для единой человеческой твари будет ванн (ну детишки там торчат, ну фотка "я меняю сантехнику", ну Ностальгия туда попадёт) - я уверен - в один экран всё влезет. И так очень со многим как показывает мой опыт.

Anode ★
(09.02.05 06:59:07 MSK) автор топика

Ответ на: комментарий от annonymous 09.02.05 06:47:35 MSK

>Льзя. Нужно только хорошенько подумать.

Не, это только поколение роботов наверное будет способно вытащить, потому что задача для мощной нейро-сети которая знает большую статистику и скрытые симметрии в информации. Хотя может озарение и придёт кому-то. Так для того надо не jsp строчить, а на диване лежать и книжки читать и думать, не зацикливаясь. Программирование вредно тогда.
Для этого надо поднимать теорию, вспомнить детство, точнее универы.
Вообще, честно говоря, я бы хотел в толстых журналах опять покопаться :)
За это не плотют. Плотют за ... не, не jsp,ejb,soap,blah-blah-blah, плотют ... не скажу за что;)

Anode ★
(09.02.05 07:11:54 MSK) автор топика

Ответ на: комментарий от Anode 09.02.05 06:59:07 MSK

> Но как остановится и не пихать всё?

Очень просто. Забить и научиться простому языку запросов гугл ;)

annonymous ★★
(09.02.05 07:14:32 MSK)

Ответ на: комментарий от Anode 09.02.05 07:11:54 MSK

> задача для мощной нейро-сети которая знает большую статистику и скрытые симметрии в информации.

Всё гораздо проще, чем кажется. Самонастраиваемая и самообучаемая
система.

> Программирование вредно тогда.

О, золотые слова и архиверные выводы! Программить тоже должны машины.
Человек должен лишь подавать идеи.

annonymous ★★
(09.02.05 07:18:12 MSK)

Ссылка

Похожие темы