Что использовать для создания удаленного файлового хранилища в локальной сети

0

1

Доброе утро!

Хочется посоветоваться по поводу создания файлового хранилища.

На данный момент есть самописное ПО, работающее внутри организации и использующее в качестве СУБД PostgreSQL. Возникла необходимость хранить файлы, которые привязаны к сущностям БД. Так как хранить файлы в БД - не комильфо, было решено хранить файлы в ФС, а в БД хранить только URI(путь до файла). Хранилище должно обеспечивать возможность гибкого разграничения прав доступа, т.е. права должны проверяться с помощью специально созданных таблиц в БД. Клиентcкое ПО написано на Delphi и работает под виндой.

На данный момент есть такая идея:

Ставим веб-сервер, который будет заниматься хранением и отдачей файлов после проверки прав доступа.
Загрузка файлов на сервер происходит по протоколу FTP во временный каталог (HTTP не самое лучшее решение для загрузки больших файлов).
Получение файлов происходит при переходе по ссылке вида http://srv.local/getfile.php?id=a337bc2622e4734baf
Ссылка генерируется при обращении к БД и наличии необходимых прав и является временной

Вроде все устраивает, но хочется реализовать следующее: После того как пользователь загрузил файл, отредактировал его, например в Word'e и сохранил, необходимо что-бы новая версия файла автоматически попала на сервер. Нечто типа WebDAV, но там, к сожалению не очень гибкая система разграничения прав и с помощью кода я не смогу рулить правами доступа к файлам (если я правильно все понял).

На какие технологии/библиотеки стоит обратить внимание? И как это лучше сделать?

Заранее спасибо!

Ссылка

← Grub vs Lilo

Средство автоматизации рутинных действий →

> Так как хранить файлы в БД - не комильфо

SciDB же: http://www.opennet.ru/opennews/art.shtml?num=30983

А вообще не вижу ни одной причины хранить файлы не в БД. В PostgreSQL ранее была возможность хранить только ссылки на файлы, но потом они от этого отказались.

Evgueni ★★★★★
(03.08.11 09:57:42 MSK)

> После того как пользователь загрузил файл, отредактировал его, например в Word'e и сохранил, необходимо что-бы новая версия файла автоматически попала на сервер

хм, мне кажется, или вы свою CVS пытается завелосипедить ?

x905 ★★★★★
(03.08.11 13:12:00 MSK)

Ответ на: комментарий от Evgueni 03.08.11 09:57:42 MSK

А вообще не вижу ни одной причины хранить файлы не в БД.

А я не вижу причин хранить файлы в БД. Их нет. Для файлов есть файловая система.В СУБД хранятся данные, которые участвуют в выборках, различных расчетах, над ними можно выполнять операции сортировки и агрегации. А что мы будем делать с файлами в БД? Правильно - просто отдавать. Ну и зачем тогда их хранить в БД, когда для этого есть ФС?

А вот по поводу причин хранения файлов не в БД:

Бэкапить БД размером 25Gb и файлы 2Tb сильно проще, чем БД размером 2.025Tb
БД не занимается не свойственной ей работой - отдача файлов. (в кэш не попадает всякий мусор)
Отдача файлов из БД в любом случае будет медленнее, чем из ФС (разве что файлов много и они мелкие)
Огромное количество способов организации файлового хранилища(куча протоколов, распределенные хранилища, куча ФС) в случае хранения файлов вне БД.

В PostgreSQL ранее была возможность хранить только ссылки на файлы, но потом они от этого отказались.

Вы про large object? Если да, то они и не думали отказываться, более того в 9 появилась возможность давать права на LO.

mongol1986
(03.08.11 14:41:31 MSK) автор топика

Ответ на: комментарий от x905 03.08.11 13:12:00 MSK

В CVS все-же пользователю необходимо самому коммитить изменения. Хотя в остальном все похоже. Но мне не требуются диффы, ответвления, слияния, даже не обязательно хранить только изменения - пойдет и для каждой версии файла создание нового файла.

Вопрос в том - как автоматически после изменения файла пользователем обновить этот файл на сервере? В alfresco же работает как-то :(

mongol1986
(03.08.11 15:12:13 MSK) автор топика

Ответ на: комментарий от mongol1986 03.08.11 14:41:31 MSK

> А я не вижу причин хранить файлы в БД. Их нет.

а какже http://ru.wikipedia.org/wiki/ACID ?

x905 ★★★★★
(03.08.11 15:16:43 MSK)

Ответ на: комментарий от mongol1986 03.08.11 14:41:31 MSK

> Вы про large object? Если да, то они и не думали отказываться, более того в 9 появилась возможность давать права на LO.

large object в PostreSQL хранятся в БД вообще-то. Не в БД они хранились оооочень давно. Ну и сейчас, если я правильно понимаю blobы — это прошлый век. Правда бинарный тип данных больше пары гигобайт хранить пару лет назад не позволял

Бэкапить БД размером 25Gb и файлы 2Tb сильно проще, чем БД размером 2.025Tb

Бэкапить в любом случае надо. Организуй два живых сервера и постоянную репликацию между ними.

По остальным пунктам SciDB же. Плюс от БД — это возможность организовать единый доступ везде и относительное спокойствие за сохранность данных. А скорость тебе по ходу совершенно не важна.

Evgueni ★★★★★
(03.08.11 15:25:30 MSK)

Ответ на: комментарий от x905 03.08.11 15:16:43 MSK

> а какже http://ru.wikipedia.org/wiki/ACID ? Вы по поводу атомарности и согласованности? И в чем здесь проблемы? Боитесь появления мертвых ссылок? В нормально написанной системе их не будет.

mongol1986
(03.08.11 15:29:23 MSK) автор топика

Ответ на: комментарий от mongol1986 03.08.11 15:12:13 MSK

может морду к CVS написать, которая автоматом будет коммитить ?
или опиши подробнее какая задача решается этим набором софта

x905 ★★★★★
(03.08.11 15:29:53 MSK)

Ссылка

Ответ на: комментарий от mongol1986 03.08.11 15:29:23 MSK

> Боитесь появления мертвых ссылок?

да, например их
+ какой то механизм отсылки файлов на сервер )

В нормально написанной системе их не будет.

нормально написанную систему еще создать нужно и оттестировать
а такая система уже есть, называется СУБД )

x905 ★★★★★
(03.08.11 15:59:23 MSK)

Ответ на: комментарий от x905 03.08.11 15:59:23 MSK

>нормально написанную систему еще создать нужно и оттестировать

а такая система уже есть, называется СУБД )

Ну если файлов на 5GB, то можно не заморачиваться и хранить все в БД. Хотя я и не вижу особых проблем в написании функционала, который позволял бы хранить файлы на ФС.

Бэкапить в любом случае надо.

Вот именно, только сколько времени займет бэкап базы размером 2Tb? И сколько по времени будет занимать восстановление из дампа?

Организуй два живых сервера и постоянную репликацию между ними.

Сделать то можно без проблем, вот только это не отменяет необходимости в бэкапах. Да и зачем загружать сервер БД отдачей файлов? Пусть этим занимается файловое хранилище, к тому же файловое хранилище при надобности легко масштабировать. Да и стратегии резервного копирования могут быть раздельные. Базу можно и каждые 6 часов бэкапить. К тому же можно использовать разные уровни RAID-массивов и разные по производительности диски для файлов и для данных БД. Для БД RAID10 из X-дисков 15Krpm, а для файлов RAID5,6 из 7200rpm дисков.

По остальным пунктам SciDB же.

Надо будет почитать про нее.

А скорость тебе по ходу совершенно не важна.

С чего вы это взяли? Это вам видимо на нее плевать, если предлагаете 2Tb файлов загрузить в БД.

mongol1986
(03.08.11 20:57:35 MSK) автор топика

Ответ на: комментарий от mongol1986 03.08.11 20:57:35 MSK

всё же неплохо описать приблизительно задачу, решаемую системой
т.к. возможно более конкретно чтото сказать будет

почему, например, не нужно бэкапить файлы, которые связаны с сущностями в БД - почему они не так важны ?

x905 ★★★★★
(03.08.11 22:39:20 MSK)

так как никаких привязок к используемым языкам озвучено небыло, предложу java content repository c mixin:versionable

aol ★★★★★
(03.08.11 22:43:53 MSK)

Ссылка

Ответ на: комментарий от x905 03.08.11 22:39:20 MSK

всё же неплохо описать приблизительно задачу, решаемую системой

т.к. возможно более конкретно чтото сказать будет

Задача системы - хранить на удаленном хранилище(в локальной сети) файлы пользователей. В базе или нет дело десятое. Основная проблема - реализация следующего механизма:

Пользователь видит через клиентское ПО список файлов
Скачивает файл
Редактирует его, например в ворде
Сохраняет
После закрытия ворда файл должен автоматически обновиться на сервере

Вот как реализовать автоматическое обновление файла на сервере я не знаю. Нужно, чтобы файл редактировался как бы на сервере. В alfresco же работает такой механизм.

почему, например, не нужно бэкапить файлы, которые связаны с сущностями в БД - почему они не так важны ?

С чего Вы взяли, что бэкапить файлы не надо? Обязательно надо.

так как никаких привязок к используемым языкам озвучено небыло, предложу java content repository c mixin:versionable

Клиентское ПО написано на Delphi

mongol1986
(04.08.11 09:47:01 MSK) автор топика

Ответ на: комментарий от mongol1986 04.08.11 09:47:01 MSK

> С чего Вы взяли, что бэкапить файлы не надо? Обязательно надо.

сорри, скосоглазил на чужой пост

мне думается, что клиентское ПО, написанное на Delphi, и должно отсылать файлы туда и обратно, например по сокетам (тут придется дописать демон на стороне сервера) или же через LO объекты постгреса (мне это вариант больше нравиться)

x905 ★★★★★
(04.08.11 10:51:28 MSK)

Ответ на: комментарий от Evgueni 03.08.11 15:25:30 MSK

По остальным пунктам SciDB же.

SciDB не похожа на классические СУБД и в ущерб поддержке некоторых привычных возможностей оптимизирована для обработки и анализа «сырых» данных, которые интенсивно читаются, но почти не изменяются. СУБД не рассчитана на обработку транзакций в реальном времени (OLTP), не поддерживает ACID (атомарность, непротиворечивость, изоляция, долговечность) и журналирование, обеспечивая транзакции лишь на минимальном уровне.

Эта СУБД еще подходит для хранения файлов, но у нас то PostgreSQL. И когда я говорил про хранение файлов в БД, то в качестве СУБД имел ввиду PostgreSQL.

И в чем преимущество хранения файлов в SciDB по сравнению с хранением в ФС? От всего функционала SciDB мне понадобится только запись и чтение файла + есть некий версионный контроль. У меня не научные данные, мне не надо проводить обработку этих данных в БД.

mongol1986
(04.08.11 10:57:04 MSK) автор топика

Ссылка

Ответ на: комментарий от x905 04.08.11 10:51:28 MSK

>мне думается, что клиентское ПО, написанное на Delphi, и должно отсылать файлы туда и обратно, например по сокетам (тут придется дописать демон на стороне сервера) или же через LO объекты постгреса (мне это вариант больше нравиться)

С самой отсылкой данных проблем нет. Проблема в том, как отловить момент, когда нужно отсылать данные назад на сервер.

Хотелось бы, чтобы для пользователя это выглядело прозрачно: Он открыл файл в своем любимом ворде/блокноте/другом редакторе, изменил его, пол дня прошатался по офису, в конце рабочего дня сохранил этот файл, закрыл редактор и обновленный файл сразу оказался на сервере. WebDAV для этого замечательно подходит, но там беда с разграничением прав доступа.

mongol1986
(04.08.11 11:06:02 MSK) автор топика

Ответ на: комментарий от mongol1986 04.08.11 11:06:02 MSK

> Проблема в том, как отловить момент, когда нужно отсылать данные назад на сервер

когда файл изменился, тогда и отсылать
следить за файлом можно через механизмы ОС
ждать закрытия ворда (и т.п.) думаю не верно, ведь он действительно может его целый день не закрывать

x905 ★★★★★
(04.08.11 11:16:23 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Grub vs Lilo

General

Средство автоматизации рутинных действий →

Похожие темы