1. Судя по тому что ты написал, тебя интересуют HA-cluster-а (кластеры высокой готовности). Это конструкция состоящая из нескольких узлов (как правило 2) для обеспечения надежности выполнения задачи или ряда задач.
Большая часть компонент каждого узла резервируется. В простейшем случае это два узла с общим дисковым массивом. Один (1) из узлов выполняет задачу, второй (2) находится в режиме ожидания. В случае если узел 1 загнулся, второй монтирует дисковый массив и продолжает выполнять задачу. Кроме того, они оба могут работать над одной задачей в случае если узел 1 монтирует массив в режиме rw, а узел 2 в режиме ro.
Если тебе этого достаточно - то вперед, никакие кластерные системы тебе не нужны. Подключаешь к узлам массивы с общей SCSI шиной или через FC-AL switch.
отсюда ясно, чем такая конструкция лучше NFS или SAMBA etc.
При использовании NFS в случае отказа NFS-сервера у тебя не будет работать ни один из узлов, тогда как в случае с общей шиной этого не происходит.
Кластерная FS понадобится в случае, когда оба узла должны работать на чтение/запись с общими данными на массиве.
Я паял такой кластер на трех SUN-Enterprise x800 c с возможностью работы Oracle RAC без потери коннекта в случае выхода к-л узла из строя. При такой постановке задачи необходима специальная файловая система и специальная служба UDLM (UNIX Distributed lock manager), которая заведует блокировками файлов и в случае сбоя передает блокировку рабочему узлу. В качестве FS выступала модифицированная ufs с добавлением модуля global для поддержания общего пространства имен устройств в кластере.
В opensource я с таким не сталкивался.
2. Распределенный кластер иногда требует расспределенную FS, тк процессы должны работать с одними и теми-же данными как на чтение, так и на запись для хранения временных и конечных результатов. Если узлы находятся на больших расстояниях друг от друга, то строится виртуальная FS состоящая из множества файловых систем узлов.
В качестве примера могу привести QFS/SAMFS от SUN (можешь глянуть на docs.sun.com)
В Академии Наук, где я устанавливал распределенный кластер, я использую NFSv3 тк пока что для 15 узлов скорости передачи хватает а надежность меня беспокоит менее всего.
Кроме того они стоят в 2х стойках рядом а не разбросаны по всему миру.
В твоем случае нужно четко определится чего ты хочешь.
Нужен ли тебе load-balancing, общий IP, доступ к массиву (RO или RW) etc и исходя из этого выбрать средства.
Скорее всего хватит общей шины и массива.
Вот ссылки по темам - всего под рукой нет - но если их взять за отправную точку то можно найти много интересного: