Здравстуйте. Необходимо организовать кластер, отвечающий требованию высокой доступности, который позволял бы использовать все доступные в данный момент времени ресурсы для вычислений. Нашел статьи по организации кластера с «максимальной» производительностью, где задача распараллеливается между узлами. Куча статей про heartbeat и реализацию отказоустойчивого кластера. А есть ли возможность совместить эти два плюса подобных систем в одном кластере?
То есть предположим я запускаю задачу на кластере, а она распараллеливается между доступными в данный момент хостами и продолжает выполняться вплоть до тех пор, пока доступен хотя бы один узел?