Новое поколение MapReduce в Apache Hadoop

apache, development, hadoop, кластер, масштабируемость, технологии

0

1

В большом бизнесе использование нескольких больших кластеров с финансовой точки зрения более эффективно, чем много маленьких. Чем больше машин в кластере, тем большими наборами данных он может оперировать, больше задач могут выполняться одновременно. Реализация MapReduce в Apache Hadoop столкнулась с потолком масштабируемости на уровне около 4000 машин в кластере. Разрабатывается следующее поколение Apaсhe Hadoop MapReduce, в котором появится общий планировщик ресурсов и отдельный мастер для каждой отдельной задачи, управляющий выполнением программного кода. Так как простой оборудования по техническим причинам обходится дорого на таком масштабе, высокий уровень доступности проектируется с самого начала, равно как и безопасность и многозадачность, необходимые для поддержки одновременного использования большого кластера многими пользователями. Новая архитектура также будет более инновационной, гибкой и эффективной с точки зрения использования вычислительных ресурсов.

>>> Подробности

Ссылка

← Network UPS Tools 2.6.0

Вышел Fluxbox 1.3 →

Ты лор с хаброй не перепутал, случаем?

~~baverman~~ ★★★
(20.02.11 04:49:14 MSK)

кластер, кластеризация, кластерные вычисления

anonymous_sapiens ★★★★★
(20.02.11 13:30:00 MSK)

Ответ на: комментарий от baverman 20.02.11 04:49:14 MSK

Если бы вместо «кластер» было написано «облако» - точно Хабр был бы. Но тут не так.

ns_ramesses ★
(20.02.11 13:36:26 MSK)

Ссылка

А где тэг java?

iZEN ★★★★★
(20.02.11 13:37:28 MSK)

Ссылка

Я так понял, смысл новости в том, что на 4001 добавленой в кластер ноде апач хадуп таки сдался и начал работать?

А на 4000 нодах он только шуршал винтами, как эклипс на нетбуке?

~~AVL2~~ ★★★★★
(20.02.11 13:42:10 MSK)

Технология - затыкающаяся уже на 4к узлах ? (:

sS ★★★★★
(20.02.11 14:03:56 MSK)

Ссылка

Ответ на: комментарий от anonymous_sapiens 20.02.11 13:30:00 MSK

> кластеризация

Кластеризация --- это не про кластеры (или я не уловил сарказма)

sv75 ★★★★★
(20.02.11 15:25:23 MSK)

>Реализация MapReduce в Apache Hadoop столкнулась с потолком масштабируемости на уровне около 4000 машин в кластере. Разрабатывается следующее поколение Apaсhe Hadoop MapReduce, в котором появится общий планировщик ресурсов и отдельный мастер для каждой отдельной задачи, управляющий выполнением программного кода.

может стоило отложить новость до тех времён, когда новое поколение Apaсhe Hadoop MapReduce будет разработано?

anonymous
(20.02.11 15:32:03 MSK)

Ссылка

янихренанепонял.жпг

ТС, ты хотел сказать, что начата разработка версии Hadoop, которая полезна на кластерах из >4К машин?

tailgunner ★★★★★
(20.02.11 15:35:09 MSK)

Ссылка

кажется я понял, blinkov - это такой новый IBM_dw?

anonymous
(20.02.11 15:39:19 MSK)

Ссылка

Ответ на: комментарий от sv75 20.02.11 15:25:23 MSK

Тут как раз случай когда эти термины пересекаются :)

кластеризация на кластерах если хотите :))

sS ★★★★★
(20.02.11 15:40:24 MSK)

Ссылка

Для местного быдла^Wобщества стоит писать попроще.

bga_ ★★★★
(20.02.11 17:07:21 MSK)

Ссылка

Какой-то копипаст из середины какой-то статьи. Откройте для себя стиль оформления новостей с использованием абзацев и списков:
1-й абзац: Чегой-то это такое
2-й абзац, список: Чего умеет, чего не хватает
3-й абзац: Чего решено в связи с этой нехваткой переписывать и чьими силами.

anonymoos ★★★★★
(20.02.11 19:14:17 MSK)

Ссылка

Ответ на: комментарий от AVL2 20.02.11 13:42:10 MSK

>появится общий планировщик ресурсов

iZEN>А где тэг java?

Теперь задачи свопиться будут по очереди.

GAMer ★★★★★
(20.02.11 19:19:22 MSK)

Ссылка

Кластер, кластер, кластер, кластер.

Ехал кластер через реку, 
Видит кластер в реке кластер. 
Сунул кластер кластер в кластер. 
Кластер кластер кластер кластер.

Новости о бетах договорились не публиковать на главной, а это даже не пре-альфа, а только намерение поделить шкуру неубитого медведя.

Camel ★★★★★
(20.02.11 20:04:04 MSK)

Ответ на: Кластер, кластер, кластер, кластер. от Camel 20.02.11 20:04:04 MSK

ну, вроде, от правил уже не раз отступали :) Пусть будет

dotbg ★★★★
(20.02.11 21:43:46 MSK)

Ссылка

Что это за маркетоидный легастенический понос?

Новая архитектура также будет более инновационной, гибкой и эффективной

А когда Иван Блинков будет писать более осмысленно, по делу и _факты_?

А теперь сравните с оригиналом:

Overview

In the Big Data business running fewer larger clusters is cheaper than running more small clusters. Larger clusters also process larger data sets and support more jobs and users.

The Apache Hadoop MapReduce framework has hit a scalability limit around 4,000 machines. We are developing the next generation of Apache Hadoop MapReduce that factors the framework into a generic resource scheduler and a per-job, user-defined component that manages the application execution. Since downtime is more expensive at scale high-availability is built-in from the beginning; as are security and multi-tenancy to support many users on the larger clusters. The new architecture will also increase innovation, agility and hardware utilization.

Дальше уже идет перевод ближе к тексту.