LINUX.ORG.RU

Cascading 2.0

 ,


0

1

Cascading — Java-фреймворк, позволяющий быстро и легко разрабатывать приложения для анализа и управления данными — обновился до версии 2.0. Cascading работает на платформе Apache Hadoop 1.0 и может быть развёрнут на различных вычислительных средах.

Некоторые особенности Cascading:

  • В своей основе Cascading содержит богатый набор Java API для создания сложных инструментов обработки данных и Maven-совместимых библиотек.
  • Cascading позволяет разработчикам создавать и тестировать функциональные возможности прежде, чем браться за сложные проблемы интеграции.
  • Cascading был разработан, чтобы вписываться в корпоративную среду разработки Java. Существует четкое разграничение между «обработкой данных» и «интеграцией данных». Используются чистые Java API и JUnit, приложение может быть легко проверено на любом уровне.
  • Так как в основе Cascading лежит Java, он естественным образом вписывается во все языки программирования, основанные на JVM (Scala, Clojure, Jruby, Jython, и Groovy):
    -----------------------------------------------------------------------
    |   Enterprise   |         Analytics & Machine Learning                |
    -----------------------------------------------------------------------|
    | Spring | JUnit | Scalding | Cascalog | PyCascading | Cascading.Jruby |
    -----------------------------------------------------------------------|
    |       Java     |  Scala   |  Clojure |    Jython   |      Jruby      |
    -----------------------------------------------------------------------|
    |                           Cascading                                  |
    -----------------------------------------------------------------------
    

Некоторые особенности этого релиза:

  • поддержка Hadoop 1.0.2;
  • поддержка JUnit 4.8.x;
  • исходные коды теперь распространяются на условиях лицензии Apache 2.0 Licensing (до этого была GPLv3);
  • добавлен локальный режим работы, в котором не используются компоненты Hadoop;
  • изменены пакеты для многих внутренних типов для упрощения документации;
  • добавлен новый интерфейс для сбора подробной статистики;
  • многочисленные исправления ошибок;
  • репозиторий проекта переехал на гитхаб.

Новость на nixp.ru

>>> Подробности

★★★★★

Проверено: maxcom ()
Последнее исправление: maxcom (всего исправлений: 2)

Ответ на: комментарий от dave

gridgain не конкурент, этот commercial-friendly, а тот нет. Этот можно использовать в бизнесе, а girdgain только для домашних поделок, не забыв выложить исходники поделки на гитхаб

anonymous
()

интересно, на досуге нужно будет почитать.

aptyp ★★★★
()
Ответ на: Offtop от AX

Давненько я таких табличек не видел…

да, однозначно надо было впердолить doc в новость :)

anonymous
()
Ответ на: комментарий от AX

зачем, если человек в емаксе быстро набросал таблицу и вставил?

psv1967 ★★★★★
()
Ответ на: комментарий от dave

По своему опыту могу сказать, что Hadoop и GridGain предназначены немного для разных задач.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.