LINUX.ORG.RU

Вышла новая версия Apache Kafka

 ,


0

2

Apache Kafka — это распределенная система передачи сообщений, рассчитанная на высокую пропускную способность.

Ключевые особенности системы:

  • Скорость: один узел кластера может обрабатывать сотни мегабайт записей в секунду.
  • Масштабируемость: кластер можно прозрачно расширять без простоя, потоки данных партицированы.
  • Надежность: сообщения в кластере отреплицированы, каждый узел может держать терабайты данных без потерь в производительности.

Изменения в версии 0.8.1:

  • Поддержка дедупликации логов.
  • Увеличение скорость записи за счет более рационального использования fsync.
  • Поддержка расширения числа партиций и удаления топиков.
  • Автоматическая балансировка лидеров партиций.
  • Багфиксы.

Новое в версии 0.8.1
Скачать

>>> Анонс

★★★★★

Проверено: maxcom ()
Последнее исправление: maxcom (всего исправлений: 2)

Apache Kafka — это распределенная система передачи сообщений, рассчитанная на высокую пропускную способность.

Я правильно понимаю, что это, грубо говоря, п2п аська?

sT331h0rs3 ★★★★★
()

Apache Kafka — это распределенная система передачи сообщений, рассчитанная на высокую пропускную способность.

Надеюсь, он не передает сообщения также, как Варнава.(намек на название)

Yaourt
()
Ответ на: комментарий от sT331h0rs3

Возможно ошибаюсь, но насколько я понял это что то вроде WebSphereMQ. для передачи сообщении между приложениями.

gun
()
Ответ на: комментарий от sT331h0rs3

Apache Kafka — это распределенная система передачи сообщений, рассчитанная на высокую пропускную способность.

Я правильно понимаю, что это, грубо говоря, п2п аська?

По докам это больше похоже на кластеризуемый MQ сервер.

PS http://en.wikipedia.org/wiki/Message_queue

VoDA ★★
()
Ответ на: комментарий от Yaourt

Варнава-то вроде в романе усердно трудился, хоть и был несколько туповат. Не?

Атмосфера безысходности при разворачивании системы прилагается? :)

yoghurt ★★★★★
()
Ответ на: комментарий от yoghurt

Варнава-то вроде в романе усердно трудился, хоть и был несколько туповат. Не?

\begin{offtopic}
Нууу... он (Варнава) утверждал, что он упорно трудился, а как оно было на самом деле - не указано.
В любом случае результата от его работы было чуть больше, чем ничего.
\end{offtopic}

Надо будет глянуть на досуге, что это за Kafka такая.

gour
()
Ответ на: комментарий от BattleCoder

Я её использую с момента отделения бранча 0.8.1 в гите. Оф анонс пропустил :)

Reset ★★★★★
() автор топика
Ответ на: комментарий от m1ke

Kafka реализует персистентную очередь сообщений. Читатель может прийти за своей порцией данных через неделю и при этом всё прочитает.

Reset ★★★★★
() автор топика
Ответ на: комментарий от sT331h0rs3

Это очередь сообщений. Куча писателей отправляют сообщения в кластер, куча читателей читают. При этом ноды кластера могут выпадать и при этом данные не потеряются. Читатели тоже могут выпадать и дочитать свой кусок данных потом.

Reset ★★★★★
() автор топика

Всем спасибо за занимательные версии, но теперь по порядку

1) Эта штука устроена совсем не как WebSphere MS, ActiveMQ, RabbitMQ

2) Kafka - sharded queue. Тоесть очереди разделены по партициям, которые не знают о друг друге и распределены по независимым узлам

3) Они координируются через сервер Apache Zookeeper, который Highly Available. Таким образом если не считать Zookeeper - point of failure, но Kafka не содержит Single Point Of Failure.

4) Когда вы пишете сообщение, то Kafka просто сохраняет его в файл с помощью append

5) Когда вы читаете из Kafka, то вы указываете откуда и по какое сообщение читать из файла, тоесть используете pull model вместо push, как принято в остальных очередях. Это может быть знакомо некоторым из Amazon SQS

6) Понятие «получить сообщение» неизвестно Kafka. Вы можете прочитать любое сообщение в истории сколько угодно раз, пока его не удалили согласно устареванию на основе вами указаной конфигурации. Например можно держать все сообщения. Можно только последнюю неделю. Таким образом клиент решает, получил ли он сообщение

7) Для удобства пользователей в качестве надстройки доступен High Level Consumer, который используя Zookeeper вводит понятие «получить сообщение» и позволяет отличать семантику topic/queue. Для того чтобы различать эту сематику множественные conumerам тоже нужна координация.

vertexua ★★★★★
()
Последнее исправление: vertexua (всего исправлений: 2)
Ответ на: комментарий от vertexua

С 0.8 вся координация между узлами осуществляется через контроллер (самостоятельная сущность внутри кафки, работает на одном из узлов). Зоокипер нужен для публикации метаданных и для стартапа узлов.

Reset ★★★★★
() автор топика
Ответ на: комментарий от Reset

А для, High Level Consumer? Но если координатор на _одном_ узле, это не одно и то же? Тем более как этот узел реплицирует свои метаданные о полученых сообщениях в consumer groups?

vertexua ★★★★★
()
Последнее исправление: vertexua (всего исправлений: 1)

Правильно понимаю, что к JMS оно никакого отношения не имеет?

CARS ★★★★
()
Ответ на: комментарий от vertexua

А для, High Level Consumer?

High Level Consumer — нерабочий кусок говна. В кафке в качестве consumer'а в продакшене можно использовать одну из двух сущностей — SimpleConsumer, AbstractFetcherThread. Причем вторая сущность построена на первой :)

Тем более как этот узел реплицирует свои метаданные о полученых сообщениях в consumer groups?

Зачем ему это делать? Consumer это клиентская часть. Каждый клиент сам решает где хранить свои метаданные.

Reset ★★★★★
() автор топика
Ответ на: комментарий от vertexua

Благодарю за развёрнутый ответ. Так сказать, расширил свой кругозор.

BattleCoder ★★★★★
()
Ответ на: комментарий от yoghurt

Атмосфера безысходности при разворачивании системы прилагается? :)

К MQ Series«Web Sphere MQ»(ТМ) раньше прилагалась, еще как. Шестизначне пароли, ограничение на длину имени юзера, никакого автокомплита в шелле... И документация «чтобы А см. B, С, D»... «чтобы B, см... X, Y, Z...» (далее - везде)

slackwarrior ★★★★★
()
Ответ на: комментарий от slackwarrior

Тем, что занимается другими задачами. Но работает это всё в рамках одного процесса. Узлы кафки договариваются кто будет контроллером. При падении контроллера происходят перевыборы.

Reset ★★★★★
() автор топика

Кстати, в этой версии в клиентской части появилось то, чего я «джва года ждал», а именно неблокирующий продюсер на колбеках. Но есть одна засада — под нагрузкой у него ломается внутреннее состояние и он встает колом :(

Reset ★★★★★
() автор топика
Последнее исправление: Reset (всего исправлений: 1)

Для поклонников Ф.Кафки, Ein Apachekünstler.

shgurbanov
()
Ответ на: комментарий от m1ke

А как оно в сравнении с RabbitMQ?

РаббитМQ - кластерный брокер, лишняя точка отказа в кластере. Жрёт оперативку пропорционально длине очереди, т.е. если что-то где-то нарушилось, и какая-то очередь начала быстро расти, то жди беды, которая парализует весь кластер.

shahid ★★★★★
()
Ответ на: комментарий от shahid

это потому что рабитмк процессит каждое сообщение.

anonymous
()
Ответ на: комментарий от I-Love-Microsoft

распределенная - один пакет собеседнику, другой в АНБ

и не только в АНБ, но в местечковые организации: ФСБ, КГБ и т.д.

mbwa
()
Ответ на: комментарий от I-Love-Microsoft

У нас используется и в жабе и в плюсах и в перле ... правда имеется свой слой http-абстракции над кафочным протоколом.

Reset ★★★★★
() автор топика
Ответ на: комментарий от yoghurt

Усердство не мешало ему плохо выполнять свою работу.

Yaourt
()
Ответ на: комментарий от Reset

Узлы кафки договариваются кто будет контроллером

«Посоны, я создал!» (с)

slackwarrior ★★★★★
()
Ответ на: комментарий от Reset

High Level Consumer — нерабочий кусок говна

Двачую вас сер обеими конечностями. Пилю свой. Тоже на базе зукипера, с небольшим частным нюансом

vertexua ★★★★★
()
Ответ на: комментарий от kkk

Сферы применения немного разные.

Reset ★★★★★
() автор топика
Ответ на: комментарий от Reset

На основе simple consumer + zookeeper играюсь. В отличии от High Level нету понятия сообщения получено или нет, но есть распределение работы чтобы два consumer не получили одно и то же сообщение. Zookeeper таким образом тоже простаивает, а понятие получения может перекладываться на наличие данных по сообщению в какой-то шарданутой базе например

vertexua ★★★★★
()
Последнее исправление: vertexua (всего исправлений: 2)
Ответ на: комментарий от yoghurt

Усердно, но абсолютно бесполезно. Что бы оправдать название, Apache Kafka следует делать так же, а настройки сделать в общем стиле Кафки. По форме верно, а по сути - сюр.

ForwardToMars
()

Следующая версия - Apache Orwell

Vinni_Pooh ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.