Apache Kafka 1.0

java, scala

1 ноября вышла версия 1.0 Apache Kafka — распределённого программного брокера сообщений с открытым исходным кодом, написанного на Scala, от Apache Software Foundation.

Изменения:

Улучшены streams API, позволяющие упростить отладку и код клиентов.
Добавлены новые метрики, призванные облегчить мониторинг состояния элементов системы; улучшены старые.
Добавлена поддержка Java 9.
Улучшена обработка ошибок при SASL-аутентификации. Раньше некоторые условия возникновения ошибок аутентификации были неотличимы от ошибок брокера.
Реализовано сохранение частичной функциональности при отказе дисков. Раньше отказ диска приводил к полной остановке брокера.
Внесены изменения, позволяющие повысить производительность при использовании idempotent producer.

>>> Подробности

Ссылка

← NeoVim 0.2.1

Состоялся релиз GNU time 1.8 →

Kafka это в честь писателя?

karton1 ★★★★★
(08.11.17 18:21:02 MSK)

Ответ на: комментарий от karton1 08.11.17 18:21:02 MSK

Да.

Deleted
(08.11.17 18:25:27 MSK)

Ссылка

мы рождены чтоб вапорware фреймворки жаву и воровские лицензии Зделать былью

~~mos~~ ★★☆☆☆
(08.11.17 18:31:58 MSK)

Ответ на: комментарий от karton1 08.11.17 18:21:02 MSK

нет просто горячая кафка, трудно с полным ртом то

anonymous
(08.11.17 18:33:32 MSK)

Ссылка

это клон rabbitmq или чего-то такого?

anonymous
(08.11.17 18:43:10 MSK)

Стабильная версия, сказали они
https://issues.apache.org/jira/browse/KAFKA-6185

godlike
(08.11.17 18:48:04 MSK)

Ответ на: комментарий от anonymous 08.11.17 18:43:10 MSK

Нет, это распределённая очередь сообщений на файлах :)

anonymous
(08.11.17 18:48:22 MSK)

Ответ на: комментарий от anonymous 08.11.17 18:48:22 MSK

Нет, это распределённая очередь сообщений на файлах :)

потому что на SCALA не написать ничего нормально scalable(отличный каламбур, ящитаю)

anonymous
(08.11.17 18:49:21 MSK)

Ответ на: комментарий от mos 08.11.17 18:31:58 MSK

Ты вообще в курсе как называются компоненты хадуповской экосистемы?
Там все такое: Узи, Пиг, Скуп, Кафка, и т.д. Я могу долго продолжать. У ребят какой-то веселый нейминг-конвеншн.

~~sphericalhorse~~ ★★★★★
(08.11.17 19:42:25 MSK)
Последнее исправление: sphericalhorse 08.11.17 19:42:49 MSK (всего исправлений: 2)

Ссылка

Уже шутили про возможные названия релизов: «Грефневая», «Пфонная»,... ?

alt-x ★★★★★
(08.11.17 19:45:40 MSK)
Последнее исправление: alt-x 08.11.17 19:46:13 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 08.11.17 18:43:10 MSK

похоже, но не есть один нюанс.

сообщения в топиках иммутабельны, а сами топики append-only.

на консаминге по топику выполняется только чтение, на запись приходится трекать только смещение очередного консамера (группы) по топику.

на практике это означает, что на конкретный топик можно натравить громадное количество консамеров, каждый из которых будет делать что-то своё и не мешать остальным.

это очень удобно для каппа-архитектуры, когда в топик складывают громадный поток событий (юзерские события например), а потом ворохом специализированных консамеров генерят нужные отражения.

профит в том, что если в консамере поменялась бизнес-логика, новое полноценное отражение можно построить просто натравив такого консамера на топик заново.

VladimirMalyk ★★★★★
(08.11.17 19:47:35 MSK)

Ответ на: комментарий от alt-x 08.11.17 19:45:40 MSK

Уже шутили про возможные названия релизов: «Грефневая», «Пфонная»,... ?

нет, ты первый так мощно пошутил, тебе нужно спасти КВН, оставь свои контакты, я позвоню

anonymous
(08.11.17 20:12:22 MSK)

Ссылка

Ответ на: комментарий от VladimirMalyk 08.11.17 19:47:35 MSK

сообщения в топиках иммутабельны, а сами топики append-only.

щас придет шаман000 и покажет тебе кто тут ~~петух~~ иммутабельный

anonymous
(08.11.17 20:13:28 MSK)

Ответ на: комментарий от VladimirMalyk 08.11.17 19:47:35 MSK

это очень удобно для каппа-архитектуры, когда в топик складывают громадный
поток событий (юзерские события например), а потом ворохом
специализированных консамеров генерят нужные отражения.

такая возможность для чего-нибудь кроме статистики нужна?

Joe_Bishop ★
(08.11.17 20:20:19 MSK)

Мы рождены, чтоб Кафку сделать былью?

А, уже пошутили. Окей.

hobbit ★★★★★
(08.11.17 21:28:33 MSK)

Ссылка

Плачем, но пользуемся

Почему нет менее жручего аналога на человеческом языке?

anonymous
(08.11.17 21:51:08 MSK)

Ответ на: комментарий от anonymous 08.11.17 18:48:22 MSK

Ты так говоришь будто это что-то плохое :)

Reset ★★★★★
(08.11.17 22:00:00 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.11.17 18:49:21 MSK

Они кстати уже наполовину её переписали на java

Reset ★★★★★
(08.11.17 22:00:36 MSK)

Ссылка

Кстати на java 9 я не осилил её собрать — gradle рушится

Reset ★★★★★
(08.11.17 22:01:51 MSK)

Ссылка

Кафка последний год развивается семимильными шагами. Уже почти от всех костылей построенных над кафкой можно избавляться, что не может не радовать.

Reset ★★★★★
(08.11.17 22:03:05 MSK)

Ссылка

Ответ на: Плачем, но пользуемся от anonymous 08.11.17 21:51:08 MSK

Есть. https://github.com/travisjeffery/jocko Даже почти можно пользоваться.

anonymous
(08.11.17 22:29:58 MSK)

Ответ на: комментарий от karton1 08.11.17 18:21:02 MSK

Оно конечно писатель был хороший, но софт с таким названием пробовать минимум страшно. Лучше на сто километров не подходить.

~~dmxrand~~ ★
(08.11.17 22:40:06 MSK)

Любить - значит страдать. Чтобы не страдать, надо не любить. Но тогда будешь страдать от того, что не любишь. Поэтому, любить — значит - страдать. Но не любить - тоже значит страдать. А страдать - значит страдать. Чтобы быть счастливым, нужно любить, значит надо страдать, но страдание делает человека несчастным, поэтому чтобы быть несчастным, нужно любить, или любить, чтобы страдать или страдать от избытка счастья.

w1nner ★★★★★
(08.11.17 23:57:41 MSK)

Ссылка

Ответ на: комментарий от dmxrand 08.11.17 22:40:06 MSK

Не переживай, это лечится.

anonymous
(09.11.17 00:03:02 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.11.17 18:43:10 MSK

Не, не клон. Кафка умеет только direct exchange ребита. Она значительно быстрее за счет в т.ч. отсутствия подтверждений получения клиентом сообщений и блабла. Годный в общем продукт, да и HA и шардинг есть.

ipeacocks ★★★★★
(09.11.17 01:45:42 MSK)
Последнее исправление: ipeacocks 09.11.17 01:46:42 MSK (всего исправлений: 1)

Ссылка

Ждём новую версию confluent platform

Fist ★
(09.11.17 09:56:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.11.17 22:29:58 MSK

Оу, не знал про Jocko, спасибо. Как допилят репликацию и consumer groups, заценим.

anonymous
(09.11.17 10:47:06 MSK)

Ссылка

а как устроен(а) скала ?
это компилятор или требует установки виртуальной машины ?

kto_tama ★★★★★
(09.11.17 11:14:39 MSK)

Ссылка

Ответ на: Плачем, но пользуемся от anonymous 08.11.17 21:51:08 MSK

NATS streaming ещё есть

Joe_Bishop ★
(09.11.17 16:37:46 MSK)
Последнее исправление: Joe_Bishop 09.11.17 16:38:03 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от godlike 08.11.17 18:48:04 MSK

https://issues.apache.org/jira/browse/KAFKA-6185

На жабке утекает память. Какая прелесть! Боюсь представить, что эти люди набыдлокодили бы на каких-нибудь крестах... Хотя погодите... Apache Xerces. К счастью, оно вроде бы больше не шевелится.

kawaii_neko ★★★★
(09.11.17 16:56:48 MSK)

Ссылка

Ответ на: комментарий от VladimirMalyk 08.11.17 19:47:35 MSK

consumer читается как [kənˈsjuːmə], а не [kənˈsʌmə].

GFORGX ★★★
(10.11.17 02:49:14 MSK)

Ссылка

Ответ на: комментарий от Joe_Bishop 08.11.17 20:20:19 MSK

аналитика это самое ходовое применение, из тех что я слышал.
опять же, хорошая аналитика это добрая треть, если даже не половина любого продуктового бизнеса.

VladimirMalyk ★★★★★
(10.11.17 13:12:56 MSK)

Ответ на: комментарий от anonymous 08.11.17 20:13:28 MSK

да, строго говоря у топиков кафки не полная иммутабельность, тк доступны различные стратегии компакта логов. но ваниль всё же append-only лог который предлагается перечитывать до посинения.

VladimirMalyk ★★★★★
(10.11.17 13:15:13 MSK)

Ссылка

Ответ на: комментарий от VladimirMalyk 10.11.17 13:12:56 MSK

аналитика это самое ходовое применение, из тех что я слышал.

но тогда это довольно бессмысленный юзкейс получается: гораздо дешевле свалить данные в кликхаус

Joe_Bishop ★
(10.11.17 14:42:22 MSK)

Ответ на: комментарий от Joe_Bishop 10.11.17 14:42:22 MSK

кафка про другое.

прежеде, чем свалить данные в кликхаус (или любое другое колоночное хранилище), их нужно подготовить.

это происходит в тч. с урезанием сырой информации в схему, удобную для OLAP-обработки.

и если через полгода выяснится, что схема неполная либо наполнялась с ошибками — наполнить новую схему историческими данными уже не получится.

один из кейсов для кафки — пустить в топик сырых данных новую группу потребителей, которые спокойно навалят данных в новую схему. а потом ещё и продолжат доливать новые порции в реальном времени.

VladimirMalyk ★★★★★
(10.11.17 20:21:51 MSK)
Последнее исправление: VladimirMalyk 10.11.17 20:25:39 MSK (всего исправлений: 1)

Ответ на: комментарий от VladimirMalyk 10.11.17 20:21:51 MSK

тогда уж проще логи полгода хранить

Joe_Bishop ★
(10.11.17 21:21:37 MSK)

Ответ на: комментарий от Joe_Bishop 10.11.17 21:21:37 MSK

собственно, кафка как раз и есть log database: «massively scalable pub/sub message queue architected as a distributed transaction log».

но это много больше чем традиционные логи — это возможность строить БД и процессы непосредственно на логах, в широком смысле.

например, лог операций (поток репликации) уже давно применяется в традиционных бд для репликации с мастера на слейвы.

что предлагают попробовать с кафкой — это поставить поток репликации (лог операций) во главу угла и работать непосредственно с ним.

это ещё называют «database inside out», и это решает некоторые проблемы, с которыми приходится мириться в традиционных БД:
https://www.youtube.com/watch?v=fU9hR3kiOK0

VladimirMalyk ★★★★★
(13.11.17 12:35:36 MSK)

Ответ на: комментарий от VladimirMalyk 13.11.17 12:35:36 MSK

собственно, кафка как раз и есть log database: «massively scalable pub/sub message queue architected as a distributed transaction log».

а вычищать устаревшее она умеет? ну допустим после месяца или N сообщений (не строго)

а то приходилось городить подобное на файловых append-only очередях

Deleted
(13.11.17 12:42:42 MSK)

Ответ на: комментарий от Deleted 13.11.17 12:42:42 MSK

изкоробочная классика — отрезать хвост лога по к-ву сообщений, объему занятого топиком места, временным меткам сообщений.

но есть и более продвинутые стратегии компакта — удаление дублей, удаление отдельных сообщений. но тут уже придётся пожертвовать быстродействием.

VladimirMalyk ★★★★★
(13.11.17 12:49:36 MSK)