From 8c71c6677eeb2c10d52a906cb7e7091ef8da8236 Mon Sep 17 00:00:00 2001 From: Artur Akmalov Date: Wed, 31 May 2023 12:33:09 +0500 Subject: [PATCH] add kafka docs --- docs/misc/kafka.md | 36 ++++++++++++++++++++++++++++++++++++ 1 file changed, 36 insertions(+) create mode 100644 docs/misc/kafka.md diff --git a/docs/misc/kafka.md b/docs/misc/kafka.md new file mode 100644 index 0000000..a99ba0c --- /dev/null +++ b/docs/misc/kafka.md @@ -0,0 +1,36 @@ +--- +sidebar_position: 4 +--- + +# Kafka + +## Вопросы про партиции + +1. То есть каждый консьюмер видит не все сообщения в топике, а то только ту часть, которая попала в его партицию? + +>Да, это так. Каждый консьюмер в консьюмер-группе читает только из своей выделенной партиции топика. +>Если количество консьюмеров совпадает с количеством партиций в топике, то каждый консьюмер будет читать только из своей партиции, и соответственно не будет видеть сообщения, которые находятся в других партициях. +> +> Это может быть полезно для обработки большого объема данных и для масштабирования консьюмеров. +> +> Однако, если количество консьюмеров не совпадает с количеством партиций, то некоторые партиции будут обрабатываться несколькими консьюмерами. +> Это может быть полезно, если некоторые из партиций генерируют больше данных, чем другие. +> +>Используя партиционность, можно обеспечить балансировку нагрузки между консьюмерами и обеспечить распределенную обработку данных. Это может улучшить производительность и масштабируемость вашей системы. + + +2. Если нужно, чтобы все консьюмеры видели все сообщения в топике, то они не должны быть в одной группе? + + +>Нет. Если мы добавим ещё одного консьюмера в группу, то партиции автоматически распределятся между ними. +>Скажем, у нас 3 партиции. c1(consumer1) теперь будет читать сообщения из первой и второй партиции, а c2 — из третьей. Добавив ещё одного консьюмера (c3), мы добьёмся идеального распределения нагрузки, и каждый из консьюмеров в этой группе будет читать данные из одной партиции. +А вот если мы добавим в группу ещё одного консьюмера (c4), то он не будет задействован в обработке сообщений вообще. +> +>Важно понять: внутри одной консьюмер-группы партиции назначаются консьюмерам уникально, чтобы избежать повторной обработки. +> +>Если консьюмеры не справляются с текущим объёмом данных, то следует добавить новую партицию в топик. Только после этого консьюмер c4 начнёт свою работу. + + +3. Если в один топик пишутся события для разных консьюмеров и они находят нужное им событие по определенному uuid и консьюмеры не объединены в группу, то получается каждый прочтет свое сообщение и тк его прочтут не все консьюмеры, то оно будет лежать в топике, пока не выйдет его время жизни и Кафка сама его не почистит? + +>Если 1 партиция, где лежат разного рода данные, тогда создайте разные консюмер-группы под каждый случай, либо делайте разные топики для каждого типа сообщения. Да, кафка удалит сообщение после retention периода