p10. Consumer Rebalance

cwchoiit 2025. 3. 16. 15:49

2025. 3. 16. 15:49

728x90

SMALL

Consumer의 동작 방식

Consumer는 메시지를 가져오기 위해서 Partition에 연속적으로 poll 한다.
가져온 위치를 나타내는 offset 정보를 __consumer_offsets Topic에 저장하여 관리한다.

Consumer Group Id

동일한 group.id로 구성된 모든 Consumer들은 하나의 Consumer Group을 형성한다.
Consumer Group의 Consumer들은 작업량을 어느 정도 균등하게 분할한다.
동일한 Topic에서 consume하는 여러 Consumer Group이 있을 수 있다.

Partition Assignment

Partition을 Consumer에게 Assign할 때,

하나의 Partition은 지정된 Consumer Group 내의 하나의 Consumer만 사용
동일한 Key를 가진 메시지는 동일한 Consumer가 사용 (Partition의 수를 변경하지 않는 한)
Consumer의 설정 파라미터 중에서 partition.assignment.strategy 로 할당 방식 조정
Consumer Group은 Group Coordinator라는 프로세스에 의해 관리 된다.

Consumer Group Coordination

Group Coordinator (하나의 Broker)와 Group Leader(하나의 Consumer)가 상호작용

Consumer Group을 등록하고 Consumer 전체에 Partition을 할당하는 프로세스

1. Consumer 등록 및 Group Coordinator 선택

각 Consumer는 group.id로 Kafka 클러스터에 자신을 등록
Kafka는 Consumer Group을 만들고 Consumer의 모든 Offset은 __consumer_offsets Topic의 하나의 Partition에 저장
- hash(group.id) % offsets.topic.num.partitions 수식을 사용하여 group.id가 저장될 __consumer_offsets의 Partition을 결정
이 Partition의 Leader Broker는 Consumer Group의 Group Coordinator로 선택 (여기서는 Broker 102에 Leader Partition이 있고 따라서 Group Coordinator로 선택됐다고 가정)

2. JoinGroup 요청 순서에 따라 Consumer 나열

Group Coordinator는 Group의 Consumers 카탈로그를 생성하기 전에 Consumers의 JoinGroup 요청에 대해 group.initial.rebalance.delay.ms (기본값 3초)를 대기
Consumer들이 Consume할 최대 Partition 수까지 JoinGroup 요청을 수신하는 순서대로 Consumer를 나열

3. Group Leader 결정 및 Partition 할당

JoinGroup 요청을 보내는 최초 Consumer는 Group Leader로 지정되며, Group Coordinator로부터 Consumer 목록을 받음.
Group Leader는 구성된 partition.assignment.strategy를 사용하여 각 Consumer에게 Partition을 할당
위 그림에서는 Partition보다 더 많은 Consumer가 있으므로, 각 Consumer는 Consume할 Partition이 최대 1개 있다.

4. Consumer -> Partition 매핑 정보를 Group Coordinator에게 전송

Group Leader는 Consumer -> Partition 매핑 정보를 Group Coordinator에게 다시 보냄.
Group Coordinator는 매핑정보를 메모리에 캐시하고 보관

5. 각 Consumer에게 할당된 Partition 정보를 보냄

Group Coordinator는 각 Consumer에게 할당된 Partition 정보를 보냄
각 Consumer는 할당된 Partition에서 Consume을 시작

왜 Group Coordinator(Broker)가 직접 Partition을 할당하지 않는가?
- Kafka의 한가지 원칙은 가능한 한 많은 계산을 클라이언트에 수행하도록 하여, Broker의 부담을 줄이는 것
- 많은 Consumer Group과 Consumer들이 있고 Broker 혼자서 Rebalance를 위한 계산을 한다고 생각해 보면 Broker에 엄청난 부담이 간다.

Consumer Rebalancing Trigger

Rebalancing Trigger

Consumer가 Consumer Group에서 탈퇴
신규 Consumer가 Consumer Group에 합류
Consumer가 Topic 구독을 변경
Consumer Group이 Topic 메타데이터의 변경 사항을 인지 (예: Partition 증가)

Rebalancing Process

Group Coordinator는 heartbeats의 플래그를 사용하여 Consumer에게 Rebalance 신호를 보냄
Consumer가 일시 중지하고 Offset을 Commit
Consumer는 Consumer Group의 새로운 Generation에 다시 합류
Partition 재할당
Consumer는 새 Partition에서 다시 Consume을 시작

위 과정을 살펴보면, Consumer Rebalancing 시, Consumer 들은 메시지를 Consume하지 못한다. 따라서 불필요한 Rebalancing은 반드시 피해야 한다.

Consumer Heartbeats
- Consumer 장애를 인지하기 위함.Consumer는 poll()과 별도로 백그라운드 Thread에서 heartbeats를 보냄 (heartbeat.interval.ms 기본값 3초)
- session.timeout.ms (기본값 10초) 동안 heartbeats가 수신되지 않으면 해당 Consumer는 Consumer Group에서 삭제
- poll()은 heartbeats와 상관없이 주기적으로 호출된다. (max.poll.interval.ms 기본값 5분)

과도한 Rebalancing을 피하는 방법

Consumer Group 멤버 고정

Group의 각 Consumer에게 고유한 group.instance.id 를 할당
Consumer는 LeaveGroupRequest를 사용하지 않아야 한다. LeaveGroupRequest는 Consumer가 빠질때 "나 빠져요~"하고 알려주는 건데 이걸 하면 해당 group의 고유한 Consumer의 group.instance.id가 날라가게 된다.
Rejoin은 알려진 group.instance.id에 대한 Rebalance를 trigger하지 않는다.

session.timeout.ms 튜닝

heartbeat.interval.ms를 session.timeout.ms의 1/3로 설정
group.min.session.timeout.ms(default : 6 sec)와 group.max.session.timeout.ms(default : 5 min)의 사이값으로 설정
장점: Consumer가 Rejoin할 수 있는 더 많은 시간을 제공
단점: Consumer 장애를 감지하는 데 시간이 더 오래걸림

max.poll.interval.ms 튜닝

Consumer에게 poll()한 데이터를 처리할 수 있는 충분한 시간 제공
너무 크게 해도 안된다.

728x90

LIST

저작자표시

'Apache Kafka' 카테고리의 다른 글

p12. Kafka Log File (0)	2025.03.16
p11. Partition Assignment Strategy (0)	2025.03.16
p9. Replica Recovery (0)	2025.03.16
p8. Replica Failure (0)	2025.03.15
p7. Acks, Batch, Page Cache, Flush (0)	2025.03.15

programmer.cwchoiit cwchoiit 님의 블로그입니다.

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

programmer.cwchoiit