이벤트 기반 아키텍처(EDA) 구축: Apache Kafka vs RabbitMQ 심층 비교

1. 이벤트 기반 아키텍처(EDA)란 무엇인가?

이벤트 기반 아키텍처(Event-Driven Architecture, EDA)는 시스템의 구성 요소들이 '이벤트(Event)'의 발생, 감지, 소비를 통해 서로 통신하고 상호작용하는 소프트웨어 아키텍처 패러다임입니다. '이벤트'란 '주문 완료', '사용자 가입'과 같이 시스템에서 발생한 의미 있는 상태의 변화를 의미합니다. 이 아키텍처에서 이벤트를 만드는 서비스(Producer)는 특정 서비스(Consumer)를 직접 호출하는 대신, 중앙의 메시지 브로커(Message Broker)에게 이벤트를 발행(Publish)합니다. 그러면 해당 이벤트에 관심 있는 모든 서비스들이 이벤트를 구독(Subscribe)하여 비동기적으로 처리합니다.

이러한 방식은 서비스 간의 결합도를 획기적으로 낮추어(Loose Coupling), 각 서비스를 독립적으로 개발하고 확장하며, 일부 서비스에 장애가 발생하더라도 전체 시스템의 동작에 미치는 영향을 최소화하는 강력한 탄력성(Resilience)을 제공합니다. 이는 마이크로서비스 아키텍처(MSA)의 핵심 사상을 구현하는 데 매우 효과적인 접근법입니다.

2. 전통적인 메시지 브로커의 강자: RabbitMQ

RabbitMQ는 AMQP(Advanced Message Queuing Protocol)라는 표준 프로토콜을 기반으로 하는 매우 성숙하고 안정적인 오픈소스 메시지 브로커입니다. '똑똑한 브로커(Smart Broker)' 철학을 가지고 있으며, 복잡한 라우팅 규칙을 통해 메시지를 정확히 원하는 소비자에게 전달하는 데 탁월한 능력을 보입니다.

핵심 아키텍처: 생산자가 메시지를 'Exchange'라는 곳에 보내면, Exchange는 설정된 라우팅 규칙(Binding)에 따라 메시지를 하나 이상의 'Queue'에 분배합니다. 그러면 소비자는 이 Queue에서 메시지를 가져와 처리합니다.
주요 강점:
- 유연한 라우팅: Direct, Topic, Fanout, Headers 등 다양한 Exchange 타입을 지원하여 복잡하고 정교한 메시지 라우팅 시나리오를 쉽게 구현할 수 있습니다.
- 강력한 전달 보장: 소비자가 메시지를 성공적으로 처리했음을 확인(Acknowledgement)하는 메커니즘을 통해 메시지 유실을 방지합니다.
- 편리한 관리 기능: 웹 기반의 관리 UI를 제공하여 큐의 상태, 메시지 흐름 등을 직관적으로 모니터링하고 관리할 수 있습니다.
적합한 사용 사례:
- 결제 처리, 이메일 발송 등과 같이 반드시 처리되어야 하는 백그라운드 작업(Task Queue).
- 메시지를 특정 규칙에 따라 선별적으로 다른 소비자에게 전달해야 하는 경우.
- 시스템의 부하가 예측 가능하고, 대규모 데이터 스트리밍보다는 안정적인 메시지 전달이 더 중요한 경우.

3. 분산 이벤트 스트리밍 플랫폼: Apache Kafka

Apache Kafka는 단순히 메시지를 전달하고 삭제하는 큐가 아니라, 대용량의 실시간 이벤트 스트림을 처리하기 위해 설계된 '분산 스트리밍 플랫폼'입니다. '멍청한 브로커(Dumb Broker)' 철학을 따르는데, 이는 브로커가 복잡한 라우팅을 하는 대신 데이터를 순서대로 파일 시스템에 기록하는 역할에만 충실하고, 소비자가 자신의 필요에 맞게 데이터를 가져가는(Pull) 구조를 의미합니다.

핵심 아키텍처: 생산자가 보낸 이벤트는 'Topic'이라는 카테고리로 분류되어 저장됩니다. 각 토픽은 여러 개의 'Partition'으로 나뉘어 병렬 처리가 가능하며, 데이터는 삭제되지 않고 설정된 기간 동안 보존됩니다(Immutable Log).
주요 강점:
- 압도적인 처리량과 확장성: 데이터를 여러 파티션에 분산 저장하고, 컨슈머 그룹을 통해 병렬로 처리하므로 초당 수백만 건의 이벤트를 처리할 수 있는 수평적 확장이 가능합니다.
- 데이터 내구성 및 재생(Replay): 이벤트가 디스크에 영구적으로 저장되므로, 장애 발생 시 데이터를 복구하거나 새로운 소비자가 과거의 이벤트부터 순서대로 다시 처리하는 것이 가능합니다.
- 스트림 처리 생태계: Kafka Streams, ksqlDB와 같은 도구를 통해 이벤트 스트림을 실시간으로 변환, 집계, 분석하는 스트림 처리 애플리케이션을 쉽게 구축할 수 있습니다.
적합한 사용 사례:
- 웹사이트 클릭 스트림, 애플리케이션 로그, IoT 센서 데이터 등 대규모 실시간 데이터 수집 및 처리.
- 여러 시스템이 동일한 이벤트 데이터를 각기 다른 목적으로 사용해야 하는 경우 (데이터 허브).
- 이벤트 소싱(Event Sourcing)이나 CQRS 패턴 구현.

4. Kafka vs RabbitMQ: 무엇을 선택해야 할까?

두 기술은 상호 대체재가 아니라 각기 다른 문제 영역을 해결하기 위해 설계되었습니다. 선택은 여러분의 시스템이 해결하고자 하는 핵심 문제에 달려 있습니다.

RabbitMQ를 선택해야 하는 경우는 시스템이 복잡한 라우팅 로직을 필요로 하고, 각 메시지의 안정적인 전달이 대용량 처리보다 중요하며, 전통적인 작업 큐(Task Queue) 패턴을 구현하고자 할 때입니다.

반면, Apache Kafka를 선택해야 하는 경우는 대규모의 이벤트 데이터를 순서대로, 그리고 안정적으로 처리해야 하며, 이 데이터를 여러 소비자가 각자의 속도로 소비하거나 과거 데이터를 다시 분석할 필요가 있을 때입니다. 실시간 데이터 파이프라인과 스트림 분석이 요구되는 현대적인 데이터 중심 애플리케이션에 더 적합합니다.

궁극적으로, 어떤 도구를 선택할지는 '메시지를 안정적으로 전달하는 것'이 목적인지, 아니면 '이벤트 스트림을 영구적으로 저장하고 분석하는 플랫폼'을 구축하는 것이 목적인지에 따라 결정됩니다. 비즈니스의 요구사항을 명확히 이해하고 그에 맞는 최적의 도구를 선택하는 것이 성공적인 이벤트 기반 아키텍처를 구축하는 첫걸음입니다.

클라우드 및 데브옵스 by 오렌지마음