주요 기능
FlowKat은 인프라 모니터링에 필요한 기능을 하나의 플랫폼에 통합하여 제공합니다. 각 기능은 독립적으로 활용할 수 있으며, 서로 연계하여 장애 원인을 빠르게 파악할 수 있습니다.
실시간 대시보드
FlowKat의 대시보드는 시스템 상태를 실시간으로 시각화합니다. 에이전트가 수집한 성능 데이터를 2초 간격으로 갱신하여, 현재 시스템에서 일어나는 상황을 지연 없이 확인할 수 있습니다.
목적별 대시보드
| 대시보드 | 대상 | 주요 지표 |
|---|---|---|
| 통합 대시보드 | 전체 운영자 | 실시간 트랜잭션, 시스템 요약, 알림 현황 |
| 시스템 대시보드 | 시스템 관리자 | CPU, 메모리, JVM 힙, 스레드 상태 |
| 관리자 대시보드 | 시스템 관리자 | 사용자 활동, 시스템 설정, 백업 관리 |
| 운영 대시보드 | 운영팀 | 서비스 가용성, 성능 지표, 이슈 현황 |
사용자 정의 대시보드
기본 대시보드 외에도, 사용자가 직접 위젯을 배치하여 개인화된 대시보드를 구성할 수 있습니다. 필요한 지표만 모아 한 화면에서 확인하는 방식으로, 역할과 관심사에 맞는 모니터링 환경을 만들 수 있습니다.
XLOG (트랜잭션 추적)
XLOG는 FlowKat의 핵심 분석 도구입니다. 개별 트랜잭션의 실행 경로를 시간순 산점도로 시각화하여, 느린 요청이나 에러가 언제, 어디서 발생했는지를 직관적으로 파악합니다.
산점도 분석
X축은 시간, Y축은 응답 시간을 나타냅니다. 정상 트랜잭션은 하단에 밀집되고, 문제가 있는 트랜잭션은 상단에 점으로 표시됩니다. 점을 선택하면 해당 트랜잭션의 상세 프로파일로 이동합니다.
프로파일 분석
하나의 트랜잭션 내에서 실행된 SQL 쿼리, 외부 API 호출, 메서드 호출 순서와 소요 시간을 타임라인으로 확인합니다. 병목 구간을 정확히 짚어낼 수 있어 성능 튜닝의 출발점이 됩니다.
분석 가능한 항목:
- SQL 쿼리 실행 시간 및 텍스트
- 외부 HTTP API 호출 경로 및 응답 시간
- 메서드 호출 체인 (바이트코드 계측 기반)
- 에러 스택 트레이스
성능 분석
시간 구간별 성능 추이를 분석합니다. 응답 시간 분포, 처리량(TPS) 통계, 성능 병목 현상 등을 그래프와 테이블로 제공합니다.
트랜잭션 통계
다양한 기준으로 트랜잭션 데이터를 집계합니다.
| 통계 유형 | 분석 내용 |
|---|---|
| URL 통계 | API별 호출 횟수, 평균 응답 시간, 에러율 |
| SQL 통계 | 쿼리별 실행 횟수, 평균 소요 시간, 느린 쿼리 |
| HTTP 호출 통계 | 외부 API 호출 현황 및 응답 시간 |
| 에러 통계 | 오류 발생 패턴, 에러 코드별 빈도 |
| 방문자 수 통계 | 시간대별 트래픽 패턴 |
| 클라이언트 IP 통계 | 접속 출처별 분포 |
트랜잭션 익스플로러 (TX-Mining)
트랜잭션 익스플로러는 과거 트랜잭션 데이터를 장기간 보관하고 탐색하는 기능입니다. XLOG가 실시간 분석에 초점을 맞춘다면, 트랜잭션 익스플로러는 축적된 데이터에서 패턴과 이상 징후를 발견하는 데 활용됩니다.
디스커버리
히스토그램 기반의 시간 분석과 필드별 통계를 제공합니다. 브러시(brush) 기능으로 특정 시간 범위를 선택하면 해당 구간의 트랜잭션을 상세 조회할 수 있습니다.
트래픽 분석
TopN 집계, 이상 탐지(Anomaly Detection), IP 플러드 감지, 사용자 에이전트 분포 등 트래픽 패턴 분석 기능을 제공합니다. 비정상적인 접속 패턴이나 트래픽 급증을 조기에 발견할 수 있습니다.
데이터 관리
PostgreSQL 기반의 파티션 관리로 데이터 보존 기간을 설정합니다. Valkey 캐시를 활용해 자주 조회하는 데이터의 응답 속도를 높이며, 파티션 단위로 데이터를 정리하여 스토리지를 효율적으로 운영합니다.
가용성 모니터링
센트리
서비스 가용성을 실시간으로 추적합니다. 센트리 그래프에서 가동 시간(Uptime)을 확인하고, 장애 이력과 상세 보고서를 조회합니다. SLA(서비스 수준 협약) 기준 대비 가용률을 한눈에 확인할 수 있습니다.
파노라마
전체 시스템의 상태를 토폴로지 맵으로 표현합니다. 각 서비스의 상태를 색상으로 구분하여, 어느 구간에 문제가 있는지 운영 전체를 조감할 수 있습니다.
모니터링 추적 및 알림
이슈 추적
FlowKat은 자체 이슈 추적 시스템을 내장하고 있습니다. 성능 알람이 발생하면 자동으로 이슈를 생성하고, 담당자에게 알림을 발송합니다.
이슈 관리 기능:
- 이슈 목록 조회, 필터링, 정렬
- 담당자 할당 및 상태 관리
- 댓글과 대댓글을 통한 협업
- 라벨 기반 분류
- 관련 이슈 연결
- 파일 첨부
- 진단 보고서 연동
자동 이슈 생성
성능 임계치를 기반으로 이슈 자동 생성 규칙을 설정할 수 있습니다. 응답 시간 초과, 에러율 급증, 서비스 다운 등의 조건에 따라 이슈가 자동으로 만들어지므로, 장애 감지부터 대응 시작까지의 시간을 단축합니다.
기능 요약
| 기능 | 용도 | 핵심 가치 |
|---|---|---|
| 실시간 대시보드 | 시스템 상태 모니터링 | 2초 간격 실시간 갱신 |
| XLOG | 트랜잭션 실행 경로 분석 | 산점도 기반 직관적 병목 발견 |
| 성능 분석 | 응답 시간, TPS 추이 | 다각도 통계 분석 |
| TX-Mining | 과거 데이터 탐색 | 장기 보관 및 패턴 발견 |
| 센트리/파노라마 | 가용성 추적 | SLA 모니터링, 토폴로지 조감 |
| 모니터링 추적 | 장애 대응 | 자동 이슈 생성, 알림 연동 |