3단원: 이벤트 알람과 이슈 추적
학습 목표
이 단원을 마치면 다음을 할 수 있습니다.
- 이벤트 알람의 역할과 중요성을 설명할 수 있습니다
- 시스템 대시보드에서 이벤트(알람) 목록을 확인할 수 있습니다
- 이슈 추적 기능으로 장애를 기록하고 관리할 수 있습니다
1. 이벤트 알람이란?
1.1 왜 알람이 필요한가요?
24시간 대시보드를 지켜볼 수는 없습니다. 이벤트 알람은 시스템에 이상이 발생했을 때 자동으로 알려주는 기능입니다.
| 상황 | 알람 없이 | 알람 사용 시 |
|---|---|---|
| 서버 CPU 급등 | 다음 날 출근 후 발견 | 즉시 이벤트로 감지 |
| 에이전트 연결 끊김 | 모니터링 데이터 누락 후 인지 | 연결 끊김 이벤트 즉시 표시 |
| 응답 지연 발생 | 사용자 불만 접수 후 확인 | 시스템 대시보드에서 이벤트 확인 |
1.2 FlowKat의 이벤트 유형
FlowKat은 시스템 대시보드에서 발생한 이벤트(알람)를 실시간으로 표시합니다.
| 유형 | 설명 | 예시 |
|---|---|---|
| 에이전트 이벤트 | 에이전트 연결/해제 관련 | 에이전트 연결 끊김, 재연결 |
| 리소스 이벤트 | CPU, 메모리 등 시스템 리소스 | CPU 사용률 임계치 초과 |
| 서비스 이벤트 | 트랜잭션 처리 관련 | 응답시간 지연, 에러 발생 |
1.3 이벤트 확인 위치
시스템 대시보드의 이벤트(알람) 영역에서 발생한 이벤트를 확인할 수 있습니다.
접근 경로:
메뉴: 대시보드 > 모니터링 > 시스템 대시보드
URL: /workgroup/[workgroupId]/monitoring/system
시스템 대시보드 하단의 이벤트 목록에서 다음을 확인합니다.
| 항목 | 설명 |
|---|---|
| 발생 시각 | 이벤트가 발생한 시간 |
| 이벤트 유형 | 알람의 종류 (에이전트, 리소스, 서비스) |
| 대상 오브젝트 | 이벤트가 발생한 서버/에이전트 |
| 메시지 | 이벤트 상세 내용 |
2. 이슈 추적
2.1 이슈 추적이란?
이벤트로 문제를 감지했다면, 그 문제를 체계적으로 기록하고 해결 과정을 추적해야 합니다. FlowKat의 이슈 추적 기능은 GitHub Issues와 유사한 이슈 관리 시스템입니다.
| 기능 | 설명 |
|---|---|
| 이슈 생성 | 문제 상황을 제목, 내용, 우선순위와 함께 기록합니다 |
| 상태 관리 | 진행중/완료 등 이슈 상태를 변경합니다 |
| 댓글 | 이슈에 대한 논의와 해결 과정을 기록합니다 |
| 라벨 | 이슈를 분류하고 필터링합니다 |
| 첨부파일 | 스크린샷이나 로그 파일을 첨부합니다 |
접근 경로:
메뉴: 대시보드 > 이슈 추적
URL: /workgroup/[workgroupId]/tracking
2.2 이벤트에서 이슈까지의 흐름
장애가 발생하면 다음 흐름으로 대응합니다.
이벤트 감지 → 원인 분석 → 이슈 생성 → 해결 작업 → 이슈 종료
| 단계 | 활동 | FlowKat 기능 |
|---|---|---|
| 1. 감지 | 시스템 대시보드에서 이벤트 확인 | 이벤트(알람) 목록 |
| 2. 분석 | XLOG, 프로파일로 원인 파악 | XLOG 검색/분석 |
| 3. 기록 | 이슈로 등록하여 추적 시작 | 이슈 추적 > 이슈 생성 |
| 4. 해결 | 댓글로 진행 상황 기록 | 이슈 상세 > 댓글 |
| 5. 종료 | 해결 후 상태 변경 | 이슈 상태 → 완료 |
이슈 작성 요령
좋은 이슈에는 다음 정보가 포함됩니다.
- 언제: 문제 발생 시각 (이벤트 시각 참조)
- 어디서: 어떤 서버/서비스에서 발생했는지
- 무엇이: 어떤 증상이 나타났는지
- 얼마나: 영향 범위 (전체 서비스 / 특정 URL)
3. 실습: 이벤트 확인과 이슈 등록
단계 1: 시스템 대시보드에서 이벤트를 확인합니다
- 대시보드 > 모니터링 > 시스템 대시보드로 이동합니다
- 하단의 이벤트(알람) 영역을 확인합니다
- 최근 발생한 이벤트가 있다면 발생 시각과 내용을 확인합니다
단계 2: 이벤트 상세 내용을 파악합니다
- 이벤트 메시지에서 어떤 오브젝트(서버)에서 발생했는지 확인합니다
- 이벤트 유형이 에이전트, 리소스, 서비스 중 어디에 해당하는지 파악합니다
- 필요하다면 XLOG 페이지로 이동하여 해당 시간대의 트랜잭션을 분석합니다
단계 3: 이슈 추적 페이지로 이동합니다
- 좌측 메뉴에서 이슈 추적을 클릭합니다
- 기존 이슈 목록이 있다면 어떤 이슈가 등록되어 있는지 살펴봅니다
- 상태(진행중/완료)와 라벨로 이슈를 필터링해 봅니다
단계 4: 새 이슈를 생성합니다
- 이슈 생성 버튼을 클릭합니다
- 제목을 입력합니다 (예: "API 서버 응답 지연 -- 2024-01-15 14시")
- 내용에 증상, 발생 시각, 영향 범위를 작성합니다
- 라벨을 태깅합니다 (예: 성능, 긴급)
- 스크린샷이 있다면 첨부합니다
단계 5: 이슈 상세 페이지를 확인합니다
- 생성된 이슈를 클릭하여 상세 페이지를 엽니다
- 댓글을 추가하여 분석 결과를 기록합니다
- 해결이 완료되면 상태를 완료로 변경합니다
직접 편집
이슈 상세 페이지에서는 GitHub Issues처럼 필드를 직접 클릭하여 수정할 수 있습니다. 별도의 편집 페이지로 이동할 필요가 없습니다.
학습 완료 체크리스트
이 단원을 마쳤다면 아래 항목을 확인해 보세요.
- 이벤트 알람이 왜 필요한지 설명할 수 있다
- 시스템 대시보드에서 이벤트(알람) 목록을 찾을 수 있다
- 이슈 추적 페이지에 접속하여 이슈 목록을 확인했다
- 새 이슈를 생성하고 댓글을 추가할 수 있다
- 이벤트 감지 → 원인 분석 → 이슈 등록 → 해결의 흐름을 이해했다
확인 문제
다음 단원으로 넘어가기 전에 확인해 보세요.
- FlowKat에서 이벤트(알람)를 확인할 수 있는 위치는 어디인가요?
- 이슈 추적 기능에서 이슈에 추가할 수 있는 정보 3가지를 말해 보세요.
- 장애 대응 흐름의 5단계를 순서대로 나열해 보세요.
정답 확인
- 시스템 대시보드의 이벤트(알람) 영역에서 확인할 수 있습니다. (
대시보드 > 모니터링 > 시스템 대시보드) - 댓글(논의 및 해결 과정 기록), 라벨(이슈 분류 및 필터링), 첨부파일(스크린샷, 로그) 등을 추가할 수 있습니다.
- 이벤트 감지 → 원인 분석 → 이슈 생성 → 해결 작업 → 이슈 종료 순서입니다.
다음 단원
4단원: 성능 분석과 병목 진단에서는 통계 기반으로 성능을 분석하고, 실제 병목을 찾아 개선하는 방법을 실습합니다.