본문으로 건너뛰기

3단원: 이벤트 알람과 이슈 추적

학습 목표

이 단원을 마치면 다음을 할 수 있습니다.

  • 이벤트 알람의 역할과 중요성을 설명할 수 있습니다
  • 시스템 대시보드에서 이벤트(알람) 목록을 확인할 수 있습니다
  • 이슈 추적 기능으로 장애를 기록하고 관리할 수 있습니다

1. 이벤트 알람이란?

1.1 왜 알람이 필요한가요?

24시간 대시보드를 지켜볼 수는 없습니다. 이벤트 알람은 시스템에 이상이 발생했을 때 자동으로 알려주는 기능입니다.

상황알람 없이알람 사용 시
서버 CPU 급등다음 날 출근 후 발견즉시 이벤트로 감지
에이전트 연결 끊김모니터링 데이터 누락 후 인지연결 끊김 이벤트 즉시 표시
응답 지연 발생사용자 불만 접수 후 확인시스템 대시보드에서 이벤트 확인

1.2 FlowKat의 이벤트 유형

FlowKat은 시스템 대시보드에서 발생한 이벤트(알람)를 실시간으로 표시합니다.

유형설명예시
에이전트 이벤트에이전트 연결/해제 관련에이전트 연결 끊김, 재연결
리소스 이벤트CPU, 메모리 등 시스템 리소스CPU 사용률 임계치 초과
서비스 이벤트트랜잭션 처리 관련응답시간 지연, 에러 발생

1.3 이벤트 확인 위치

시스템 대시보드의 이벤트(알람) 영역에서 발생한 이벤트를 확인할 수 있습니다.

접근 경로:

메뉴: 대시보드 > 모니터링 > 시스템 대시보드
URL: /workgroup/[workgroupId]/monitoring/system

시스템 대시보드 하단의 이벤트 목록에서 다음을 확인합니다.

항목설명
발생 시각이벤트가 발생한 시간
이벤트 유형알람의 종류 (에이전트, 리소스, 서비스)
대상 오브젝트이벤트가 발생한 서버/에이전트
메시지이벤트 상세 내용

2. 이슈 추적

2.1 이슈 추적이란?

이벤트로 문제를 감지했다면, 그 문제를 체계적으로 기록하고 해결 과정을 추적해야 합니다. FlowKat의 이슈 추적 기능은 GitHub Issues와 유사한 이슈 관리 시스템입니다.

기능설명
이슈 생성문제 상황을 제목, 내용, 우선순위와 함께 기록합니다
상태 관리진행중/완료 등 이슈 상태를 변경합니다
댓글이슈에 대한 논의와 해결 과정을 기록합니다
라벨이슈를 분류하고 필터링합니다
첨부파일스크린샷이나 로그 파일을 첨부합니다

접근 경로:

메뉴: 대시보드 > 이슈 추적
URL: /workgroup/[workgroupId]/tracking

2.2 이벤트에서 이슈까지의 흐름

장애가 발생하면 다음 흐름으로 대응합니다.

이벤트 감지 → 원인 분석 → 이슈 생성 → 해결 작업 → 이슈 종료
단계활동FlowKat 기능
1. 감지시스템 대시보드에서 이벤트 확인이벤트(알람) 목록
2. 분석XLOG, 프로파일로 원인 파악XLOG 검색/분석
3. 기록이슈로 등록하여 추적 시작이슈 추적 > 이슈 생성
4. 해결댓글로 진행 상황 기록이슈 상세 > 댓글
5. 종료해결 후 상태 변경이슈 상태 → 완료
이슈 작성 요령

좋은 이슈에는 다음 정보가 포함됩니다.

  • 언제: 문제 발생 시각 (이벤트 시각 참조)
  • 어디서: 어떤 서버/서비스에서 발생했는지
  • 무엇이: 어떤 증상이 나타났는지
  • 얼마나: 영향 범위 (전체 서비스 / 특정 URL)

3. 실습: 이벤트 확인과 이슈 등록

단계 1: 시스템 대시보드에서 이벤트를 확인합니다

  • 대시보드 > 모니터링 > 시스템 대시보드로 이동합니다
  • 하단의 이벤트(알람) 영역을 확인합니다
  • 최근 발생한 이벤트가 있다면 발생 시각과 내용을 확인합니다

단계 2: 이벤트 상세 내용을 파악합니다

  • 이벤트 메시지에서 어떤 오브젝트(서버)에서 발생했는지 확인합니다
  • 이벤트 유형이 에이전트, 리소스, 서비스 중 어디에 해당하는지 파악합니다
  • 필요하다면 XLOG 페이지로 이동하여 해당 시간대의 트랜잭션을 분석합니다

단계 3: 이슈 추적 페이지로 이동합니다

  • 좌측 메뉴에서 이슈 추적을 클릭합니다
  • 기존 이슈 목록이 있다면 어떤 이슈가 등록되어 있는지 살펴봅니다
  • 상태(진행중/완료)와 라벨로 이슈를 필터링해 봅니다

단계 4: 새 이슈를 생성합니다

  • 이슈 생성 버튼을 클릭합니다
  • 제목을 입력합니다 (예: "API 서버 응답 지연 -- 2024-01-15 14시")
  • 내용에 증상, 발생 시각, 영향 범위를 작성합니다
  • 라벨을 태깅합니다 (예: 성능, 긴급)
  • 스크린샷이 있다면 첨부합니다

단계 5: 이슈 상세 페이지를 확인합니다

  • 생성된 이슈를 클릭하여 상세 페이지를 엽니다
  • 댓글을 추가하여 분석 결과를 기록합니다
  • 해결이 완료되면 상태를 완료로 변경합니다
직접 편집

이슈 상세 페이지에서는 GitHub Issues처럼 필드를 직접 클릭하여 수정할 수 있습니다. 별도의 편집 페이지로 이동할 필요가 없습니다.


학습 완료 체크리스트

이 단원을 마쳤다면 아래 항목을 확인해 보세요.

  • 이벤트 알람이 왜 필요한지 설명할 수 있다
  • 시스템 대시보드에서 이벤트(알람) 목록을 찾을 수 있다
  • 이슈 추적 페이지에 접속하여 이슈 목록을 확인했다
  • 새 이슈를 생성하고 댓글을 추가할 수 있다
  • 이벤트 감지 → 원인 분석 → 이슈 등록 → 해결의 흐름을 이해했다
확인 문제

다음 단원으로 넘어가기 전에 확인해 보세요.

  1. FlowKat에서 이벤트(알람)를 확인할 수 있는 위치는 어디인가요?
  2. 이슈 추적 기능에서 이슈에 추가할 수 있는 정보 3가지를 말해 보세요.
  3. 장애 대응 흐름의 5단계를 순서대로 나열해 보세요.
정답 확인
  1. 시스템 대시보드의 이벤트(알람) 영역에서 확인할 수 있습니다. (대시보드 > 모니터링 > 시스템 대시보드)
  2. 댓글(논의 및 해결 과정 기록), 라벨(이슈 분류 및 필터링), 첨부파일(스크린샷, 로그) 등을 추가할 수 있습니다.
  3. 이벤트 감지원인 분석이슈 생성해결 작업이슈 종료 순서입니다.

다음 단원

4단원: 성능 분석과 병목 진단에서는 통계 기반으로 성능을 분석하고, 실제 병목을 찾아 개선하는 방법을 실습합니다.