Process Mining/Concept

이벤트 로그 데이터 이해하기: 필수 속성과 타임스탬프 구조의 차이

Data Jun 2025. 4. 11. 09:51

프로세스 마이닝의 핵심은 바로 **이벤트 로그(Event Log)**입니다. 이 로그는 시스템 내에서 발생하는 각 활동을 기록한 데이터로, 프로세스를 시각화하고 분석하기 위한 기본 자료입니다. 오늘은 이벤트 로그에서 반드시 포함되어야 할 필수 속성, 그리고 분석의 정밀도를 좌우하는 타임스탬프 체계에 대해 알아보겠습니다.

 

 

Event Log Data의 필수 속성

  1. Case ID
    • 하나의 프로세스를 구분하는 단위입니다.
    • 예: 주문번호, 환자번호, 로그인 세션 ID 등
  2. Activity
    • 프로세스의 각 단계를 의미합니다.
    • 예: ‘주문 확인’, ‘상품 출고’, ‘배송 완료’ 등
  3. Timestamp
    • 각 활동(Activity)이 발생한 시간입니다.
    • 이 정보는 분석의 핵심! 활동 간의 순서와 시간 간격을 알 수 있게 해줍니다.

이 3가지 속성이 포함되지 않으면 프로세스 마이닝을 수행할 수 없습니다.

 

Event Log Data의 추가 속성: Resource

  • 활동을 수행한 사람, 부서, 시스템 등 부가적인 정보를 담고 있습니다.
  • 분석 시, 업무 담당자나 채널에 따라 발생하는 차이를 식별하는 데 유용합니다.

 

 

Timestamp 구조: One Timestamp vs. Two Timestamp

 

Two Timestamp

 

  • 활동의 시작(Start Timestamp)과 종료(End Timestamp) 시간이 모두 기록됨
  • 덕분에 다음과 같은 다양한 시간 지표를 정밀하게 계산할 수 있음:
    • 작업 시간 (Work Time)
    • 대기 시간 (Wait Time)
    • 이벤트 간 시간 (Event Duration)
    • 전체 프로세스 시간 (Case Duration)

Two Timestamp 구조는 보다 정밀한 분석을 위한 필수 조건입니다.

 

One Timestamp

  • 활동에 대해 하나의 시간 정보만 기록 (시작 시간 또는 종료 시간 중 하나)
  • 이벤트 시간만 계산 가능. 정확한 작업시간/대기시간 구분이 불가능하다는 단점이 있음.

 

예시로 보는 구조 차이

 

마무리

이벤트 로그는 단순히 시간과 활동을 나열하는 데이터가 아닙니다. 어떻게 구성되었는지에 따라 분석의 정확도와 통찰력이 완전히 달라질 수 있습니다. 특히 Two Timestamp 구조를 활용하면, 단순 흐름 분석을 넘어서 병목 지점, 비효율 구간, 작업 시간 비교까지 가능한 정밀한 분석이 가능합니다.