Process Mining/ProDiscovery

[데이터 로드] ProDiscovery를 활용한 제조 공정 프로세스 마이닝 예시

Data Jun 2025. 4. 10. 08:36

제조 공정 데이터를 기반으로 프로세스 마이닝을 진행해보았습니다. 이 포스팅에서는 ProDiscovery라는 툴을 활용해 데이터를 업로드하고, 컬럼을 매핑하고, 전처리 규칙을 설정하는 과정을 이미지 중심으로 설명합니다.

 

데이터 업로드 – 랜딩 페이지

ProDiscovery의 첫 화면입니다. "새 프로세스 생성"을 통해 CSV, XES, TXT 등 다양한 형식의 데이터를 업로드할 수 있습니다. 이번 예시는 Sample_Manufacture_eng_1Timestamp.csv 파일을 업로드하여 분석을 시작했습니다.
-> 여기서는 파일 업로드 외에도 DB 연결 기능(MariaDB, MySQL, PostgreSQL 등)을 통해 실시간 데이터를 연동할 수도 있습니다.

 

 

컬럼 매핑 – 프로세스 기본 구조 설정

업로드된 데이터에서 프로세스 마이닝에 필수적인 컬럼들을 지정합니다.

  • Case ID: 각 케이스를 구분하는 고유 식별자 (caseid)
  • Activity: 수행된 업무 또는 작업명 (activity)
  • Timestamp: 활동이 수행된 시간 (timestamp)

이 과정을 통해 프로세스 플로우를 구성할 준비가 완료됩니다.

 

 

데이터 필터링 – 데이터 전처리 기능

업로드된 데이터는 바로 분석에 사용되기보다는 사전 정제가 필요합니다. ProDiscovery는 다양한 규칙 기반의 전처리 기능을 제공합니다.
예를 들어, 문자열 필터링, 타임스탬프 필터, 결합(Combine), 분할(Split) 등 복잡한 데이터 가공도 GUI로 간단히 처리할 수 있습니다.

 

 

데이터 처리 규칙 설정 – Split 규칙 예시

이번 예시에서는 생산라인 컬럼이 Line_A 형식으로 되어 있어 '_'(언더스코어) 기준으로 분할하여 "Line"과 "A"로 나누는 작업을 진행했습니다.

  • 규칙명: Split
  • 적용 컬럼: 생산라인
  • 분할 기준: _
    이렇게 하면 추후 라인명(Line)과 번호(A)를 따로 분석할 수 있게 됩니다.

 

처리 결과 확인 – 컬럼 분리 적용 확인

규칙이 성공적으로 적용된 결과 화면입니다. split_생산라인_1, split_생산라인_2라는 새로운 컬럼이 추가되어 Line_A → Line, A로 나누어진 것을 확인할 수 있습니다.

이와 같은 전처리 단계를 거치면 더욱 정교하고 유의미한 프로세스 마이닝 결과를 도출할 수 있습니다.

 

마무리하며

ProDiscovery는 비즈니스 프로세스를 시각화하고 병목지점을 파악하는 데 매우 유용한 도구입니다. 특히 제조, 물류, 금융과 같이 표준화된 흐름이 중요한 산업에서는 더 큰 효과를 발휘합니다.