[논문 리뷰] JXES : JSON Support for the XES Event Log Standard
이 논문은 IEEE XES 사양을 준수하는 이벤트 로그를 위한 JSON 기반 표준인 JXES를 소개한다. JXES는 효율적이고 인간이 읽기 쉬우며 상호 운용성이 뛰어난 프로세스 마이닝 데이터 교환을 가능하게 한다. ProM에 Jackson, GSON, Simple JSON, Jsoninter의 네 가지 JSON 파서 구현체를 제안하며, Jackson은 메모리 효율성이 가장 뛰어나고 Jsoninter는 내보내기 성능이 가장 빠르며, JXES는 XES 대비 최대 45%까지 파일 크기를 줄였다.
Process mining assumes the existence of an event log where each event refers to a case, an activity, and a point in time. XES is an XML based IEEE approved standard format for event logs supported by most of the process mining tools. JSON (JavaScript Object Notation) is a lightweight data interchange format. In this paper, we present JXES, the JSON standard for the event logs and also provide implementation in ProM for importing and exporting event logs in JSON format using 4 different parsers. The evaluation results show notable performance differences between the different parsers (Simple JSON, Jackson, GSON, Jsoninter).
연구 동기 및 목표
- XML 기반 XES를 초월하여 표준화되고 경량이며 상호 운용 가능한 이벤트 로그 형식의 부족을 해결하기 위해.
- XES 의미 체계를 유지하면서도 JSON 기반 이벤트 로그 표준을 정의하여 프로세스 마이닝 도구 간의 효율적 데이터 교환을 가능하게 하기 위해.
- JXES 형식에서 이벤트 로그의 임포트 및 익스포트를 위한 ProM 내 여러 JSON 파서 플러그인을 구현하고 평가하기 위해.
- 실제 및 합성 이벤트 로그를 대상으로 속도, 메모리 사용량, 파일 크기 측면에서 다양한 JSON 파서의 성능을 비교하기 위해.
제안 방법
- 간결함, 유연성, 확장성, 표현력을 갖춘 XES 원칙을 기반으로 JXES 형식을 설계하여, 로그, 트레이스, 이벤트, 속성, 확장 기능을 JSON 객체로 표현하기 위해.
- 로그가 트레이스를 포함하고, 트레이스가 이벤트를 포함하는 계층적 구조를 정의하며, 표준화된 JSON 키를 통해 글로벌 속성, 중첩된 속성, 분류기, 확장 기능을 지원하기 위해.
- Jackson, GSON, Simple JSON, Jsoninter 파서를 사용하여 ProM 내에서 JXES 임포트 및 익스포트를 위한 네 가지 별도의 파서 기반 플러그인을 구현하기 위해.
- 실생활(BPIC15, BPIC17, Level D2, Flag X2) 및 인위적 이벤트 로그를 대상으로 세 가지 기준(임포트/익스포트 속도, 메모리 소비, 파일 크기)에서 파서 성능을 벤치마킹하기 위해.
- 메모리 사용량 측정을 위해 Java의 Runtime.totalMemory() 및 freeMemory()를 사용하고, 속도 평가를 위해 세 번의 실행 평균 실행 시간을 기록하기 위해.
- 압축되지 않은 XES, JXES, 압축된 XES 형식을 비교하여 파일 크기 감소 효과를 평가하며, JXES는 중복 태그와 타입 선언을 제거하여 파일 크기를 줄였다.
실험 결과
연구 질문
- RQ1XES 표준의 의미 체계와 확장성을 유지하면서도 가독성과 효율성을 향상시킬 수 있는 JSON 기반 이벤트 로그 형식은 어떻게 설계할 수 있는가?
- RQ2대규모 이벤트 로그를 JXES 형식으로 임포트 및 익스포트할 때, 다양한 JSON 파서(Jackson, GSON, Simple JSON, Jsoninter) 간의 성능 상충 관계는 어떠한가?
- RQ3JXES는 XES 및 압축된 XES 대비 파일 크기를 얼마나 줄이며, 이는 입출력 및 전송 효율성에 어떤 영향을 미치는가?
- RQ4프로세스 마이닝 워크플로우에서 JXES 임포트 및 익스포트 시 속도와 메모리 효율성의 최적 균형을 이룬 파서는 무엇인가?
- RQ5XES와 JXES 간의 손실 없는 변환 과정에서 글로벌 속성, 확장 기능, 중첩 구조를 포함한 모든 메타데이터가 유지되는가?
주요 결과
- Jackson JSON 파서는 모든 임포트 및 익스포트 작업에서 가장 낮은 메모리 소비를 보였으며, 가장 큰 로그(BPIC17)에서 Simple JSON 대비 최대 70% 적은 메모리를 사용했다.
- Jsoninter는 가장 빠른 익스포트 속도를 기록했으며, 다른 모든 파서를 압도했고, XES Naive 익스포트 대비 최대 4배 빠르게 작동했다. 이는 동적 클래스 샤피어링 트리 구조 파싱 메커니즘이 기여한 바 있다.
- JXES는 XES 대비 최대 33%, 압축된 XES 대비 최대 45%까지 파일 크기를 줄였으며, BPIC15 5 로그는 XES의 43.9 MB에서 JXES로 29.6 MB로 감소했다.
- XES Naive 임포터는 속도 측면에서 놀라울 정도로 잘 작동했으며, XML에 명시된 타입 선언 덕분일 가능성이 높다. 반면 JSON은 타입을 추론하기 위해 전체를 파싱해야 하여 오버헤드가 증가했다.
- XES에서 JXES로, 그리고 JXES에서 XES로의 변환 과정에서 정보 손실가 발생하지 않았으며, 오직 로그 버전 헤더만 다를 뿐이었으며, 이는 의미 체계의 정합성을 확인했다.
- 모든 테스트 로그에서 성능 평가를 바탕으로 임포트에는 Jackson(가장 뛰어난 메모리 효율성)을, 익스포트에는 Jsoninter(가장 빠른 속도)를 권장한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.