[論文レビュー] JXES : JSON Support for the XES Event Log Standard
本稿では、IEEE XES規格に準拠したイベントログ用のJSONベースの標準仕様であるJXESを紹介する。JXESは、効率的で人間が読みやすく、相互運用可能なプロセスマイニングデータ交換を可能にする。ProMにおけるJackson、GSON、Simple JSON、Jsoninterの4つのJSONパーサー実装を提案し、Jacksonが最も優れたメモリ効率を示し、Jsoninterが最も速いエクスポート性能を示した。JXESはXESに比べて最大45%のファイルサイズ削減を実現した。
Process mining assumes the existence of an event log where each event refers to a case, an activity, and a point in time. XES is an XML based IEEE approved standard format for event logs supported by most of the process mining tools. JSON (JavaScript Object Notation) is a lightweight data interchange format. In this paper, we present JXES, the JSON standard for the event logs and also provide implementation in ProM for importing and exporting event logs in JSON format using 4 different parsers. The evaluation results show notable performance differences between the different parsers (Simple JSON, Jackson, GSON, Jsoninter).
研究の動機と目的
- XMLベースのXESを超えて、標準的で軽量かつ相互運用可能なプロセスマイニング用イベントログフォーマットの欠如に対処すること。
- XESの意味論を保持しつつ、JSONベースのイベントログ標準を定義することで、プロセスマイニングツール間での効率的なデータ交換を可能にすること。
- ProMにおけるJXESフォーマットでのイベントログインポートおよびエクスポートのための複数のJSONパーサープラグインの実装と評価を行うこと。
- 実世界および合成されたイベントログを対象に、速度、メモリ使用量、ファイルサイズの観点から、異なるJSONパーサーのパフォーマンスを比較すること。
提案手法
- XESの原則(単純性、柔軟性、拡張性、表現力)に基づき、JSONオブジェクトを用いてログ、トレース、イベント、属性、拡張子を表現することで、JXESフォーマットを設計する。
- ログがトレースを含み、トレースがイベントを含む階層的構造を定義し、標準化されたJSONキーを介してグローバル属性、ネストされた属性、分類子、拡張子をサポートする。
- Jackson、GSON、Simple JSON、Jsoninterパーサーを用いて、ProMにおけるJXESインポートおよびエクスポートのための4つの異なるパーサー基盤のプラグインを実装する。
- 実生活(BPIC15、BPIC17、Level D2、Flag X2)および人工的なイベントログを用いて、インポート/エクスポート速度、メモリ消費量、ファイルサイズの3つの基準でパーサーのパフォーマンスをベンチマークする。
- メモリ使用量の測定にJavaのRuntime.totalMemory()およびfreeMemory()を用い、速度評価には3回の実行の平均実行時間を記録する。
- XES、JXES、圧縮済みXESフォーマットを比較してファイルサイズの削減を評価し、JXESが余分なタグや型宣言を排除することで効果を発揮していることを確認する。
実験結果
リサーチクエスチョン
- RQ1XES標準の意味論と拡張性を保持しつつ、可読性と効率性を向上させるために、JSONベースのイベントログフォーマットをどのように設計できるか?
- RQ2JXESフォーマットで大規模なイベントログをインポートおよびエクスポートする際、異なるJSONパーサー(Jackson、GSON、Simple JSON、Jsoninter)の間で生じるパフォーマンスのトレードオフは何か?
- RQ3JXESはXESおよび圧縮済みXESに比べてどの程度ファイルサイズを削減できるか?また、I/Oおよび転送効率にどのような影響を与えるか?
- RQ4プロセスマイニングワークフローにおけるJXESインポートおよびエクスポートにおいて、速度とメモリ効率の両立を最もよく満たすパーサーはどれか?
- RQ5XESとJXES間の損失なし変換は、グローバル属性、拡張子、ネスト構造を含むすべてのメタデータを保持するか?
主な発見
- Jackson JSONパーサーは、すべてのインポートおよびエクスポート操作において最も低いメモリ消費量を示し、最大ログ(BPIC17)ではSimple JSONに比べて最大70%も少ないメモリを使用した。
- Jsoninterは最も速いエクスポート速度を達成し、他のすべてのパーサーを上回り、XES Naiveエクスポートに比べて最大4倍速かった。これは、動的クラスシャロウイング三重木パーサメカニズムに起因する。
- JXESはXESに比べて最大33%、圧縮済みXESに比べて最大45%のファイルサイズ削減を実現した。BPIC15 5ログはXESの43.9 MBからJXESの29.6 MBにまで縮小された。
- XES Naiveインポーターは、XMLに明示的な型宣言があるため、速度面で予想外に優れていた。一方、JSONは型を推論するために完全なパースが必要で、オーバーヘッドが増加した。
- XESからJXES、およびJXESからXESへの変換において、情報損失は発生しなかった。唯一異なるのはログバージョンヘッダーのみであり、意味論の整合性が確認された。
- パフォーマンス評価の結果、インポートにはJackson(最良のメモリ効率)が推奨され、エクスポートにはJsoninter(最良の速度)が最適であると結論づけられた。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。