QUICK REVIEW

[論文レビュー] APISENSOR: Robust Discovery of Web API from Runtime Traffic Logs

Yaru Yang, Chenxing Zhong|arXiv (Cornell University)|Mar 25, 2026

Software System Performance and Reliability被引用数 0

ひとこと要約

APISensor は混在実行時トラフィックからノイズ除去、パス正規化、構造テンプレートと意味的挙動の二段階グラフベースクラスタリングによってウェブ API を堅牢に再構成するブラックボックス API 発見フレームワーク。

ABSTRACT

Large Language Model (LLM)-based agents increasingly rely on APIs to operate complex web applications, but rapid evolution often leads to incomplete or inconsistent API documentation. Existing work falls into two categories: (1) static, white-box approaches based on source code or formal specifications, and (2) dynamic, black-box approaches that infer APIs from runtime traffic. Static approaches rely on internal artifacts, which are typically unavailable for closed-source systems, and often over-approximate API usage, resulting in high false-positive rates. Although dynamic black-box API discovery applies broadly, its robustness degrades in complex environments where shared collection points aggregate traffic from multiple applications. To improve robustness under mixed runtime traffic, we propose APISENSOR, a black-box API discovery framework that reconstructs application APIs unsupervised. APISENSOR performs structured analysis over complex traffic, combining traffic denoising and normalization with a graph-based two-stage clustering process to recover accurate APIs. We evaluated APISENSOR across six web applications using over 10,000 runtime requests with simulated mixed-traffic noise. Results demonstrate that APISENSOR significantly improves discovery accuracy, achieving an average Group Accuracy Precision of 95.92% and an F1-score of 94.91%, outperforming state-of-the-art methods. Across different applications and noise settings, APISENSOR achieves the lowest performance variance and at most an 8.11-point FGA drop, demonstrating the best robustness among 10 baselines. Ablation studies confirm that each component is essential. Furthermore, APISENSOR revealed API documentation inconsistencies in a real application, later confirmed by community developers.

研究の動機と目的

evolvving web services with incomplete documentation の下で LLM 有効化エージェントの API 発見を堅牢にする動機付け。
現実世界の混在トラフィック環境における静的ホワイトボックスおよび単純ブラックボックスアプローチの制約への対処。
意味論的クラスタリングを介して API テンプレートを抽出・洗練することで精度と堅牢性を向上させる教師なしパイプラインの開発。

提案手法

ランタイムトラフィックから API 以外のリクエストを除去するためのマルチシグナルノイズフィルタリングを適用。
余分な成分を除去しフォーマットを標準化することにより API パスを正規化。
二段階クラスタリングを使用： Stage 1 では Drain3 プレフィックスツリーを用いてパスをインターフェースレベルのテンプレート（例：/api/v1/items/*）にグループ化。
Stage 2 では各テンプレートグループ内で軽量な特徴（パス構造、クエリパラメータ、ペイロードの複雑さ）とグラフベースクラスタリング（または K-means のフォールバック）を用いて挙動を分離する意味論的精練を実施。
最終目的関数 L = L_cons + λ L_clus において一貫性損失 L_cons = ||A − σ(ZZ^T)||_F^2 とクラスタリング正則化項を活用して埋め込みを学習し、一貫した意味クラスタを形成する。

実験結果

リサーチクエスチョン

RQ1RQ1: APISensor はベースラインと比べて多様なアプリケーションにおける API 発見の有効性をどの程度示すか。
RQ2RQ2: 混在するマルチテナントゲートウェイを含む多様な API トラフィックに対するノイズ耐性はどの程度か。
RQ3RQ3: 各コンポーネント（ノイズ除去、テンプレート採掘、意味論的グラフクラスタリング）が全体性能に与える寄与はどれくらいか。

主な発見

APISensor は6つのオープンソースアプリケーションで高い発見精度を達成し、平均 PGA 95.92%、RGA 94.36%、FGA 94.91%。
APISensor はノイズの種類とレベルを通じて強力なロバスト性を示し、FGA および純粋度の変動が最大で 8.11 ポイントの低下、1% 内の純粋度の変動。
アプリケーションとノイズ設定を跨いで、APISensor は10個のベースラインの中で最も低い性能分散を示す。
アブレーション研究により各コンポーネント（ノイズフィルタリング、テンプレート採掘、意味論的洗練、グラフクラスタリング）が性能に不可欠であることを確認。
本研究は 10K 件超のトラフィックベンチマークを提供し、199件のグラウンドトゥルースエンドポイントを含み、コミュニティによって検証された Shadow API の発見を Dify で確認。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。