QUICK REVIEW

[論文レビュー] GenLie: A Global-Enhanced Lie Detection Network under Sparsity and Semantic Interference

Z. H. Zhang, Yao Liu|arXiv (Cornell University)|Mar 14, 2026

Deception detection and forensic psychology被引用数 0

ひとこと要約

GenLie は、対向的デコレーションとトリプレット損失を用いて、アイデンティティ関連ノイズを抑制しつつ、疎で識別的な手がかりを学習する動画ベースの lie 検出の局所–グローバルフレームワークを導入し、3つのベンチマーク全体で最先端の結果を達成します。

ABSTRACT

Video-based lie detection aims to identify deceptive behaviors from visual cues. Despite recent progress, its core challenge lies in learning sparse yet discriminative representations. Deceptive signals are typically subtle and short-lived, easily overwhelmed by redundant information, while individual and contextual variations introduce strong identity-related noise. To address this issue, we propose GenLie, a Global-Enhanced Lie Detection Network that performs local feature modeling under global supervision. Specifically, sparse and subtle deceptive cues are captured at the local level, while global supervision and optimization ensure robust and discriminative representations by suppressing identity-related noise. Experiments on three public datasets, covering both high- and low-stakes scenarios, show that GenLie consistently outperforms state-of-the-art methods. Source code is available at https://github.com/AliasDictusZ1/GenLie.

研究の動機と目的

動画内の微妙で疎なビジュアル手掛かりから頑健な lie 検出が必要であることを動機づける。
局所–グローバルなモデリング戦略を提案し、アイデンティティおよび文脈ノイズを低減しつつ疎な手掛かりを抽出する。
冗長性を考慮したサンプリング、タスク駆動の再埋め込み、対向的デコレーション、識別的損失を備えたエンドツーエンドのフレームワークを開発する。
低リスクおよび高リスクの deception データセットの両方で最先端の性能を実証する。

提案手法

動画を等長クリップに分割し、各セグメントから上位Kフレームを選択して冗長性を抑制する。
凍結済みの VideoMAEv2 エンコーダを用いてセグメントレベルの特徴を抽出し、軽量な MLP でグローバルな動画埋め込みを取得する。
GRL ベースの補助分類器を介してアイデンティティに不変な表現を生み出す対向的な話者デコレーションを適用する。
動画レベルのトリプレット損失を組み込み、同一クラス内の凝縮性と異なるクラス間の分離を強制する。
総損失 L_total = L_cls + alpha L_id + beta L_tri による共同目的で、識別性とデ-biasing のバランスを取って学習する。

Fig. 1 : Core challenge in video-based lie detection: subtle and transient cues are often overwhelmed by noise and contextual bias.

実験結果

リサーチクエスチョン

RQ1局所–グローバルモデリングは、動画 deception 検出において sparse な deceptive 手掛かりを効果的に捉えつつ、 identity 関連ノイズを低減できるか。
RQ2対向的な話者デコレーションは、 deception 識別性を損なうことなく話者間の一般化を改善するか。
RQ3動画レベルのトリプレット損失は、 deception ラベルと話者間でより識別的な埋め込み空間を形成するのに有益か。
RQ4 cue の顕著性が異なるデータセット間で、どのフレーム選択戦略が最も頑健な性能を発揮するか。

主な発見

Method	MDPE_F1	MDPE_ACC	MDPE_AUC	Real-Life Trial_F1	Real-Life Trial_ACC	Real-Life Trial_AUC	SEUMLD_F1	SEUMLD_ACC	SEUMLD_AUC
GenLie	38.97	63.01	59.91	93.44	93.39	98.96	42.39	64.17	59.15
w/o TS	24.95	60.10	53.49	38.59	57.95	51.92	40.85	61.29	56.83
w/o F_SR	18.10	60.62	58.10	35.84	60.36	55.03	n/a	n/a	n/a
w/o L_id	34.06	62.28	59.78	36.79	57.06	53.55	n/a	n/a	n/a
w/o L_tri	25.73	62.90	58.07	40.85	61.29	56.83	n/a	n/a	n/a

GenLie は3つの deception ベンチマーク（MDPE、Real-Life Trial、SEUMLD）で最先端の性能を達成。
アブレーションにより、意味的再埋め込みが性能にとって決定的であることが示され、Real-Life Trial では話者デコレーションが特に寄与。
均一なフレームサンプリングは、経験的サンプリング戦略と比較して頑健な性能を提供。
時間的セグメンテーションは疎な手掛かりを保持するのに寄与し、トリプレット損失は識別性を強化。
GenLie は低リスク設定と高リスク設定の両方で優れた一般化を示し、アイデンティティ間の一般化能力が高い。

Fig. 2 : Architecture of the proposed GenLie framework.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。