Skip to main content
QUICK REVIEW

[論文レビュー] Querying with Conflicts of Interest

Nischal Aryal, Arash Termehchy|arXiv (Cornell University)|Mar 5, 2026
Data Quality and Management被引用数 0
ひとこと要約

この論文は、データソースが結果を歪めるインセンティブを持つ場合のクエリ階層を扱う正式な枠組みを提案し、影響力のある相互作用と信頼できない結果を検出する効率的なアルゴリズム、情報有用性を高めるクエリの再定式化を開発し、実データセットで実証する。

ABSTRACT

Conflicts of interest often arise between data sources and their users regarding how the users' information needs should be interpreted by the data source. For example, an online product search might be biased towards presenting certain products higher than in its list of results to improve its revenue, which may not follow the user's desired ranking expressed in their query. The research community has proposed schemes for data systems to implement to ensure unbiased results. However, data systems and services usually have little or no incentive to implement these measures, e.g., these biases often increase their profits. In this paper, we propose a novel formal framework for querying in settings where the data source has incentives to return biased answers intentionally due to the conflict of interest between the user and the data source. We propose efficient algorithms to detect whether it is possible for users to extract relevant information from biased data sources. We propose methods to detect biased information in the results of a query efficiently. We also propose algorithms to reformulate input queries to increase the amount of relevant information in the returned results over biased data sources. Using experiments on real-world datasets, we show that our algorithms are efficient and return relevant information over large data.

研究の動機と目的

  • ユーザーの意図とデータソースのバイアスが利益相反を伴うランキングクエリ結果を返す際にどのように相互作用するかをモデル化する。
  • この設定におけるユーザーとデータソースの推論の安定な(ベイズ均衡)状態を定義する。
  • 影響力のある相互作用と信頼できない結果を検出するアルゴリズムを開発する。
  • ユーザー情報獲得を最大化するクエリを見つける計算複雑性を示す。
  • 実世界データセット上でスケーラビリティと有効性を実証的に検証する。

提案手法

  • クエリ q の解釈 β に対する意味解釈を巡る U^r および U^s の有用度を持つエージェントとしてユーザーとデータソースをモデル化する。
  • ベイズ均衡の概念を用いて安定な相互作用状態(τ, β)を特徴づける。
  • 影響力のある相互作用の必要十分条件(定理3.1)を提示する。
  • 歪み関数 b(e) と加法的有用度形 U^s, U^r を導入して歪みの影響を分析する(定義3.3, 命題3.5)。
  • 凸/二次様の損失 L の下で非影響的相互作用を検出する効率的な検定(定理3.6および系3.7)を開発する。
  • 結果の信頼性を定義(定義4.1)し、信頼できない組 (tuples) の検出手法を提案する。
(a) Amazon
(a) Amazon

実験結果

リサーチクエスチョン

  • RQ1ユーザーとデータソースの相互作用が安定した影響力のある均衡へ収束する条件は何か。
  • RQ2データソースのバイアスが極端な場合、ユーザーが出力を変更させられない非影響的均衡が生じ得るか。
  • RQ3歪んだ解釈の中で信頼できない結果を検出し、信頼できる情報を定量化するにはどうするか。
  • RQ4ユーザーの意図について最大の情報を与えるクエリを見つける計算的複雑性はどれくらいで、広い有用性クラスに対して効率的な解は見つかるか。
  • RQ5提案されたアルゴリズムは大規模な実データセットでどの程度スケーラブルか。

主な発見

  • 均衡が影響力を持つのは、集合同値の意図 τ と異なる解釈 β, β′ が存在し、ユーザーとデータソースの利得条件を満たす場合である(定理3.1)。
  • データソースのバイアスが極端に強い場合、影響力のある均衡は存在せず、ユーザーは出力を変えてもらえない可能性がある(定理3.6)。
  • 系3.7の系を満たすと、ある凸性で単調である損失函数に対して非影響的相互作用を定数時間で検出できる(系3.7の系3.7の系?翻訳上の混同を避けるため「コルリーディ3.7」再表記)。
  • バイアス関数と超加法的有用性は部分的な共通関心をモデル化し、影響と信頼できる結果の効率的な分析を可能にする(命題3.5、3.6)。
  • 定義4.1 は信頼できない結果を形式化し、β(I) における誤ランク付けまたは省略された組を検出可能にする。
  • 実証研究は、フレームワークとアルゴリズムが大規模データへスケールし、実世界データセット上で関連情報を提供することを示す(セクション6)。”] ,
  • table_headers: []
  • table_rows: []}} } } } {
  • table_headers_placeholder_removed
  • table_rows_placeholder_removed} } } } } } }
  • table_headers: []
  • table_rows: []
(b) Pricerunner
(b) Pricerunner

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。