QUICK REVIEW

[論文レビュー] Learning to Incentivize: Eliciting Effort via Output Agreement

Yang Liu, Yiling Chen|arXiv (Cornell University)|Apr 17, 2016

Mobile Crowdsensing and Crowdsourcing参考文献 19被引用数 31

ひとこと要約

本稿では、出力一致メカニズムを用いて、クラウドソーシングにおいて真実の報告と作業の努力をインcentivizeするメカニズムを提案する。作業者は、同僚の回答と一致する場合に報酬を得る。ベイジアンナッシュ均衡を同定し、凸最適化を用いてコスト分布が既知の場合の最適報酬水準を導出する。コスト分布が未知の場合には、逐次学習メカニズムを設計し、誤差を最小化することで、O(T^{2/3} log T) の誤差境界を達成する。

ABSTRACT

In crowdsourcing when there is a lack of verification for contributed answers, output agreement mechanisms are often used to incentivize participants to provide truthful answers when the correct answer is hold by the majority. In this paper, we focus on using output agreement mechanisms to elicit effort, in addition to eliciting truthful answers, from a population of workers. We consider a setting where workers have heterogeneous cost of effort exertion and examine the data requester's problem of deciding the reward level in output agreement for optimal elicitation. In particular, when the requester knows the cost distribution, we derive the optimal reward level for output agreement mechanisms. This is achieved by first characterizing Bayesian Nash equilibria of output agreement mechanisms for a given reward level. When the requester does not know the cost distribution, we develop sequential mechanisms that combine learning the cost distribution with incentivizing effort exertion to approximately determine the optimal reward level.

研究の動機と目的

真のラベルが入手不能または検証に高コストである状況において、真実の回答と作業の努力を引き出す課題に対処すること。
作業者を、共通の分布から抽出された非公開の異質な努力コストを持つものとしてモデル化し、努力を内生的選択とする。
正確性と支払いコストのバランスを取ることで、リクエスターの期待効用を最大化する報酬メカニズムを設計すること。
繰り返しの相互作用において、努力と真実の報告を促進しながらコスト分布を学習する逐次メカニズムを開発すること。
コスト分布が初期に未知である動的設定において、リクエスターの誤差に関する理論的保証を提供すること。

提案手法

任意の報酬水準に対して、出力一致メカニズムのベイジアンナッシュ均衡（BNE）を同定し、作業者の期待効用を最大化する一意のしきい値戦略（努力の有無）を示す。
静的設定では、コスト分布が既知の場合に最適報酬水準を凸最適化問題として定式化し、効率的な計算を可能にする。
探索（コスト分布の学習）と活用（報酬の設定）を交互に繰り返す逐次メカニズムを設計し、真実のコスト報告を保証する。
高確率集中不等式とチェルノフ型不等式を用いて、学習段階におけるコストと一致確率の推定バイアスを制御する。
リクエスターの効用関数の凹性と有界導関数の仮定を適用し、標本誤差と効用損失の関係を導出する。
動的メカニズムの誤差境界を O(T^{2/3} log T) として導出。T タスクにわたる探索と活用のバランスを取る。

実験結果

リサーチクエスチョン

RQ1コスト分布が既知であるとき、リクエスターの期待効用を最大化する出力一致メカニズムにおける最適報酬水準は何か？
RQ2コスト分布が未知である状況で、リクエスターはどのようにして真実の報告と努力の両方を同時に引き出すメカニズムを設計できるか？
RQ3コスト分布が時間とともに学習される逐次設定において、リクエスターの誤差に関する性能保証は何か？
RQ4作業者の均衡行動（特に、努力と報告戦略）は、報酬水準とコスト分布にどのように依存するか？
RQ5長期的誤差を最小化するために、学習（探索）と最適報酬設定（活用）の間のトレードオフはどのように調整されるか？

主な発見

出力一致メカニズムのベイジアンナッシュ均衡は、一意のしきい値戦略を特徴づける：作業者はコストが特定のしきい値未満である場合にのみ努力を払う。この戦略が期待効用を最大化する。
コスト分布が既知の場合、最適報酬水準は凸計画問題の解として得られ、効率的に計算可能である。
動的設定では、提案された逐次メカニズムは真実のコスト報告を保証し、T タスクにわたるリクエスターの期待効用に対して O(T^{2/3} log T) の誤差境界を達成する。
誤差境界は、探索（O(T^{2/3} log T) ステップ）と活用のバランスから生じる。最適な探索レートは z = 2/3 で達成される。
高確率集中不等式を用いて、コスト推定と一致確率のバイアスを制御し、効用損失を標本誤差に比例させる。
分析により、コスト推定が不完全であっても、誤報や標本誤差による効用損失は有界であり、時間とともに減少することが示され、長期的な性能保証が可能になる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。