Skip to main content
QUICK REVIEW

[論文レビュー] What are you optimizing for? Aligning Recommender Systems with Human Values

Jonathan Stray, Ivan Vendrov|arXiv (Cornell University)|Jul 22, 2021
Recommender Systems and Techniques参考文献 34被引用数 24
ひとこと要約

本論文は、レコメンドシステムがケーススタディを通じて人間の価値とどのように整合させられてきたかを検討し、現在の価値工学の実践を特定し、より参加型で頑健な価値整合を実現するための4つの高レベルアプローチを提案する。

ABSTRACT

We describe cases where real recommender systems were modified in the service of various human values such as diversity, fairness, well-being, time well spent, and factual accuracy. From this we identify the current practice of values engineering: the creation of classifiers from human-created data with value-based labels. This has worked in practice for a variety of issues, but problems are addressed one at a time, and users and other stakeholders have seldom been involved. Instead, we look to AI alignment work for approaches that could learn complex values directly from stakeholders, and identify four major directions: useful measures of alignment, participatory design and operation, interactive value learning, and informed deliberative judgments.

研究の動機と目的

  • レコメンドの目標が文脈依存かつ価値含意を持つことを示すことで、研究の動機づけを行う。
  • 多様性、公正、幸福、事実的正確さなどの価値を反映するよう実システムが改変されたケーススタディを文書化する。
  • 現在の価値整合実践の限界を特定し、より参加型でスケーラブルなアプローチを提案する。
  • AI整合に触発された高レベルの戦略を提案し、レコメンドシステムに複雑な人間の価値を学習・符号化する。

提案手法

  • 大規模レコメンドシステムのケーススタディの分析を通じて、三段階のパターンを特定する:コンテンツカテゴリの同定、ラベル付きデータによる運用化、推奨の調整。
  • AI整合関連文献からの知見を統合して、上位層のアプローチを提案する:有用な整合指標、参加型設計、対話的価値学習、情報を得た熟慮的判断。
  • 整合の指標を定義・検討し、反応的な一度きりの修正よりも参加型・対話型手法の重要性を論じる。

実験結果

リサーチクエスチョン

  • RQ1人間の価値は現在どのように特定され、運用化され、レコメンドシステムに実装されているのか。
  • RQ2AI整合からのどの高レベルのアプローチが、推奨の人間の価値への整合を改善できるか。
  • RQ3参加型設計と対話的価値学習は、レコメンドの整合性におけるスケーラビリティと利害関係者の包摂をどう解決できるか。

主な発見

  • ケーススタディは共通のパイプラインを示す:関連するコンテンツ概念を特定し、分類器や指標を用いて運用化し、それに応じて推奨を調整する。
  • クリックベイト、毒性、誤情報などの複雑な概念を扱う際には、手動設計の指標よりも、人間のラベルで学習した分類器の方がしばしば優れている。
  • 現在の実践は受動的で規模拡張性に限界があり、広範な利害関係者の意見よりもシステム設計者の価値を優先しがちである。
  • Fourつの高レベルの方向性は、有用な整合指標、参加型設計と運用、対話的価値学習、情報を得た熟慮的判断である。
  • 参加型設計と複数利害関係者アプローチ(例:投票を伴うオンラインマッチング)は、分配結果と認識される公正性を改善できる。
  • 対話的・回顧的・熟慮的評価(例:後悔テスト)は、短期的な最適化と長期的な幸福をバランスさせるのに役立つ。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。