Skip to main content
QUICK REVIEW

[論文レビュー] In-Context Impersonation Reveals Large Language Models' Strengths and Biases

Leonard Salewski, Stephan Alaniz|arXiv (Cornell University)|May 24, 2023
Language and cultural evolution被引用数 35
ひとこと要約

本論文は、LLMをインコンテキストで異なる年齢・ドメイン・人口統計を演じさせるプロンプトが、タスク性能を向上させるとともに、バンディット、推論、ビジョン-言語タスク全般におけるバイアスを明らかにすることを示している。

ABSTRACT

In everyday conversations, humans can take on different roles and adapt their vocabulary to their chosen roles. We explore whether LLMs can take on, that is impersonate, different roles when they generate text in-context. We ask LLMs to assume different personas before solving vision and language tasks. We do this by prefixing the prompt with a persona that is associated either with a social identity or domain expertise. In a multi-armed bandit task, we find that LLMs pretending to be children of different ages recover human-like developmental stages of exploration. In a language-based reasoning task, we find that LLMs impersonating domain experts perform better than LLMs impersonating non-domain experts. Finally, we test whether LLMs' impersonations are complementary to visual information when describing different categories. We find that impersonation can improve performance: an LLM prompted to be a bird expert describes birds better than one prompted to be a car expert. However, impersonation can also uncover LLMs' biases: an LLM prompted to be a man describes cars better than one prompted to be a woman. These findings demonstrate that LLMs are capable of taking on diverse roles and that this in-context impersonation can be used to uncover their hidden strengths and biases.

研究の動機と目的

  • LLM が文脈内で異なる社会的アイデンティティやドメイン専門家をなりすますことができるかを調査する。
  • なりすましが二アーム・バンディット課題の性能に与える影響を検討する。
  • MMLU データセットを用いたペルソナベースのなりすましによる推論性能を評価する。
  • なりすまし生成された記述が、下流のビジョン-言語分類にどのように影響するかを評価する。
  • 異なるタスクにおける性別と人種を跨ぐなりすましにより露呈するバイアスを特定する。

提案手法

  • 「If you were a {persona}」のようなプレフィックスを用いてLLMになりすましを誘発する。
  • Vicuna-13B のゼロショット設定を用い、推論には ChatGPT(gpt-3.5-turbo)をタスク全体で活用する。
  • バンディット課題:探索を分析するために、ベイズ更新とプロビット回帰を用いた二アーム・バンディット(β1, β2)。
  • 推論課題:MMLU の複数択問題を、タスク、ドメイン、非ドメイン専門家のペルソナを用いて実施する。
  • ビジョン-言語課題:ペルソナからクラス記述を生成し、生成された記述を用いて CLIP で分類(クラス名ではなく記述を用いる)。
  • 年齢ベース(2,4,7,13,20)およびドメイン/性別/人種のペルソナを横断して評価し、確率過程の再現性のために実験を繰り返す。

実験結果

リサーチクエスチョン

  • RQ1異なる年齢をなりすましてバンディット課題で、人間に近い探索戦略を再現できるか?
  • RQ2ドメイン専門家のなりすましは、非ドメインや中立的ペルソナと比べてMMLUの推論性能を向上させるか?
  • RQ3なりすまし生成された記述はCLIPによる細分類を向上させ、性別や人種を跨いでどんなバイアスが現れるか?
  • RQ4プロンプト中の年齢・専門知識・民族・性別は、タスクを横断してLLMにどの程度のバイアスを露呈させるか?

主な発見

  • より年長のなりすましは、バンディット課題でより高い報酬とより多くの探索抑圧を生み、人間の発達パターンを模倣する。
  • タスク専門家のなりすましは、ドメインまたは非ドメインなりすましよりもMMLUの精度を向上させる。
  • なりすまし生成された記述は、鳥と車のCLIPベースの細分類を改善し、年齢とともに性能が向上する。
  • 性別と人種のプロンプトはバイアスを露呈する:たとえば男性は車をよりよく記述し、女性は鳥をよりよく記述するなど、人種の影響も顕著である。
  • 結果は、二つのLLM(Vicuna-13B と ChatGPT)および複数のビジョン-言語バックボーンで一致しており、なりすましの効果が頑健であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。