Skip to main content
QUICK REVIEW

[論文レビュー] Failure Modes in Machine Learning Systems

Ram Shankar Siva Kumar, David O'Brien|arXiv (Cornell University)|Nov 25, 2019
Information and Cyber Security被引用数 40
ひとこと要約

本論文は、MLシステムの故障を意図的(敵対的)と非意図的(本質的に危険な結果)に分類する分類体系を提案し、実務家や政策立案者への適用可能性について論じる。

ABSTRACT

In the last two years, more than 200 papers have been written on how machine learning (ML) systems can fail because of adversarial attacks on the algorithms and data; this number balloons if we were to incorporate papers covering non-adversarial failure modes. The spate of papers has made it difficult for ML practitioners, let alone engineers, lawyers, and policymakers, to keep up with the attacks against and defenses of ML systems. However, as these systems become more pervasive, the need to understand how they fail, whether by the hand of an adversary or due to the inherent design of a system, will only become more pressing. In order to equip software developers, security incident responders, lawyers, and policy makers with a common vernacular to talk about this problem, we developed a framework to classify failures into "Intentional failures" where the failure is caused by an active adversary attempting to subvert the system to attain her goals; and "Unintentional failures" where the failure is because an ML system produces an inherently unsafe outcome. After developing the initial version of the taxonomy last year, we worked with security and ML teams across Microsoft, 23 external partners, standards organization, and governments to understand how stakeholders would use our framework. Throughout the paper, we attempt to highlight how machine learning failure modes are meaningfully different from traditional software failures from a technology and policy perspective.

研究の動機と目的

  • 開発者、セキュリティ対応者、弁護士、政策立案者のための共通の用語を提供する。
  • 故障を意図的と非意図的のカテゴリに分ける分類体系を導入する。
  • 技術的および政策的観点から、MLの故障モードが従来のソフトウェア故障とどのように異なるかを示す。

提案手法

  • MLの故障を意図的と非意図的のカテゴリに分類するフレームワークを開発する。
  • Microsoft、外部パートナー、標準化団体、政府と協力して利害関係者の有用性を検証する。
  • 技術および政策の文脈において、MLの故障モードを従来のソフトウェア故障と比較する。

実験結果

リサーチクエスチョン

  • RQ1さまざまな利害関係者にとって実行可能なクラスにMLシステムの故障をどのように分類できるか?
  • RQ2意図的なML故障と非意図的なML故障の定義上の特徴は何か?
  • RQ3技術的および政策的観点から、MLの故障モードは従来のソフトウェア故障モードとどのように異なるか。

主な発見

  • 能動的な敵対者によって引き起こされる意図的な故障と、本質的に安全でない結果である非意図的な故障を区別する分類体系。
  • このフレームワークは、ソフトウェア開発者、インシデント対応者、弁護士、政策立案者が利用できるように設計されている。
  • MLの故障モードは、技術的側面と政策的側面の両方において、従来のソフトウェア故障と意味のある相違を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。