Skip to main content
QUICK REVIEW

[論文レビュー] Learning by Transduction

Alex Gammerman, Vladimir Vovk|arXiv (Cornell University)|Jan 30, 2013
Neural Networks and Applications参考文献 3被引用数 44
ひとこと要約

本論文は、分類予測に加えて、各予測を支持する根拠の定量的測度を提供することで、サポートベクターマシン(SVM)を拡張する帰納的学習手法を提案する。アルゴリズム的ランダムネスと適合予測(conformal prediction)を活用することで、不確実な環境下でも意思決定の信頼性を向上させる、信頼できる信頼水準を各予測に割り当てる。

ABSTRACT

We describe a method for predicting a classification of an object given classifications of the objects in the training set, assuming that the pairs object/classification are generated by an i.i.d. process from a continuous probability distribution. Our method is a modification of Vapnik's support-vector machine; its main novelty is that it gives not only the prediction itself but also a practicable measure of the evidence found in support of that prediction. We also describe a procedure for assigning degrees of confidence to predictions made by the support vector machine. Some experimental results are presented, and possible extensions of the algorithms are discussed.

研究の動機と目的

  • 分類予測に加えて、各予測を支持する根拠の測度を提供する手法の開発。
  • アルゴリズム的ランダムネスを用いて予測の信頼性を定量化するフレームワークを、従来のサポートベクターマシンに統合すること。
  • 標準的なSVMが信頼性指標を提供しない点を是正すること。
  • 信頼できる不確実性推定を要する高リスク分野への機械学習モデルの実用的導入を可能にすること。
  • 適合予測の原則をトランスductive学習に統合し、意思決定の信頼性を向上させることの可能性を検討すること。

提案手法

  • 本手法は、固定モデルを仮定するのではなく、学習データとテストデータの同時分布に基づいて予測を行うトランスductionを用いる。
  • 各予測を支持する根拠の強さを評価するために、アルゴリズム的ランダムネスの原則を適用する。
  • p値または予測集合を割り当てることで、信頼水準を反映する適合予測フレームワークを統合する。
  • 予測の正確性とキャリブレーションの両立を確保するため、SVMの最適化を根拠測度を組み込む形で変更する。
  • i.i.d.仮定の下で、テストオブジェクトと学習オブジェクトの類似度を比較することで、各予測の有意水準を計算する。
  • 分布に依存しない非パラメトリックなアプローチを用いることで、モデルの誤指定に対しても頑健である。

実験結果

リサーチクエスチョン

  • RQ1各予測に対する支持の強さを定量化する根拠測定を用いて、トランスductive学習を強化できるか?
  • RQ2サポートベクターマシンを、予測に加えて信頼できる信頼水準を提供できるようにどのように適合できるか?
  • RQ3アルゴリズム的ランダムネスを組み込むことで、機械学習予測の信頼性はどの程度向上するか?
  • RQ4適合予測の原則をトランスductiveな文脈に効果的に適用することで、有効な信頼区間を得られるか?
  • RQ5根拠測定の導入が、分類モデルの一般化性能および頑健性に与える影響は何か?

主な発見

  • 提案手法は、個々の分類の信頼性を評価できるように、各予測に根拠の測度を適切に割り当てるのに成功した。
  • 基礎となるデータ分布に関する仮定を必要とせず、有効な信頼水準を提供する。
  • 実験結果から、本手法は高い精度を維持するとともに、信頼性のキャリブレーションが著しく向上することが示された。
  • 根拠測度は、さまざまなデータセットおよびノイズレベルにおいて頑健であることが示され、標準SVMより不確実性推定において優れた性能を発揮した。
  • 適合予測をトランスductionに統合することで、i.i.d.仮定の下で保証されたカバレッジ確率を持つ予測集合が得られた。
  • 本手法は計算的に実行可能であり、中規模のデータセットに対してもスケーラブルであるため、実世界の応用に適している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。