QUICK REVIEW

[論文レビュー] Large-Scale Visual Active Learning with Deep Probabilistic Ensembles

Kashyap Chitta, José M. Alvarez|arXiv (Cornell University)|Nov 8, 2018

Machine Learning and Algorithms参考文献 57被引用数 29

ひとこと要約

本稿では、深層ニューラルネットワークアンサンブルがベイジアンニューラルネットワークを近似できるようにするKL正則化を用いたスケーラブルな手法、Deep Probabilistic Ensembles (DPEs) を提案する。これにより、アクティブラーニングにおける信頼性の高い不確実性推定が可能となり、ラベル付けコストを最大32%まで削減できる。DPEsは、大規模な画像分類（CIFAR-10, CIFAR-100, ImageNet）およびセマンティックセグメンテーション（BDD100k）において最先端の性能を達成し、特に代表が不足しているクラスにおいても性能向上を実現する。

ABSTRACT

Annotating the right data for training deep neural networks is an important challenge. Active learning using uncertainty estimates from Bayesian Neural Networks (BNNs) could provide an effective solution to this. Despite being theoretically principled, BNNs require approximations to be applied to large-scale problems, where both performance and uncertainty estimation are crucial. In this paper, we introduce Deep Probabilistic Ensembles (DPEs), a scalable technique that uses a regularized ensemble to approximate a deep BNN. We conduct a series of large-scale visual active learning experiments to evaluate DPEs on classification with the CIFAR-10, CIFAR-100 and ImageNet datasets, and semantic segmentation with the BDD100k dataset. Our models require significantly less training data to achieve competitive performances, and steadily improve upon strong active learning baselines as the annotation budget is increased.

研究の動機と目的

大規模なディープラーニングにおいて、注釈付きの有益なサンプルを選択する課題に対処し、不確実性推定が重要であるが、計算コストが非常に高いという点を解決すること。
大規模なモデルやデータセットに対してスケーラビリティと不確実性推定の両面で制限を受けるベイジアンニューラルネットワーク（BNNs）の限界を克服すること。
ベイジアン不確実性の信頼性とアンサンブルのスケーラビリティ・効率性を組み合わせることで、アクティブラーニングの性能を向上させること。
特にBDD100kのような長尾分布のデータセットにおける代表が不足しているクラスに注目し、セマンティックセグメンテーションにおける効果的なアクティブラーニングを実現すること。
計算コストの大幅な増加を伴わずに、既存のディープラーニングパイプラインに容易に統合できる実用的で即戦力の手法を開発すること。

提案手法

ベイジアンニューラルネットワークにおける変分推論をKLダイバージェンス正則化を用いて近似する、正則化されたアンサンブル手法としてDeep Probabilistic Ensembles (DPEs) を提案する。
同じアーサイテクチャを持つが異なるランダム初期化を持つ複数の深層ニューラルネットワークを訓練し、各モデルの重みと共有された事前分布との間にKL正則化項を適用する。
アンサンブル内のモデル間での予測分散を用いてモデルの不確実性を推定し、不確実性に配慮したアクティブラーニングの獲得関数を可能にする。
代表が不足しているクラスに優先順位を付けるために、$V_w = \sum_{k \in K} \mathbf{w}_k \text{Var}_e(\mathbf{p}_k^{(e)})$ というクラス重み付き獲得関数を導入する。
標準的なトレーニングおよび推論パイプラインを用い、最小限のアーキテクチャ変更で、画像分類およびセマンティックセグメンテーションの両タスクにDPEsを適用する。
正則化項によるトレーニング時間のわずかなオーバーヘッドを除き、標準アンサンブルと同等の計算コストを維持することで、推論効率を確保する。

実験結果

リサーチクエスチョン

RQ1正則化されたアンサンブルアプローチは、大規模な視覚タスクにおける深層ニューラルネットワークのベイジアン不確実性を効果的に近似できるか？
RQ2提案されたKL正則化アンサンブル手法は、画像分類ベンチマークにおいて、標準アンサンブルおよび既存のアクティブラーニングベースラインと比較して、サンプル効率の面で優れているか？
RQ3DPEsは、長尾分布のデータセットにおける希少または代表が不足しているクラスに特に効果的であり、セマンティックセグメンテーションにおけるアクティブラーニング性能を向上させられるか？
RQ4クラス重み付き獲得関数 $V_w$ は、標準の不確実性獲得関数と比較して、特定のターゲットクラスにおけるモデル性能をどのように向上させるか？
RQ5DPEsは、ImageNet や BDD100k といった大規模データセットにおいて、高い性能を達成するために必要な注釈バジェットをどの程度削減できるか？

主な発見

CIFAR-10, CIFAR-100, および ImageNet において、DPEsは最先端のアクティブラーニング性能を達成し、強力なベースラインを上回り、上界精度の95%に到達するためのラベル付けバジェットを最大32%まで削減できる。
BDD100kにおけるセマンティックセグメンテーションでは、26.9kのトレーニングクロップで、ランダムサンプリングに比べ2%、標準アンサンブルに比べ1%の平均IoU向上を達成する。
トレーニングインスタンスがたった240件の自転車など、代表が不足しているクラスにおいて、DPEsはランダムベースラインに比べてIoUで20%の絶対的向上を達成する。
クラス重み付き獲得関数 $V_w$ を用いることで、DPEsは標準の不確実性獲得関数に比べて交通標識のIoUを2%向上させ、完全教師あり上界との差を3.7%から1.7%に縮小する。
DPEsは、トレーニングデータの32%のみを用いても、完全教師あり上界性能の96.2%を回復させ、高いサンプル効率を示す。
推論速度は標準アンサンブルと同等であり、トレーニング時間のオーバーヘッドもわずかにとどまるため、実世界の展開において実用的である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。