Skip to main content
QUICK REVIEW

[論文レビュー] Deep Learning for Target Classification from SAR Imagery: Data Augmentation and Translation Invariance

Hidetoshi Furukawa|arXiv (Cornell University)|Aug 25, 2017
Advanced SAR Imaging Techniques被引用数 53
ひとこと要約

本論文はSAR ATRにおけるCNNの翻訳不変性を分析し、ドメイン特化のデータ拡張が鍵であることを示す。拡張訓練によりMSTARの中心切り出しテストデータで99.6%を達成した。

ABSTRACT

This report deals with translation invariance of convolutional neural\nnetworks (CNNs) for automatic target recognition (ATR) from synthetic aperture\nradar (SAR) imagery. In particular, the translation invariance of CNNs for SAR\nATR represents the robustness against misalignment of target chips extracted\nfrom SAR images. To understand the translation invariance of the CNNs, we\ntrained CNNs which classify the target chips from the MSTAR into the ten\nclasses under the condition of with and without data augmentation, and then\nvisualized the translation invariance of the CNNs. According to our results,\neven if we use a deep residual network, the translation invariance of the CNN\nwithout data augmentation using the aligned images such as the MSTAR target\nchips is not so large. A more important factor of translation invariance is the\nuse of augmented training data. Furthermore, our CNN using augmented training\ndata achieved a state-of-the-art classification accuracy of 99.6%. These\nresults show an importance of domain-specific data augmentation.\n

研究の動機と目的

  • 翻訳のずれがCNNベースのSAR ATRの性能に与える影響を評価する。
  • 翻訳不変性と分類精度に対するデータ拡張の影響を評価する。
  • 精度-翻訳マップを用いて翻訳不変性を可視化する。
  • MSTARターゲットチップに対して、拡張あり/なしのCNN性能を比較する。

提案手法

  • 深層残差CNN(ResNet-18)を用いて、96x96のSARターゲットチップを10クラスに分類する。
  • データ拡張あり/なしでモデルを訓練する(100x100チップからのランダムクロップ)し、中心を切り出した96x96のテストパッチで評価する。
  • Δx, Δy のx/y方向の平行移動下での分類精度を示す精度-翻訳マップを定義・可視化する。
  • 非拡張訓練と拡張訓練の混同行列を分析してクラスごとの性能を定量化する。
  • 両設定(非拡張 vs 拡張)の中心切り出しテストデータにおける全体精度を報告する。
  • 拡張が翻訳不変性に与える影響は、アーキテクチャの変更だけよりも大きいことを論じる。

実験結果

リサーチクエスチョン

  • RQ1データ拡張と翻訳不変性の関係は何か?
  • RQ2拡張はMSTARでの総合分類精度とクラス別性能にどのように影響するか?
  • RQ3翻訳によるアライメントのずれは、ネットワークの深さだけでなく訓練データの摂動によって緩和できるか?
  • RQ4ResNet-18はアライメントされたSARターゲットチップに対して、拡張なしでどの程度翻訳不変性を達成するか?

主な発見

クラス非拡張精度(%)拡張精度(%)
2S197.8199.64
BMP299.49100.00
BRDM297.8199.64
BTR6095.9096.41
BTR7099.4999.49
D799.27100.00
T6296.7098.53
T7299.83100.00
ZIL13199.64100.00
ZSU23498.91100.00
  • 整列されたMSTARチップに対するデータ拡張なしのCNNは、限定的な翻訳不変性を示す。
  • 訓練時のランダムクロップによるデータ拡張は、翻訳耐性と全体精度を大幅に向上させる。
  • 拡張ありのCNNは中心切り出しテストデータで99.6%の精度を達成し、本研究で最先端の性能に到達した。
  • 拡張を用いると、小さな平行移動(Δx, Δyが±2ピクセル内)で堅牢な性能を示す精度-翻訳マップを示している。
  • 拡張によりクラス別の混同行列が顕著に減少し、多くのターゲットクラスで精度が向上する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。