[論文レビュー] Brain-Like Object Recognition with High-Performing Shallow Recurrent ANNs
CORnet-S は、脳のスコア(Brain-Score)をトップクラスに達成しつつ ImageNet の性能も高く保つ、四領域の再帰型人工ニューラルネットワーク(ANN)であり、再帰性を脳らしさの鍵として強調する。
Deep convolutional artificial neural networks (ANNs) are the leading class of candidate models of the mechanisms of visual processing in the primate ventral stream. While initially inspired by brain anatomy, over the past years, these ANNs have evolved from a simple eight-layer architecture in AlexNet to extremely deep and branching architectures, demonstrating increasingly better object categorization performance, yet bringing into question how brain-like they still are. In particular, typical deep models from the machine learning community are often hard to map onto the brain's anatomy due to their vast number of layers and missing biologically-important connections, such as recurrence. Here we demonstrate that better anatomical alignment to the brain and high performance on machine learning as well as neuroscience measures do not have to be in contradiction. We developed CORnet-S, a shallow ANN with four anatomically mapped areas and recurrent connectivity, guided by Brain-Score, a new large-scale composite of neural and behavioral benchmarks for quantifying the functional fidelity of models of the primate ventral visual stream. Despite being significantly shallower than most models, CORnet-S is the top model on Brain-Score and outperforms similarly compact models on ImageNet. Moreover, our extensive analyses of CORnet-S circuitry variants reveal that recurrence is the main predictive factor of both Brain-Score and ImageNet top-1 performance. Finally, we report that the temporal evolution of the CORnet-S "IT" neural population resembles the actual monkey IT population dynamics. Taken together, these results establish CORnet-S, a compact, recurrent ANN, as the current best model of the primate ventral visual stream.
研究の動機と目的
- 腹側視覚系のモデル化に向けたコンパクトで脳に整合したアーキテクチャの動機付け。
- 解剖学的に四つの領域をマッピングし再帰を組み込んだ CORnet-S を開発し、脳様性の向上を図る。
- Brain-Score と行動ベンチマークを用いて、他のモデルと CORnet-S を定量的に比較する。
提案手法
- V1、V2、V4、IT に対応する四つの領域をマッピングした CORnet-S を設計する。
- 各領域内に再帰を導入し、領域ごとに特定の反復回数を設定する。
- モーメンタム付き SGD を用いて ImageNet で訓練する;バッチサイズは 256、エポック数は 43。
- 神経データと行動データを統合した総合ベンチマークとして Brain-Score を用いる。
- 神経予測性、行動予測性、およびオブジェクト解決時間(OST)を評価する。
- AlexNet、VGG、ResNet、Inception、NASNet、BaseNets など広範なアーキテクチャと比較する。
実験結果
リサーチクエスチョン
- RQ1浅い構造で解剖学的に整列した再帰型ANNは、より深いモデルと比べて脳らしいベンチマークでどう性能を示すか?
- RQ2どのような構造要素(再帰、ボトルネック幅、スキップ接続)が Brain-Score と ImageNet の性能に最も影響を与えるか?
- RQ3CORnet-S は霊長類 IT で観察される時間的 IT ダイナミクスとオブジェクト解決時間を捉えられるか?
- RQ4Brain-Score 指標は新しい神経データ・行動データセットや転移タスクにどの程度 generalize するか?
主な発見
- CORnet-S は試験対象モデルの中で最高の Brain-Score を達成し、同様にコンパクトなモデルより ImageNet で上回る。
- 再帰性が Brain-Score と ImageNet top-1 性能の主な予測因子である。
- CORnet-S は時間的 IT ダイナミクスを捉え、サル IT のオブジェクト解決時間と相関する。純粋なフィードフォワードモデルとは異なる。
- 深さ 15 で ImageNet の高性能を維持(Top-1 73.1%)、上位モデルの中で最も浅い。
- Brain-Score は新しい被験者・新しい画像セット・CIFAR-100 転移テストに対して一般化し、CORnet-S は浅いモデルの中でトップを維持。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。