QUICK REVIEW

[論文レビュー] ActivityNet Challenge 2017 Summary

Bernard Ghanem, Juan Carlos Niebles|arXiv (Cornell University)|Oct 22, 2017

Human Pose and Action Recognition参考文献 2被引用数 50

ひとこと要約

2017年のActivityNet Challengeの結果をタスク別に要約し、上位提出とその性能指標、特徴融合や二-streamネットワーク、時系列提案などの手法に関する注記を含む。

ABSTRACT

The ActivityNet Large Scale Activity Recognition Challenge 2017 Summary: results and challenge participants papers.

研究の動機と目的

タスク	主な結果の上位3提出/指標
タスク1: 未加工ビデオ分類 (ActivityNet)	Top-1エラー: IBUG 8.8; CHUK/ETHZ/SIAT 9.8; Oxford Brookes University および Disney Research 18.9
タスク2: 切り抜きアクション認識 (Kinetics)	平均エラー: 清華大学＋百度 12.4; CHUK/ETHZ/SIAT 13.9; TwentyBN 14.4
タスク3: 時系列アクション提案 (ActivityNet)	AUC: SJTU/Columbia 64.80; MSRA 64.18; UMD 61.56
タスク4: 時系列アクション局在化 (ActivityNet)	平均mAP: SJTU/Columbia 33.40; CHUK/ETHZ/SIAT 31.86; IC 31.82
タスク5: 動画内イベントの密なキャプション生成 (ActivityNet Captions)	Average Meteor: MSRA 12.84; USTC 9.87; RUC/CMU 9.61

タスク1（未加工ビデオ分類）での上位3結果: Top-1エラー 8.8%（IBUG）；9.8%（CHUK, ETHZ, SIAT）；Oxford Brookes University および Disney Research 18.9%。
タスク2（切り抜きアクション認識）での上位3結果: 平均エラー 12.4%（Tsinghua+Baidu）；13.9%（CHUK, ETHZ, SIAT）；14.4%（TwentyBN）。
タスク3（時系列アクション提案）での上位3結果: AUC 64.80（SJTU & Columbia）；64.18%（MSRA）；61.56%（UMD）。
タスク4（時系列アクション局在化）での上位3結果: 平均mAP 33.40%（SJTU & Columbia）；31.86%（CHUK, ETHZ, SIAT）；31.82%（IC）。
タスク5（動画内イベントの密なキャプション生成）での上位3結果: 平均 Meteor 12.84（MSRA）；9.87%（University of Science and Technology of China）；9.61%（RUC & CMU）。
複数の特徴ストリーム（例：CNN、MBH、C3D）を組み合わせ、融合戦略（重み付け投票・ハード投票）を用いることで、未加工ビデオ分類の性能が大幅に向上することを示した提出がいくつかあった。
強調された革新的アプローチには、人間/対象への注意、クラス別再精練、ツー・ストリームアーキテクチャ、マルチスケールの注意機構などがある。

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。