Skip to main content
QUICK REVIEW

[論文レビュー] ToyADMOS2: Another dataset of miniature-machine operating sounds for anomalous sound detection under domain shift conditions

Noboru Harada, Daisuke Niizumi|arXiv (Cornell University)|Jun 4, 2021
Music and Audio Processing被引用数 25
ひとこと要約

ToyADMOS2を紹介する。複数の録音条件とノイズシナリオにわたるドメインシフト下での異常検知を評価するよう設計された、2つのサブデータセット( toy car と toy train )を含む大規模な ADMOS データセット。

ABSTRACT

This paper proposes a new large-scale dataset called "ToyADMOS2" for anomaly detection in machine operating sounds (ADMOS). As did for our previous ToyADMOS dataset, we collected a large number of operating sounds of miniature machines (toys) under normal and anomaly conditions by deliberately damaging them but extended with providing controlled depth of damages in anomaly samples. Since typical application scenarios of ADMOS often require robust performance under domain-shift conditions, the ToyADMOS2 dataset is designed for evaluating systems under such conditions. The released dataset consists of two sub-datasets for machine-condition inspection: fault diagnosis of machines with geometrically fixed tasks and fault diagnosis of machines with moving tasks. Domain shifts are represented by introducing several differences in operating conditions, such as the use of the same machine type but with different machine models and parts configurations, different operating speeds, microphone arrangements, etc. Each sub-dataset contains over 27 k samples of normal machine-operating sounds and over 8 k samples of anomalous sounds recorded with five to eight microphones. The dataset is freely available for download at https://github.com/nttcslab/ToyADMOS2-dataset and https://doi.org/10.5281/zenodo.4580270.

研究の動機と目的

  • 現実的なドメインシフト下で異常検知を評価するために、広く多様なADMOSデータセットを提供する。
  • 機械モデル、構成、速度、マイク設定、環境ノイズの変化に対する頑健性の評価を可能にする。
  • 検出タスクの難易度を調整するための制御された異常深度を提供する。
  • ドメインシフト条件下でのベンチマーキングを促進し、元の ToyADMOS データセットとの互換性を確保する。

提案手法

  • 複数の構成と異なる破損深度の下で、ミニチュア機械(おもちゃの車とおもちゃの列車)の通常音と異常音を収集する。
  • 複数のマイクで録音し、工場のような環境ノイズを導入して状況を模擬する。
  • 機械モデル、部品構成、速度、マイク配置、ノイズタイプを変えることでドメインシフトのシナリオを設計する。
  • さまざまなSNR条件下で単純な教師なし ASD オートエンコーダを用いたベースラインベンチマークを提供し、タスクの難易度を示す。
  • ドメインシフト下の ASD 研究を支援するため、データセットを自由にダウンロード可能とする。

実験結果

リサーチクエスチョン

  • RQ1ToyADMOS2で、異なるドメインシフト(モデル/部品、速度、マイク、ノイズ)において異常検知性能はどのように低下するか?
  • RQ2ベースラインの教師なしASDシステム(オートエンコーダ)は、ドメインシフトシナリオとノイズレベルを跨いで妥当なAUCを維持できるか?
  • RQ3ドメイン構成全体で、破損深度が異常検知性に与える影響はどの程度か?
  • RQ4ToyADMOS2は、ドメインシフト評価において元の ToyADMOS データセットからの知見をどのように補完・拡張できるか?

主な発見

  • ToyADMOS2は、サブデータセットごとに27k件以上の正常サンプルと8k件以上の異常サンプルを提供し、5–8本のマイクで録音されており、ドメインシフトの評価を可能にする。
  • 2つのサブデータセット(製品検査用のおもちゃの車と動作機械の故障診断用のおもちゃの列車)は、複数の構成と制御された破損深度を含み、異常統計を調整する。
  • ドメインシフト構成は、ターゲットドメイン条件の下で異なるAUC結果を示し、ASDシステムの頑健性の必要性を明らかにする(いくつかのドメインシフトとノイズレベル下のベンチマーク結果に示されている)。
  • このデータセットは、モデル/部品の違い、速度の変動、マイク設定、環境ノイズなど、現実的なドメインシフト要因の下でのテストをサポートし、幅広い評価フレームワークを提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。