Skip to main content
QUICK REVIEW

[論文レビュー] MIMII Dataset: Sound Dataset for Malfunctioning Industrial Machine Investigation and Inspection

Harsh Purohit, Ryo Tanabe|arXiv (Cornell University)|Sep 20, 2019
Music and Audio Processing参考文献 24被引用数 42
ひとこと要約

異常音検出のための MIMII データセットを、4つの産業用機械タイプで導入し、実世界のノイズ条件下での教師なし異常検知における自動エンコーダーを用いたベンチマークのベースラインを提供します。

ABSTRACT

Factory machinery is prone to failure or breakdown, resulting in significant expenses for companies. Hence, there is a rising interest in machine monitoring using different sensors including microphones. In the scientific community, the emergence of public datasets has led to advancements in acoustic detection and classification of scenes and events, but there are no public datasets that focus on the sound of industrial machines under normal and anomalous operating conditions in real factory environments. In this paper, we present a new dataset of industrial machine sounds that we call a sound dataset for malfunctioning industrial machine investigation and inspection (MIMII dataset). Normal sounds were recorded for different types of industrial machines (i.e., valves, pumps, fans, and slide rails), and to resemble a real-life scenario, various anomalous sounds were recorded (e.g., contamination, leakage, rotating unbalance, and rail damage). The purpose of releasing the MIMII dataset is to assist the machine-learning and signal-processing community with their development of automated facility maintenance. The MIMII dataset is freely available for download at: https://zenodo.org/record/3384388

研究の動機と目的

  • 産業機械の正常および異常条件下での実世界データセットを開放し、保守文脈での音響異常検知を進展させる。
  • 正常音のみで学習し、混在する正常/異常音をテストすることで教師なし学習ベンチマークを可能にする。
  • 複数の機械タイプと騒音レベルにまたがるベースラインの自動エンコーダーを用いた異常検知結果を提供し、今後の研究を導く。

提案手法

  • 実際の工場環境で4つの機械タイプ(バルブ、ポンプ、ファン、スライドレール)からマルチチャネル(8-m マイクアレイ)音を記録する。
  • さまざまなSNRレベル(6 dB、0 dB、-6 dB)で実環境を模した背景ノイズと対象機械音を混合する。
  • フレームサイズ 1024、ホップ 512、64 メルフィルターの対数メルスペクトログラム特徴を抽出し(5 フレーム=320-d 入力)、正常音を再構成する各機械のオートエンコーダを訓練する。
  • エンコーダー:64-64-8、デコーダー:8-64-Output の全結合層と ReLU 活性化を用いたエンコーダ–デコーダネットワークを使用し、50 エポックで Adam によって最適化する。
  • 10 秒区間ごとに再構成誤差閾値で異常検知を評価し、3 回の実行の平均 AUC を報告する。

実験結果

リサーチクエスチョン

  • RQ1正常音のみで訓練された教師なしオートエンコーダは、異なる機械タイプにわたる異常作動条件を検知できるか?
  • RQ2背景ノイズと機械音の非定常性が教師なしの異常音検知性能にどのように影響するか?
  • RQ3さまざまなSNR条件下でのバルブ、ポンプ、ファン、スライドレールのベースライン検出能力(AUC)はどうなるか?
  • RQ4データセットは異常検知におけるドメイン適応やモデル間一般化を評価するのに適しているか?
  • RQ5マルチチャネル録音は産業音風景における異常検知の単一チャネル手法と比べてどうか?

主な発見

Machine type / model ID6 dB AUC0 dB AUC-6 dB AUC
Valve 000.680.550.62
Valve 010.770.710.61
Valve 020.660.590.57
Valve 030.700.650.44
Valve 040.640.650.50
Valve 050.520.480.44
Valve 060.700.660.53
Pump 000.840.650.58
Pump 010.980.900.73
Pump 020.450.460.52
Pump 030.790.810.75
Pump 040.990.950.93
Pump 050.660.660.64
Pump 060.940.760.61
Fan 000.750.630.57
Fan 010.970.900.70
Fan 020.990.830.68
Fan 031.000.890.70
Fan 040.920.750.57
Fan 050.950.900.83
Fan 060.990.970.83
Slide rail 000.990.990.93
Slide rail 010.940.900.83
Slide rail 020.930.790.74
Slide rail 030.990.850.71
Slide rail 040.880.780.61
Slide rail 050.840.700.60
Slide rail 060.710.560.52
  • データセットには、4つの機械タイプと7つのモデルそれぞれに対して、26,092 の正常音セグメントと 6,065 の異常セグメントが含まれている。
  • オートエンコーダー用の教師なし異常検知は、機械タイプとモデルにより異なる AUC を示し、ファンでの性能が高く、バルブでの性能が低い。
  • 平均 AUC は低いSNRで低下し、ノイズが異常検知性能を劣化させることを示す。特に非定常かつ瞬発音を含むバルブで低い AUC を示す。
  • 機械タイプ間で、ポンプとファンは一般にバルブとスライドレールより高い AUC を達成し、検知の音響特性の違いを示している。
  • 非定常性と背景ノイズは、産業環境における教師なし異常音検知の主要な課題である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。