[论文解读] ToyADMOS2: Another dataset of miniature-machine operating sounds for anomalous sound detection under domain shift conditions
引入 ToyADMOS2,一个大规模的 ADMOS 数据集,包含两个子数据集(toy car 和 toy train),旨在在跨多种记录条件和噪声场景的领域转移下评估异常检测。
This paper proposes a new large-scale dataset called "ToyADMOS2" for anomaly detection in machine operating sounds (ADMOS). As did for our previous ToyADMOS dataset, we collected a large number of operating sounds of miniature machines (toys) under normal and anomaly conditions by deliberately damaging them but extended with providing controlled depth of damages in anomaly samples. Since typical application scenarios of ADMOS often require robust performance under domain-shift conditions, the ToyADMOS2 dataset is designed for evaluating systems under such conditions. The released dataset consists of two sub-datasets for machine-condition inspection: fault diagnosis of machines with geometrically fixed tasks and fault diagnosis of machines with moving tasks. Domain shifts are represented by introducing several differences in operating conditions, such as the use of the same machine type but with different machine models and parts configurations, different operating speeds, microphone arrangements, etc. Each sub-dataset contains over 27 k samples of normal machine-operating sounds and over 8 k samples of anomalous sounds recorded with five to eight microphones. The dataset is freely available for download at https://github.com/nttcslab/ToyADMOS2-dataset and https://doi.org/10.5281/zenodo.4580270.
研究动机与目标
- 提供一个大规模、多样化的 ADMOS 数据集,以在现实世界域转移下评估异常检测。
- 评估对机器模型、配置、速度、麦克风布置和环境噪声等变化的鲁棒性。
- 提供受控的异常深度,以调节检测任务的难度。
- 在域转移条件下促进基准测试,并与原始 ToyADMOS 数据集兼容。
提出的方法
- 从微型机器(toy car 和 toy train)在多种配置和损伤深度下收集正常和异常声音。
- 使用多台麦克风进行录音并引入环境噪声,以模拟工厂环境。
- 通过改变机器模型、部件配置、速度、麦克风布置和噪声类型来设计域转移场景。
- 使用简单的无监督 ASD 自编码器,在不同的信噪比条件下提供基线基准,以说明任务难度。
- 使数据集可免费下载,以支持域转移下的 ASD 研究。
实验结果
研究问题
- RQ1ToyADMOS2 在不同域转移(模型/部件、速度、麦克风、噪声)下,异常检测性能如何下降?
- RQ2基线无监督 ASD 系统(自编码器)能否在域转移场景和噪声水平下维持合理的 AUC?
- RQ3损伤深度对跨域配置的异常可检测性有何影响?
- RQ4ToyADMOS2 如何补充并扩展原始 ToyADMOS 数据集在域转移评估方面的洞见?
主要发现
- ToyADMOS2 在每个子数据集中提供超过 27k 正常样本和超过 8k 异常样本,使用 5–8 支麦克风录制,便于域转移评估。
- 两个子数据集(用于产品检验的 toy car 和用于移动机器故障诊断的 toy train)包含多种配置和受控的损伤深度,以调节异常统计。
- 域转移配置在不同目标域条件下显示出不同的 AUC 结果,说明 ASD 系统对鲁棒性的需求(如随附的在若干域转移和噪声水平下的基准结果所示)。
- 数据集支持在若干现实的域转移因素下进行测试,如模型/部件差异、速度变化、麦克风布置和环境噪声,提供广泛的评估框架。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。