[论文解读] WasteNet: Waste Classification at the Edge for Smart Bins
WasteNet 是一个在边缘部署的 CNN,用于将废物分为六类(纸张、纸板、玻璃、金属、塑料、其他),在低功耗设备(如 Jetson Nano)上实现 97% 的准确率,在 TrashNet 上实现并支持无云访问的桶内决策。
Smart Bins have become popular in smart cities and campuses around the world. These bins have a compaction mechanism that increases the bins' capacity as well as automated real-time collection notifications. In this paper, we propose WasteNet, a waste classification model based on convolutional neural networks that can be deployed on a low power device at the edge of the network, such as a Jetson Nano. The problem of segregating waste is a big challenge for many countries around the world. Automated waste classification at the edge allows for fast intelligent decisions in smart bins without needing access to the cloud. Waste is classified into six categories: paper, cardboard, glass, metal, plastic and other. Our model achieves a 97\% prediction accuracy on the test dataset. This level of classification accuracy will help to alleviate some common smart bin problems, such as recycling contamination, where different types of waste become mixed with recycling waste causing the bin to be contaminated. It also makes the bins more user friendly as citizens do not have to worry about disposing their rubbish in the correct bin as the smart bin will be able to make the decision for them.
研究动机与目标
- 促成自动化废物分拣以降低智能垃圾桶中的回收污染。
- 开发无需云连接的边缘可部署的基于 CNN 的废物分类器。
- 通过迁移学习在常见废物类别上提高分类准确率。
- 展示适用于边缘设备的实际训练方案。
- 在 TrashNet 上与最先进的深度学习模型对比评估性能。
提出的方法
- 提出 WasteNet,一种可部署在边缘设备(如 Jetson Nano)的基于 CNN 的废物分类模型。
- 应用自 ImageNet 的迁移学习,采用结合特征提取与渐进式解冻的混合微调策略以减轻灾难性遗忘。
- 使用数据增强提高 TrashNet 图像的泛化能力。
- 采用 DenseNet 作为基础网络并通过具有判别性的逐层学习率进行微调。
- 在 TrashNet 数据集(train/validation/test 拆分为 50/25/25)上进行训练与评估。
实验结果
研究问题
- RQ1WasteNet 能否在 TrashNet 废物分类任务上击败现有的最先进深度模型?
- RQ2在无需云接入的情况下,边缘部署对于智能垃圾桶的准确实时废物分拣是否可行?
- RQ3混合迁移学习方法在减少灾难性遗忘的同时是否提高边缘端性能?
- RQ4WasteNet 在现实世界成像变化下对六类废物的表现如何?
主要发现
- WasteNet 在 TrashNet 上达到 0.970 的准确率(精确度/召回率/F1 均为 0.970),超过研究中的其他模型。
- 它显示出下一个最佳模型为 0.953 的准确率(DenseNet169),表明有显著的性能领先。
- 混淆矩阵显示大部分预测正确,部分错误主要发生在玻璃与金属/塑料类别之间。
- 训练曲线呈现分阶段学习:先进行顶层训练,随后通过带判别学习率的逐步解冻以避免灾难性遗忘。
- 基于梯度的定位(热图)识别驱动预测的区域,并建议对不确定情况设定大于 0.9 的置信阈值以触发人工分拣。
- 该方法适用于边缘设备(如 Jetson Nano),实现桶内智能决策并降低对云端的依赖。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。