Skip to main content
QUICK REVIEW

[论文解读] Matrix-LSTM: a Differentiable Recurrent Surface for Asynchronous Event-Based Data.

Marco Cannici, Marco Ciccone|arXiv (Cornell University)|Jan 10, 2020
Advanced Memory and Neural Computing参考文献 25被引用 6
一句话总结

本文提出 Matrix-LSTM,一种可微分的循环表面,通过使用 LSTM 单元网格,以端到端方式学习从动态视觉传感器(Dynamic Vision Sensors)重建事件数据为特定任务的表示。通过端到端训练,该方法在 MVSEC 数据集上提升了光流估计性能,并在 N-Cars 事件数据对象分类任务中达到最先进水平。

ABSTRACT

Dynamic Vision Sensors (DVSs) asynchronously stream events in correspondence of pixels subject to brightness changes. Differently from classic vision devices, they produce a sparse representation of the scene. Therefore, to apply standard computer vision algorithms, events need to be integrated into a frame or event-surface. This is usually attained through hand-crafted grids that reconstruct the frame using ad-hoc heuristics. In this paper, we propose Matrix-LSTM, a grid of Long Short-Term Memory (LSTM) cells that efficiently process events and learn end-to-end task-dependent event-surfaces. Compared to existing reconstruction approaches, our learned event-surface shows good flexibility and expressiveness on optical flow estimation on the MVSEC benchmark and it improves the state-of-the-art of event-based object classification on the N-Cars dataset.

研究动机与目标

  • 解决手工设计网格在从动态视觉传感器重建事件数据方面的局限性。
  • 学习特定任务的、端到端的事件表面,以适应下游视觉任务。
  • 利用异步事件数据提升光流估计与对象分类的性能。
  • 以可微分的、可学习的循环架构替代基于启发式规则的帧集成方法。

提出的方法

  • Matrix-LSTM 使用长短期记忆(LSTM)单元网格,以可微分方式处理异步事件。
  • 每个 LSTM 单元在其局部空间区域内处理事件,捕捉事件之间的时序依赖关系。
  • 通过端到端训练,网络学习连续且可微分的事件表面表示。
  • 该架构支持事件集成与下游任务性能的联合优化。
  • 它以可学习的、循环的处理机制替代传统固定的网格集成方法。
  • 该模型在下游任务(如光流估计与分类)上进行端到端训练。

实验结果

研究问题

  • RQ1可学习的循环架构是否能在重建事件数据方面优于手工设计的网格?
  • RQ2可微分事件表面在 MVSEC 基准上能多大程度改善光流估计性能?
  • RQ3Matrix-LSTM 是否能在 N-Cars 数据集上实现事件数据对象分类的最先进性能?
  • RQ4事件表面的端到端训练在多大程度上提升了下游任务的准确性?
  • RQ5与传统集成方法相比,所学习的事件表面在表达能力与灵活性方面表现如何?

主要发现

  • Matrix-LSTM 在 N-Cars 数据集上的事件数据对象分类任务中达到最先进性能。
  • 所学习的事件表面相比先前方法,在 MVSEC 基准上提升了光流估计性能。
  • 该模型在灵活性与表达能力方面优于基于手工网格的集成方法。
  • 端到端训练使网络能够学习增强下游性能的任务特定表示。
  • 可微分的循环结构能有效捕捉稀疏、异步事件流中的时序动态。
  • 该方法减少了对启发式集成规则的依赖,实现了自适应且数据驱动的表面构建。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。