[论文解读] Tracking Motion and Proxemics using Thermal-sensor Array
本文提出了一种低成本、保护隐私的方法,利用8×8热敏传感器阵列估算人数并追踪其运动方向。通过结合连通区域分析与局部峰值检测,并采用SVM分类,实现了80%的人数估算准确率;利用像素时间序列间的互相关性推断运动方向,采样率为10 Hz时延迟为1–2个采样点。
Indoor tracking has all-pervasive applications beyond mere surveillance, for example in education, health monitoring, marketing, energy management and so on. Image and video based tracking systems are intrusive. Thermal array sensors on the other hand can provide coarse-grained tracking while preserving privacy of the subjects. The goal of the project is to facilitate motion detection and group proxemics modeling using an 8 x 8 infrared sensor array. Each of the 8 x 8 pixels is a temperature reading in Fahrenheit. We refer to each 8 x 8 matrix as a scene. We collected approximately 902 scenes with different configurations of human groups and different walking directions. We infer direction of motion of a subject across a set of scenes as left-to-right, right-to-left, up-to-down and down-to-up using cross-correlation analysis. We used features from connected component analysis of each background subtracted scene and performed Support Vector Machine classification to estimate number of instances of human subjects in the scene.
研究动机与目标
- 开发一种基于热敏传感器阵列的隐私保护型室内追踪系统,以避免视频方法的侵入性。
- 通过支持实际占用人数与运动模式的实时估算,解决二值PIR传感器的局限性。
- 通过引入局部激发峰值与连通区域特征,改进现有基于热敏的计数方法,以更好区分个体实例。
- 利用像素时间序列间的互相关性实现运动方向追踪,从而在不依赖视频数据的前提下推断运动模式。
- 通过提供粗粒度但具信息量的占用与运动数据,支持能效管理、健康监测与社会行为分析等应用。
提出的方法
- 使用8×8红外传感器阵列(GridEYE)以10 Hz采样率采集902组人群与行走运动的场景,记录华氏温度数据。
- 对每组场景应用背景减除,以隔离移动的热信号,再进行特征提取。
- 提取的特征包括连通区域数量、最大区域大小、活跃像素数量,以及区域内局部激发峰值数量。
- 使用10折交叉验证训练支持向量机(SVM)分类器,以估算人数(1–4人),最优参数为C = 21,γ = 0.0078。
- 通过相邻像素时间序列间的归一化互相关计算延迟矩阵,推断运动方向(如自上而下、自左而右)。
- 在相邻像素间延迟上设置2个采样点的阈值,以区分运动与噪声,并识别一致的运动模式。
实验结果
研究问题
- RQ1基于连通区域与峰值特征的热敏传感器阵列是否能提升传统方法在人数估算中的准确率?
- RQ2在热敏传感器阵列中,通过像素时间序列的互相关分析,运动方向的推断准确度如何?
- RQ3SVM分类在基于热敏数据估算人数时,是否优于无监督聚类方法(如K-means)?
- RQ4局部激发峰值在多大程度上增强了近距离个体之间的可区分性?
- RQ5仅基于热敏强度时间序列,该系统能否可靠地检测多个行走方向的运动方向?
主要发现
- SVM分类器在使用连通区域与峰值特征组合的情况下,训练准确率达89.8%,测试准确率达80%,用于估算人数(1至4人)。
- 使用4维特征的K-means聚类在3人场景中达到84%聚类准确率,4人场景中为92%,2人场景中为76%,但无法可靠地将聚类结果映射到实际人数。
- 像素时间序列间的互相关分析成功识别了运动方向,延迟在1至2个采样点之间(对应0.1–0.2秒),采样率为10 Hz。
- 从延迟模式推算出的行走速度与真实值一致,视野范围为2.5 m × 2.5 m,传感器高度为3 m。
- 连通区域内的局部激发峰值提供了超越标准连通区域特征的额外判别能力,提升了计数估计的准确性。
- 在当前数据集中,相邻像素间延迟阈值设为2个采样点,足以将方向性运动与随机激活区分开来。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。