Skip to main content
QUICK REVIEW

[论文解读] Analytics for the Internet of Things: A Survey

Eugene Siow, Thanassis Tiropanis|arXiv (Cornell University)|Jul 3, 2018
IoT and Edge/Fog Computing参考文献 131被引用 26
一句话总结

本综述提出了一套全面的分层分类法,用于物联网分析,整合了从设备到洞察的数据流,并在分布、互操作性、性能和分析价值方面评估了使能技术。它识别了物联网分析基础设施中的关键权衡,并为大规模大数据物联网环境中可扩展、语义丰富且低延迟的分析系统指明了未来的研究方向。

ABSTRACT

The Internet of Things (IoT) envisions a world-wide, interconnected network of smart physical entities. These physical entities generate a large amount of data in operation and as the IoT gains momentum in terms of deployment, the combined scale of those data seems destined to continue to grow. Increasingly, applications for the IoT involve analytics. Data analytics is the process of deriving knowledge from data, generating value like actionable insights from them. This article reviews work in the IoT and big data analytics from the perspective of their utility in creating efficient, effective and innovative applications and services for a wide spectrum of domains. We review the broad vision for the IoT as it is shaped in various communities, examine the application of data analytics across IoT domains, provide a categorisation of analytic approaches and propose a layered taxonomy from IoT data to analytics. This taxonomy provides us with insights on the appropriateness of analytical techniques, which in turn shapes a survey of enabling technology and infrastructure for IoT analytics. Finally, we look at some tradeoffs for analytics in the IoT that can shape future research.

研究动机与目标

  • 为应对连接设备产生的爆炸性数据增长背景下,物联网(IoT)分析系统性理解的日益增长的需求。
  • 识别并分类物联网分析中的挑战,特别是围绕数据多样性、体量、速度,以及分布、性能和分析价值之间的权衡。
  • 提出一个从物联网数据生成到可操作洞察的分层分类法,以促进跨领域的分析管道更好设计。
  • 调查使能技术与基础设施(如边缘/雾计算、语义网和分布式存储)在可扩展和互操作的物联网分析中的应用。
  • 通过识别物联网分析中未解决的权衡与机遇,为未来研究提供指导,特别是在集成异构数据源和实现实时、高价值洞察方面。

提出的方法

  • 提出五层分类法:(1) 数据生成,(2) 数据传输,(3) 数据存储,(4) 数据处理,以及(5) 分析输出,以构建物联网分析管道的结构。
  • 将分析方法分类为描述性、预测性和规范性分析,并将其与从数据到可操作洞察的知识层次结构相联系。
  • 回顾并分类数据流中的使能技术,包括用于低延迟处理的边缘/雾计算、用于可扩展性的联邦与内存数据库,以及用于互操作性的语义网标准。
  • 分析在分布(边缘与云之间)、互操作性(语义本体)、性能(速度与体量)以及分析价值(洞察质量)之间的权衡。
  • 采用系统性文献综述方法,分析2010–2018年间关于物联网、大数据和分析的综述与研究工作,以追踪其发展轨迹并识别当前研究中的空白。
  • 采用多维框架,基于技术在支持物联网应用中数据多样性、可扩展性和实时处理需求方面的表现来评估其性能。

实验结果

研究问题

  • RQ1如何构建一个统一的、分层的分类法,以建模从设备到洞察的物联网中数据与分析的流动?
  • RQ2在设计物联网分析基础设施时,关键的技术权衡是什么,特别是在分布、互操作性、性能和分析价值之间?
  • RQ3新兴技术如边缘/雾计算、语义网和内存数据库在支持或阻碍可扩展的物联网分析方面发挥怎样的作用?
  • RQ4数据多样性(包括传感器、社交媒体和地理空间数据等异构数据源)如何影响物联网分析的有效性与复杂性?
  • RQ5在大规模、分布式的物联网系统中,实现实时、高精度和语义上有意义的分析仍面临哪些开放的研究挑战?

主要发现

  • 预计物联网将生成的数据规模将超过网络规模数据,若每个英国家庭都配备智能电表,数据量估计可达每月2.64千万亿个事件。
  • 语义技术的集成可提升互操作性与分析价值,但因复杂性与延迟问题而面临性能瓶颈。
  • 边缘与雾计算可降低延迟并提升流数据的实时处理能力,但在分析能力与可扩展性方面仍落后于基于云的内存系统。
  • 71%的数据科学家报告称,由于数据多样性,分析难度持续上升,凸显了物联网分析中的关键挑战。
  • 本综述识别出分析价值与基础设施效率之间存在关键权衡:最大化洞察质量的系统(如基于云的系统)往往牺牲低延迟分布能力,而边缘系统则优先考虑速度而非分析深度。
  • 从数据生成到可操作洞察的分层分类法为设计未来物联网分析系统提供了结构化框架,并有助于使研究与应用需求保持一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。