[論文レビュー] Analytics for the Internet of Things: A Survey
本調査では、デバイスからイン사이트に至るまでのデータフローを統合し、分散性、相互運用性、パフォーマンス、分析的価値の観点から、IoTアナリティクスを支える技術を評価する包括的な階層的分類法を提案する。IoTアナリティクスインfra構築における主要なトレードオフを特定し、ビッグデータIoT環境におけるスケーラブルで意味的に豊かで低レイテンシなアナリティクスシステムの今後の研究方向性を提示する。
The Internet of Things (IoT) envisions a world-wide, interconnected network of smart physical entities. These physical entities generate a large amount of data in operation and as the IoT gains momentum in terms of deployment, the combined scale of those data seems destined to continue to grow. Increasingly, applications for the IoT involve analytics. Data analytics is the process of deriving knowledge from data, generating value like actionable insights from them. This article reviews work in the IoT and big data analytics from the perspective of their utility in creating efficient, effective and innovative applications and services for a wide spectrum of domains. We review the broad vision for the IoT as it is shaped in various communities, examine the application of data analytics across IoT domains, provide a categorisation of analytic approaches and propose a layered taxonomy from IoT data to analytics. This taxonomy provides us with insights on the appropriateness of analytical techniques, which in turn shapes a survey of enabling technology and infrastructure for IoT analytics. Finally, we look at some tradeoffs for analytics in the IoT that can shape future research.
研究の動機と目的
- 接続デバイスからの爆発的データ増加が進む中で、インターネットオブ サイエンス(IoT)におけるアナリティクスの体系的理解の必要性に対応する。
- 特にデータの多様性、ボリューム、速度、および分散性、パフォーマンス、分析的価値の間のトレードオフに焦点を当て、IoTアナリティクスの課題を特定・分類する。
- デバイスから実行可能なインサイトに至るまでの、IoTデータ生成から行動可能なインサイトに至るまでの階層的分類法を提案し、分野を越えたアナリティクスパイプラインの設計を支援する。
- エッジ/ミストコンピューティング、意味ウェブ、分散ストレージなどのスケーラブルで相互運用可能なIoTアナリティクスを支える技術とインfraを調査する。
- 特に異種データソースの統合とリアルタイムで高価値のインサイトを達成する点において、未解決のトレードオフと機会を特定することで、今後の研究を導く。
提案手法
- IoTアナリティクスパイプラインを構造化するため、(1) データ生成、(2) データ送信、(3) データ保存、(4) データ処理、(5) アナリティクス出力の5層構造の分類法を提案する。
- 記述的、予測的、指示的アナリティクスのアプローチを分類し、データから行動可能なインサイトに至るまでの知識階層と関連付ける。
- エッジ/ミストコンピューティングによる低レイテンシ処理、スケーラビリティを実現するフェデレーテッドおよびメモリ内データベース、相互運用性を高める意味ウェブ標準など、データフロー全体にわたる支援技術をレビュー・分類する。
- 分散性(エッジ対クラウド)、相互運用性(意味オントロジー)、パフォーマンス(速度とボリューム)、分析的価値(インサイト品質)の間のトレードオフを分析する。
- 2010年から2018年の調査と論文を対象とした体系的文献レビューを用い、IoT、ビッグデータ、アナリティクスの進化をマッピングし、現在の研究におけるギャップを特定する。
- IoTアプリケーションにおけるデータの多様性、スケーラビリティ、リアルタイム処理要件への対応を基準に、技術の多次元的評価フレームワークを採用する。
実験結果
リサーチクエスチョン
- RQ1デバイスからインサイトに至るまでのIoTにおけるデータとアナリティクスのフローをモデル化する統合的で階層的な分類法をどのように構築できるか?
- RQ2特に分散性、相互運用性、パフォーマンス、分析的価値の間のトレードオフに注目した場合、IoTアナリティクスインfraの設計における主要な技術的トレードオフは何か?
- RQ3エッジ/ミストコンピューティング、意味ウェブ、メモリ内データベースといった新興技術は、スケーラブルなIoTアナリティクスをどのように支援するか、あるいは妨げるか?
- RQ4センサー、ソーシャルメディア、ジオスペーシャルデータなど多様なデータソースを含むデータの多様性は、IoTアナリティクスの有効性と複雑さにどのように影響を与えるか?
- RQ5大規模で分散型のIoTシステムにおいて、リアルタイム性、高精度性、意味的に意味のあるアナリティクスを実現するための未解決の研究的課題は何か?
主な発見
- IoTは、英国のすべての世帯にスマートメーターが設置された場合、月間2.64京件のイベントを生成するという予測であり、ウェブスケールのデータをはるかに上回る規模のデータ生成が見込まれる。
- 意味技術の統合は相互運用性と分析的価値を向上させるが、複雑さとレイテンシのボトルネックによりパフォーマンスに悪影響を及えることがある。
- エッジおよびミストコンピューティングはストリーミングデータの低レイテンシ処理を実現し、リアルタイム処理を向上させるが、分析能力とスケーラビリティの点でクラウドベースのメモリ内システムに劣っている。
- 71%のデータサイエンティストが、データの多様性の増大によりアナリティクスの難易度が上昇していると報告しており、これはIoTアナリティクスにおける重要な課題を示している。
- 本調査では、分析的価値とインfra効率の間で重要なトレードオフが存在することを特定した:インサイト品質を最大化する(例:クラウドベース)システムは、低レイテンシ分散を犠牲にすることが多く、エッジシステムは分析の深さを犠牲にして速度を優先する傾向にある。
- データ生成から行動可能なインサイトに至るまでの階層的分類法は、将来のIoTアナリティクスシステムの設計と研究の応用ニーズの一致を支援する構造的フレームワークを提供する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。