[論文レビュー] Data Science: A Comprehensive Overview
本論文はデータサイエンスの包括的な調査を提供し、データ分析からデータサイエンスへの進化を辿り、時代の特徴、課題、機会、教育、経済、職業への影響を概説します。
The twenty-first century has ushered in the age of big data and data economy, in which data DNA, which carries important knowledge, insights and potential, has become an intrinsic constituent of all data-based organisms. An appropriate understanding of data DNA and its organisms relies on the new field of data science and its keystone, analytics. Although it is widely debated whether big data is only hype and buzz, and data science is still in a very early phase, significant challenges and opportunities are emerging or have been inspired by the research, innovation, business, profession, and education of data science. This paper provides a comprehensive survey and tutorial of the fundamental aspects of data science: the evolution from data analysis to data science, the data science concepts, a big picture of the era of data science, the major challenges and directions in data innovation, the nature of data analytics, new industrialization and service opportunities in the data economy, the profession and competency of data education, and the future of data science. This article is the first in the field to draw a comprehensive big picture, in addition to offering rich observations, lessons and thinking about data science and analytics.
研究の動機と目的
- ビッグデータとデータ経済の時代においてデータサイエンスを理解する必要性を動機づける。
- データサイエンスを定義し、データ分析、データアナリティクス、ビッグデータなどの関連用語と区別する。
- データサイエンスの研究、経済、職業、教育を含む大局的な視点を提示する。
- データ主導の革新とデータ教育における主要な課題、方向性、機会を特定する。
提案手法
- 統計学/データ分析からデータサイエンスへの歩みを包括的に調査する。
- データサイエンスにおける主要用語(データサイエンス、データアナリティクス、アドバンスド分析など)の明確化と比較。
- 政府の施策、産業動向、教育的含意を含むデータサイエンス時代を説明する。
- データ製品の概念とデータ→知識→知恵の経路を統合する。
- データサイエンスの研究と教育を支える科学的議題と制度的発展の概略を示す。
実験結果
リサーチクエスチョン
- RQ1ハイレベルと専門分野の両方の視点からデータサイエンスとは何か。
- RQ2データ分析からデータサイエンスへとどのように進化してきたか、主要な構成要素と成果物(データ製品)は何か。
- RQ3データサイエンス時代を形作る主要な社会的、政府的、教育的施策は何か。
- RQ4データ駆動型の革新と教育における主要な課題、方向性、機会は何か。
- RQ5能力・訓練を含む職業としてデータサイエンスをどのように組織すべきか。
主な発見
- データサイエンスはデータの科学として、統計学、情報学、計算機科学、コミュニケーション、マネジメント、社会学、領域コンテキストを組み合わせた学際的な分野として特徴づけられ、データを洞察と意思決定に変換する。
- データサイエンス時代はデータ化、オープンデータの取り組み、データサイエンス研究・革新・教育を促進する政府・機関のプログラムによって推進されている。
- データ製品はデータサイエンスから生まれ、予測・サービス・ツールなどのさまざまな形で提供される知識・知性・知恵・意思決定を表す。
- 伝統的なデータ分析からデータ駆動型の発見と分析への大幅な移行が進み、深い分析とデータ駆動型意思決定を重視している。
- 本論文はデータサイエンスの科学的アジェンダとインフラを形作る世界的および地域的な取り組み(例:US NSF、EU Horizon 2020、中国NSF、UN Global Pulse、オーストラリアのData61)を記録している。
- 本研究はデータサイエンスは単なる“ビッグデータ”ではなく、複数分野を統合し新しいデータ中心の経済と職業を推進するより広い学問分野であると主張する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。