Skip to main content
QUICK REVIEW

[논문 리뷰] Data Science: A Comprehensive Overview

Longbing Cao|arXiv (Cornell University)|2020. 07. 01.
Big Data and Business Intelligence참고 문헌 82인용 수 213
한 줄 요약

이 논문은 data science의 발전을 포괄적으로 조사하여 데이터 분석에서 data science로의 발전을 추적하고, 교육, 경제, 직업에 대한 시사점과 도전과 기회에 대해 개요를 제공합니다.

ABSTRACT

The twenty-first century has ushered in the age of big data and data economy, in which data DNA, which carries important knowledge, insights and potential, has become an intrinsic constituent of all data-based organisms. An appropriate understanding of data DNA and its organisms relies on the new field of data science and its keystone, analytics. Although it is widely debated whether big data is only hype and buzz, and data science is still in a very early phase, significant challenges and opportunities are emerging or have been inspired by the research, innovation, business, profession, and education of data science. This paper provides a comprehensive survey and tutorial of the fundamental aspects of data science: the evolution from data analysis to data science, the data science concepts, a big picture of the era of data science, the major challenges and directions in data innovation, the nature of data analytics, new industrialization and service opportunities in the data economy, the profession and competency of data education, and the future of data science. This article is the first in the field to draw a comprehensive big picture, in addition to offering rich observations, lessons and thinking about data science and analytics.

연구 동기 및 목표

  • 빅 데이터와 데이터 경제 시대에 데이터 사이언스를 이해할 필요성을 동기 부여한다.
  • 데이터 사이언스를 정의하고 데이터 분석, 데이터 애널리틱스, 빅 데이터와 같은 관련 용어와 구분한다.
  • 데이터 사이언스의 연구, 경제, 직업, 교육을 포함한 데이터 사이언스의 큰 그림을 제시한다.
  • 데이터 기반 혁신 및 데이터 교육의 주요 도전과 방향, 기회를 식별한다.

제안 방법

  • 통계/데이터 분석에서 데이터 사이언스로의 여정을 포괄적으로 조사한다.
  • 데이터 사이언스의 핵심 용어(데이터 사이언스, 데이터 애널리틱스, 고급 분석 등)를 명확히 비교한다.
  • 데이터 사이언스 시대를 설명하고, 정부 이니셔티브, 산업 동향 및 교육적 시사점을 다룬다.
  • 데이터 제품의 개념과 데이터-지식-지혜 경로를 종합한다.
  • 데이터 사이언스 연구와 교육을 지원하는 과학적 의제와 제도적 발전을 개요한다.

실험 결과

연구 질문

  • RQ1데이터 사이언스가 높은 수준의 관점과 학문적 관점에서 무엇인가?
  • RQ2데이터 분석에서 데이터 사이언스로의 진화와 핵심 구성요소 및 산출물(데이터 제품)은 무엇인가?
  • RQ3데이터 사이언스 시대를 형성하는 주요 사회적, 정부적, 교육적 이니셔티브는 무엇인가?
  • RQ4데이터 기반 혁신 및 교육의 주요 도전, 방향, 기회는 무엇인가?
  • RQ5전문 직업으로서 데이터 사이언스를 어떻게 조직해야 하며, 역량과 교육은 어떻게 구성되어야 하는가?

주요 결과

  • 데이터 사이언스는 데이터의 과학으로서의 특성을 가지며, 통계학, 정보학, 컴퓨팅, 커뮤니케이션, 관리, 사회학 및 도메인 맥락을 결합한 다학제적 분야로서 데이터를 인사이트와 의사결정으로 전환한다.
  • 데이터 사이언스 시대는 데이터화, 개방 데이터 이니셔티브, 데이터 사이언스 연구, 혁신 및 교육을 촉진하는 정부 및 제도적 프로그램에 의해 주도된다.
  • 데이터 제품은 데이터 사이언스에서 나타나며 예측, 서비스 및 도구 등 다양한 형태로 전달되는 지식, 지능, 지혜 및 의사결정을 나타낸다.
  • 전통적 데이터 분석에서 데이터 기반 발견 및 분석으로의 상당한 전환이 이루어지며, 심층 분석 및 데이터 기반 의사결정에 중점을 둔다.
  • 논문은 데이터 사이언스를 형성하는 과학적 의제와 데이터 과학 인프라를 형성하는 글로벌 및 지역 이니셔티브(예: US NSF, EU Horizon 2020, China NSF, UN Global Pulse, Australia’s Data61) 등을 문서화한다.
  • 연구는 데이터 사이언스가 단순히 '빅 데이터'가 아니라 여러 분야를 통합하고 새로운 데이터 중심의 경제와 직업을 주도하는 더 넓은 학문임을 주장한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.