Skip to main content
QUICK REVIEW

[논문 리뷰] NoSQL Database: New Era of Databases for Big data Analytics - Classification, Characteristics and Comparison

A B M Moniruzzaman, Syed Akhter Hossain|arXiv (Cornell University)|2013. 06. 30.
Cloud Computing and Resource Management참고 문헌 19인용 수 369
한 줄 요약

이 논문은 대용량 데이터 분석을 위한 맞춤형 NoSQL 데이터베이스의 종합적인 분류, 분석 및 비교를 제시한다. 확장성, 스키마 유연성, 데이터 모델 다양성 등의 특성을 평가하여 기존 RDBMS가 고속도, 대용량, 다양한 구조를 가진 데이터를 처리하는 데 겪는 한계를 NoSQL 시스템이 어떻게 해결하는지 보여주며, 조직이 대용량 데이터 워크로드에 적합한 NoSQL 솔루션을 선택하는 데 구조적인 안내를 제공한다.

ABSTRACT

Digital world is growing very fast and become more complex in the volume (terabyte to petabyte), variety (structured and un-structured and hybrid), velocity (high speed in growth) in nature. This refers to as Big Data that is a global phenomenon. This is typically considered to be a data collection that has grown so large it can not be effectively managed or exploited using conventional data management tools: e.g., classic relational database management systems (RDBMS) or conventional search engines. To handle this problem, traditional RDBMS are complemented by specifically designed a rich set of alternative DBMS; such as - NoSQL, NewSQL and Search-based systems. This paper motivation is to provide - classification, characteristics and evaluation of NoSQL databases in Big Data Analytics. This report is intended to help users, especially to the organizations to obtain an independent understanding of the strengths and weaknesses of various NoSQL database approaches to supporting applications that process huge volumes of data.

연구 동기 및 목표

  • 데이터 모델 및 설계 원리를 기반으로 NoSQL 데이터베이스의 체계적 분류를 제공하기 위해.
  • 확장성, 스키마 유연성, 일관성 모델 등 NoSQL 데이터베이스의 핵심 특성들을 분석하기 위해.
  • 기존 RDBMS 및 NewSQL, 검색 기반 시스템과 같은 다른 대안들과의 NoSQL 시스템 비교를 위해.
  • 조직이 대용량 데이터 응용 프로그램을 위한 다양한 NoSQL 접근 방식의 강점과 약점을 명확히 이해할 수 있도록 돕기 위해.
  • 특정 데이터 처리 요구 사항에 기반해 NoSQL 기술을 선택하는 데 있어 정보 기반의 의사결정을 지원하기 위해.

제안 방법

  • 데이터 모델을 기반으로 NoSQL 데이터베이스를 주로 네 가지 유형으로 분류: 키-값, 문서, 열 패밀리, 그래프 데이터베이스.
  • 최종 일관성, 수평적 확장성, 분산 저장 메커니즘과 같은 아키텍처 원칙 분석.
  • 가용성, 파artition 내성, 고속도 데이터 입력 환경에서의 성능과 같은 시스템 성질 평가.
  • 쿼리 기능, 데이터 모델링 유연성, ACID 트랜잭션 지원 등 기준을 활용한 NoSQL 시스템 비교.
  • 일致성, 가용성, 파artition 내성 간의 트레이드오프를 설명하기 위해 실제 구현 사례와 시스템 벤치마크 활용 (CAP 정리 기반).
  • 논문의 신뢰성과 맥락을 뒷받침하기 위해 44개의 참고문헌과 저자 경력 정보 통합.

실험 결과

연구 질문

  • RQ1다른 NoSQL 데이터베이스 유형은 데이터 모델링과 스토리지 아키텍처에서 어떻게 다릅니까?
  • RQ2대용량 데이터 환경에서 NoSQL 데이터베이스가 기존 RDBMS와 어떻게 다릅니까?
  • RQ3NoSQL 시스템은 고속도, 다양성이 높은 데이터 워크로드에서 확장성과 성능을 어떻게 다룹니까?
  • RQ4NoSQL 시스템에서 일관성, 가용성, 파artition 내성 간의 트레이드오프는 무엇입니까?
  • RQ5어떤 응용 시나리오에서 특정한 NoSQL 데이터베이스 유형이 가장 적합합니까?

주요 결과

  • NoSQL 데이터베이스는 기존 RDBMS가 어려워하는 페타바이트 수준의 데이터 볼륨과 고속도 데이터 입력을 처리하기 위해 특별히 설계되어 있다.
  • 주요 네 가지 NoSQL 유형—키-값, 문서, 열 패밀리, 그래프—각각 다른 데이터 모델링 및 액세스 패턴 요구 사항을 충족시킨다.
  • NoSQL 시스템은 엄격한 ACID 준수보다 확장성과 가용성을 우선시하며, 분산 아키텍처를 지원하기 위해 종종 최종 일관성 모델을 채택한다.
  • 문서 및 키-값 스토어는 반구조화 및 비구조화된 데이터에 가장 적합하며, 그래프 데이터베이스는 복잡한 관계와 탐색을 처리하는 데 뛰어나다.
  • BigTable 및 Cassandra와 같은 열 패밀리 스토어는 특히 분석 및 시계열 워크로드에서 넓은 열 환경에서의 읽기/쓰기 성능 최적화에 특화되어 있다.
  • 이 논문은 NoSQL 시스템이 RDBMS의 보편적 대체제가 아니며, 현대의 대용량 데이터 분석 스택에서 필수적인 보완 요소임을 확인한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.