Skip to main content
QUICK REVIEW

[논문 리뷰] Data Mining definition services in Cloud Computing with Linked Data.

Manuel Parra-Royón, Ghislain Auguste Atemezing|arXiv (Cornell University)|2018. 06. 18.
Service-Oriented Architecture and Web Services인용 수 2
한 줄 요약

이 논문은 클라우드 컴퓨팅에서 데이터 마이닝 서비스를 정의하기 위한 Linked Data 기반 스키마를 제안하며, 기존의 의미적 스키마를 재사용함으로써 다양한 제공자 간의 상호운용성과 이식 가능성을 보장한다. 이 접근법은 가격, 인터페이스, 서비스 수준 합의(SLA), 워크플로우와 같은 핵심 서비스 요소를 모델링하며, 실제 서비스 정의와 클라우드 제공자들의 포괄적인 데이터셋을 통해 검증된다.

ABSTRACT

In recent years with the rise of Cloud Computing, many companies providing services in the cloud, are empowering a new series of services to their catalogue, such as data mining and data processing, taking advantage of the vast computing resources available to them. Different service definition proposals have been put forward to address the problem of describing services in Cloud Computing in a comprehensive way. Bearing in mind that each provider has its own definition of the logic of its services, and specifically of data mining services, it should be pointed out that the possibility of describing services in a flexible way between providers is fundamental in order to maintain the usability and portability of this type of Cloud Computing services. The use of semantic technologies based on the proposal offered by Linked Data for the definition of services, allows the design and modelling of data mining services, achieving a high degree of interoperability. In this article a schema for the definition of data mining services on cloud computing is presented considering all key aspects of service, such as prices, interfaces, Software Level Agreement, instances or data mining workflow, among others. The new schema is based on Linked Data, and it reuses other schemata obtaining a better and more complete definition of the services. In order to validate the completeness of the scheme, a series of data mining services have been created where a set of algorithms such as Random Forest or K-Means are modeled as services. In addition, a dataset has been generated including the definition of the services of several actual Cloud Computing data mining providers, confirming the effectiveness of the schema.

연구 동기 및 목표

  • 클라우드 컴퓨팅에서 데이터 마이닝을 위한 표준화되고 상호운용 가능한 서비스 기술이 부족한 문제를 해결하기 위해.
  • 이질적인 클라우드 제공자 간에 민첩하고 이식 가능한 데이터 마이닝 서비스 정의를 가능하게 하기 위해.
  • Linked Data 원칙과 재사용 가능한 스키마를 활용하여 보다 완전하고 의미적으로 풍부한 서비스 모델링 접근법을 확립하기 위해.
  • 실제 클라우드 제공자 서비스와 대표적인 데이터셋을 사용하여 스키마의 완전성과 효과성을 검증하기 위해.

제안 방법

  • Linked Data 원칙과 기존 온톨로지 기반으로 데이터 마이닝 서비스를 위한 의미적 스키마를 설계한다.
  • 가격, 인터페이스, 서비스 수준 합의(SLA), 데이터 마이닝 워크플로우와 같은 핵심 서비스 요소를 통합한다.
  • Random Forest와 K-Means와 같은 특정 알고리즘을 스키마 내에서 일등 서비스로 모델링한다.
  • 표현력과 일관성을 향상시키기 위해 기존에 널리 쓰이는 의미적 스키마를 재사용하고 상호운용성을 확보한다.
  • 실제 클라우드 제공자 서비스의 데이터셋(서비스 정의 및 메타데이터 포함)을 활용하여 스키마를 구현하고 검증한다.

실험 결과

연구 질문

  • RQ1클라우드 컴퓨팅에서 데이터 마이닝 서비스를 어떻게 기술할 수 있을까? 이를 통해 다양한 제공자 간 상호운용성과 이식 가능성을 보장할 수 있는가?
  • RQ2Linked Data와 의미적 스키마는 서비스 기술의 완전성과 재사용 가능성에 얼마나 기여할 수 있는가?
  • RQ3가격, SLA, 워크플로우와 같은 핵심 서비스 요소를 일관적이고 확장 가능한 방식으로 통합된 스키마로 모델링할 수 있는가?
  • RQ4제안된 스키마는 기존 클라우드 제공자들에서 실제 운영 중인 데이터 마이닝 서비스를 얼마나 효과적으로 표현할 수 있는가?

주요 결과

  • 제안된 스키마는 의미 웹 표준을 활용하여 인터페이스, 가격, SLA, 워크플로우 정의와 같은 필수적인 데이터 마이닝 서비스 구성 요소를 성공적으로 모델링한다.
  • 기존의 스키마를 재사용함으로써 서비스 기술의 표현력과 일관성이 향상됨을 확인하였다.
  • 공통의 기계가 처리할 수 있는 형식을 제공함으로써, 스키마는 클라우드 제공자 간의 상호운용성을 실현한다.
  • 실제 클라우드 제공자 서비스의 데이터셋을 활용한 검증을 통해 스키마의 완전성과 실용적 적용 가능성이 확인되었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.