[論文レビュー] Data Mining definition services in Cloud Computing with Linked Data.
本稿では、クラウドコンピューティングにおけるデータマイニングサービスを定義するためのリンクドデータベースドスキーマを提案する。既存の意味的スキーマを再利用することで、プロバイダ間での相互運用性とポータビリティを実現する。本アプローチは、価格、インターフェース、SLA、ワークフローといった重要なサービス要因をモデル化し、実際のサービス定義とクラウドプロバイダの包括的データセットを用いて検証されている。
In recent years with the rise of Cloud Computing, many companies providing services in the cloud, are empowering a new series of services to their catalogue, such as data mining and data processing, taking advantage of the vast computing resources available to them. Different service definition proposals have been put forward to address the problem of describing services in Cloud Computing in a comprehensive way. Bearing in mind that each provider has its own definition of the logic of its services, and specifically of data mining services, it should be pointed out that the possibility of describing services in a flexible way between providers is fundamental in order to maintain the usability and portability of this type of Cloud Computing services. The use of semantic technologies based on the proposal offered by Linked Data for the definition of services, allows the design and modelling of data mining services, achieving a high degree of interoperability. In this article a schema for the definition of data mining services on cloud computing is presented considering all key aspects of service, such as prices, interfaces, Software Level Agreement, instances or data mining workflow, among others. The new schema is based on Linked Data, and it reuses other schemata obtaining a better and more complete definition of the services. In order to validate the completeness of the scheme, a series of data mining services have been created where a set of algorithms such as Random Forest or K-Means are modeled as services. In addition, a dataset has been generated including the definition of the services of several actual Cloud Computing data mining providers, confirming the effectiveness of the schema.
研究の動機と目的
- クラウドコンピューティングにおけるデータマイニングのための標準化された相互運用性のあるサービス記述の欠如に対処すること。
- 異種のクラウドプロバイダ間で柔軟かつポータブルにデータマイニングサービスを定義できること。
- リンクドデータの原則と再利用可能なスキーマを活用し、より包括的かつ意味的に豊かなサービスモデリング手法を実現すること。
- 実際のクラウドプロバイダのサービスと代表的なデータセットを用いて、スキーマの完全性と有効性を検証すること。
提案手法
- リンクドデータの原則と既存のオントロジーに基づいたデータマイニングサービスの意味的スキーマを設計する。
- 価格、インターフェース、サービスレベル契約(SLA)、およびデータマイニングワークフローを含む、コアなサービス要因を統合する。
- ランダムフォレストやK-平均法といった特定のアルゴリズムを、スキーマ内での一等級のクラウドサービスとしてモデル化する。
- 表現力と一貫性を高めるために、既存の確立された意味的スキーマを再利用し、相互運用性を確保する。
- 実際のクラウドプロバイダサービスのデータセット(サービス定義とメタデータを含む)を用いてスキーマを実装・検証する。
実験結果
リサーチクエスチョン
- RQ1クラウドコンピューティングにおけるデータマイニングサービスは、どのように記述すれば、プロバイダ間での相互運用性とポータビリティを確保できるか?
- RQ2リンクドデータと意味的スキーマは、サービス記述の完全性と再利用可能性をどの程度向上できるか?
- RQ3価格、SLA、ワークフローといった主要なサービス要因を、一貫的かつ拡張可能なかたちで統一スキーマでモデル化できるか?
- RQ4提案されたスキーマは、既存のクラウドプロバイダの実世界のデータマイニングサービスをどの程度効果的に表現できるか?
主な発見
- 提案されたスキーマは、意味ウェブ標準を用いて、インターフェース、価格、SLA、ワークフロー定義といった、必須のデータマイニングサービスコンponentsを効果的にモデル化している。
- 既存のスキーマを再利用することで、サービス記述における表現力と一貫性が向上している。
- 共通の機械処理可能なフォーマットを提供することにより、本スキーマはクラウドプロバイダ間での相互運用性を実現している。
- 実際のクラウドプロバイダサービスのデータセットを用いた検証により、スキーマの完全性と実用的適用性が確認された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。