Skip to main content
QUICK REVIEW

[논문 리뷰] Cloud Platforms for Developing Generative AI Solutions: A Scoping Review of Tools and Services

Dhavalkumar D. Patel, Ganesh Raut|arXiv (Cornell University)|2024. 12. 08.
Big Data and Business Intelligence인용 수 5
한 줄 요약

주요 클라우드 공급자와 그들의 제너레이티브 AI 개발 도구를 비교하는 범위 설정 검토로, 컴퓨트, 데이터, 보안, 엣지, 거버넌스 측면을 다루고 사례 연구와 향후 방향을 포함한다.

ABSTRACT

Generative AI is transforming enterprise application development by enabling machines to create content, code, and designs. These models, however, demand substantial computational power and data management. Cloud computing addresses these needs by offering infrastructure to train, deploy, and scale generative AI models. This review examines cloud services for generative AI, focusing on key providers like Amazon Web Services (AWS), Microsoft Azure, Google Cloud, IBM Cloud, Oracle Cloud, and Alibaba Cloud. It compares their strengths, weaknesses, and impact on enterprise growth. We explore the role of high-performance computing (HPC), serverless architectures, edge computing, and storage in supporting generative AI. We also highlight the significance of data management, networking, and AI-specific tools in building and deploying these models. Additionally, the review addresses security concerns, including data privacy, compliance, and AI model protection. It assesses the performance and cost efficiency of various cloud providers and presents case studies from healthcare, finance, and entertainment. We conclude by discussing challenges and future directions, such as technical hurdles, vendor lock-in, sustainability, and regulatory issues. Put together, this work can serve as a guide for practitioners and researchers looking to adopt cloud-based generative AI solutions, serving as a valuable guide to navigating the intricacies of this evolving field.

연구 동기 및 목표

  • 주요 공급자(AWS, Azure, GCP, IBM, Oracle, Alibaba)의 최첨단 생성형 AI용 클라우드 서비스와 그 강점/약점을 평가한다.
  • 대형 언어 모델, 다중 모달 AI, HPC, 서버리스, 엣지 컴퓨팅 및 데이터 관리에 대한 능력을 평가한다.
  • 클라우드 기반 생성형 AI의 보안, 윤리 및 규제 도전과제와 혁신 기회를 식별한다.
  • 실무자, 연구자 및 정책입안자에게 실용적인 지침과 전략적 권고를 제공한다.

제안 방법

  • Arksey와 O'Malley 프레임워크에 따른 체계적 범위 설정 검토.
  • 학술 데이터베이스와 벤더 자료를 광범위하게 조사한 문헌 및 공급자 문서 검색.
  • 컴퓨트, AI 서비스, 데이터 관리, 가격 책정 및 신기술을 평가하는 비교 프레임워크.
  • 산업 전문가 및 학계와의 자문을 통해 결과를 검증.
  • 합성에는 엣지 AI, 연합학습, 지속가능성 등 분야의 SWOT 분석 및 향후 방향이 포함되어 있다.
Figure 1: Structured guide through cloud-based generative AI development landscape
Figure 1: Structured guide through cloud-based generative AI development landscape

실험 결과

연구 질문

  • RQ1주요 클라우드 플랫폼의 생성형 AI 개발에 대한 기능과 한계는 어떠한가?
  • RQ2생성형 AI를 위한 HPC, AI 서비스, 데이터 관리 및 배포 도구 측면에서 공급자 간 비교는 어떠한가?
  • RQ3클라우드 기반 생성형 AI에 수반되는 보안, 윤리, 규제 및 지속가능성 문제는 무엇인가?
  • RQ4클라우드-기반 생성형 AI 개발의 새로운 트렌드와 향후 방향은 무엇인가?

주요 결과

공급자전체 클라우드 시장 점유율AI/ML 서비스 점유율
AWS31%34%
Microsoft Azure25%39%
Google Cloud Platform (GCP)10%11%
Alibaba Cloud5%6%
Others29%10%
  • AWS는 기초 모델과 P4d와 같은 GPU를 위한 SageMaker와 Bedrock으로 견고한 Generative AI Stack을 제공합니다.
  • Azure는 자사 Generative AI Stack 내에서 엔터프라이즈 통합, OpenAI 협력 및 책임 있는 AI 도구에 중점을 둡니다.
  • GCP는 Vertex AI, Cloud TPUs 및 MUM와 같은 이니셔티브를 통한 다중 모달 기능을 강조합니다.
  • 공급자들은 설명 가능성과 편향 도구를 통한 거버넌스 및 데이터/AI 통합과 끝-to-끝 AI 수명 주기를 강조합니다.
  • 클라우드 AI 시장은 AWS, Azure, GCP가 지배하며, 상당한 시장 점유율로 AI 서비스를 형성합니다.
  • AI 배포 및 데이터 거버넌스를 최적화하기 위한 하이브리드, 멀티 클라우드 및 엣지 컴퓨팅 전략의 채택이 증가하고 있습니다.
Figure 2: Major Milestone Timeline in AI Development
Figure 2: Major Milestone Timeline in AI Development

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.