[논문 리뷰] Towards Data-centric Graph Machine Learning: Review and Outlook
그래프 데이터 중심 프레임워크 DC-GML 정의, 분류 체계, 그리고 데이터 수명주기(데이터 수집, 탐색, 개선, 활용, 유지 관리)를 포괄하는 미래 방향에 대한 포괄적 조사.
Data-centric AI, with its primary focus on the collection, management, and utilization of data to drive AI models and applications, has attracted increasing attention in recent years. In this article, we conduct an in-depth and comprehensive review, offering a forward-looking outlook on the current efforts in data-centric AI pertaining to graph data-the fundamental data structure for representing and capturing intricate dependencies among massive and diverse real-life entities. We introduce a systematic framework, Data-centric Graph Machine Learning (DC-GML), that encompasses all stages of the graph data lifecycle, including graph data collection, exploration, improvement, exploitation, and maintenance. A thorough taxonomy of each stage is presented to answer three critical graph-centric questions: (1) how to enhance graph data availability and quality; (2) how to learn from graph data with limited-availability and low-quality; (3) how to build graph MLOps systems from the graph data-centric view. Lastly, we pinpoint the future prospects of the DC-GML domain, providing insights to navigate its advancements and applications.
연구 동기 및 목표
- 그래프 데이터 맥락에서 데이터 중심 AI를 정의하고 동기를 부여한다.
- 그래프 데이터 수명주기(수집, 탐색, 개선, 활용, 유지 관리)를 포괄하는 DC-GML 프레임워크를 제안한다.
- 그래프 데이터 중심 방법론과 MLOps 고려사항에 대한 분류체계와 검토를 제공한다.
- DC-GML 연구 및 응용의 도전 과제를 다루고 향후 방향을 제시한다.
제안 방법
- DC-GML 프레임워크를 소개하고 그래프 데이터 수명주기 단계에 대한 분류적 범주를 다룬다.
- 그래프 데이터 개선, 활용 및 그래프 MLOps 구성요소를 분류한다.
- 그래프 구조 향상, 특징 향상 및 확산에 관한 기법을 검토한다.
- 데이터 중심 그래프 ML 연구와 실무를 이끄는 핵심 질문(Q1–Q3)을 논의한다.
- DC-GML에 대한 열린 도전 과제와 향후 방향을 종합한다.
실험 결과
연구 질문
- RQ1Q1: 그래프 데이터 가용성 및 품질을 어떻게 향상시킬 것인가?
- RQ2Q2: 한정 가용성과 저품질의 그래프 데이터로부터 어떻게 학습할 것인가?
- RQ3Q3: 그래프 데이터 중심 관점에서 그래프 MLOps 시스템을 어떻게 구축할 것인가?
주요 결과
- 그래프-구조화된 데이터에 특히 초점을 맞춘 데이터 중심 AI에 대한 최초의 설문조사이다.
- 그래프 데이터 수명주기에 걸친 DC-GML의 체계적인 분류체계를 제공한다.
- 실용적인 그래프 데이터 개선, 활용 및 그래프 MLOps 전략을 개요한다.
- DC-GML 연구와 실무를 이끄는 세 가지 핵심 질문을 논의한다.
- DC-GML에서의 열린 도전 과제와 유망한 향후 방향을 식별한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.