[논문 리뷰] A Data Warehouse Design for a Typical University Information System
이 논문은 대학의 운영 데이터베이스를 정보 저장소로 전환하기 위해 데이터 추출, 정제, 변환, 인덱싱/로딩의 네 단계로 구성된 데이터 웨어하우스 설계 모델을 제안한다. MS Access 2010에서 구현된 이 모델은 의사결정자들이 전략적 기관 계획 수립과 높은 교육 기관의 성과 평가를 지원하기 위해 데이터 분석, 예측 및 데이터 마이닝을 수행할 수 있도록 한다.
Presently, large enterprises rely on database systems to manage their data and information. These databases are useful for conducting daily business transactions. However, the tight competition in the marketplace has led to the concept of data mining in which data are analyzed to derive effective business strategies and discover better ways in carrying out business. In order to perform data mining, regular databases must be converted into what so called informational databases also known as data warehouse. This paper presents a design model for building data warehouse for a typical university information system. It is based on transforming an operational database into an informational warehouse useful for decision makers to conduct data analysis, predication, and forecasting. The proposed model is based on four stages of data migration: Data extraction, data cleansing, data transforming, and data indexing and loading. The complete system is implemented under MS Access 2010 and is meant to serve as a repository of data for data mining operations.
연구 동기 및 목표
- 대학 행정에서 데이터 기반 의사결정의 증가하는 수요를 해결하기 위해.
- 운영 데이터베이스를 분석용 정보 저장소로 전환하기 위해.
- 높은 교육 기관에서의 예측, 데이터 마이닝 및 전략적 계획 수립을 지원하기 위해.
- MS Access 2010와 같은 접근성 있는 도구를 사용하여 실용적이고 구현 가능한 데이터 웨어하우스 모델을 제공하기 위해.
- 대학 환경에서 구조화된 ETL 프로세스를 통해 데이터 품질과 일관성을 확보하기 위해.
제안 방법
- 제안된 모델은 네 단계 ETL 파이프라인을 따르며, 데이터 추출, 데이터 정제, 데이터 변환, 데이터 인덱싱/로딩이다.
- 데이터 추출은 기존 대학 데이터베이스에서 운영 데이터를 추출하는 것을 포함한다.
- 데이터 정제에서는 일관성 없는 데이터, 중복 항목 및 null 값 제거를 통해 데이터 품질을 향상시킨다.
- 데이터 변환은 형식을 표준화하고 분석에 적합한 차원 구조로 데이터를 집계한다.
- 데이터 인덱싱 및 로딩은 변환된 데이터를 쿼리 및 보고에 최적화된 스타 스키마 구조에 저장한다.
- 시스템은 백엔드 데이터베이스 관리 시스템으로서 마이크로소프트 액세스 2010을 사용하여 구현된다.
실험 결과
연구 질문
- RQ1어떻게 운영 대학 데이터베이스를 분석 목적으로 효과적으로 데이터 웨어하우스로 전환할 수 있는가?
- RQ2대학 정보 시스템에서 데이터 품질과 사용 가능성을 보장하기 위해 필수적인 ETL 단계는 무엇인가?
- RQ3어떻게 데이터 웨어하우스가 높은 교육 분야에서 의사결정, 예측 및 데이터 마이닝을 지원할 수 있는가?
- RQ4제한된 자원으로 데이터 웨어하우스 개발을 위한 실용적인 구현 접근 방식은 무엇인가?
- RQ5데이터 정제 및 변환은 대학 데이터를 분석에 적합하게 준비하는 데 어떤 역할을 하는가?
주요 결과
- 제안된 네 단계 ETL 모델은 원시 운영 데이터를 구조화되고 분석 가능한 데이터 웨어하우스 형식으로 성공적으로 전환한다.
- 데이터 정제 과정은 데이터 품질을 크게 향상시켜 웨어하우스 내 일관성 없는 데이터와 오류를 감소시킨다.
- MS Access 2010에서의 구현은 제한된 IT 인프라를 가진 소규모에서 중간 규모의 대학에서의 실행 가능성을 보여준다.
- 결과적으로 생성된 데이터 웨어하우스는 복잡한 분석 쿼리를 지원하여 예측 및 전략적 의사결정을 가능하게 한다.
- 스타 스키마 설계는 학업 성과 및 행정 지표에 대한 효율적인 쿼리 및 보고를 촉진한다.
- 이 모델은 대학 환경에서의 데이터 웨어하우스 개발을 위한 재사용 가능한 프레임워크를 제공한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.