pixel
Client Story

단국대학교

By 2023년 8월 22일 No Comments

단국대학교 Azure Databricks 데이터 분석 사례

최근 대학교는 학령인구 감소로 등록금 의존도가 높아지고 있는 상황입니다. 때문에 한정된 자원의 효과적 배분을 위해 데이터에 기반한 체계적인 재정 운용의 필요성이 커지고 있습니다. 이를 위해 빅데이터 수집 및 분석, 데이터 활용 인프라 도입 및 활용에 적극 투자하려는 추세입니다.

단국대학교는 변화하는 시대적 흐름에 맞춰 미래를 대비하기 위해 산하에 ‘빅데이터 정보원’을 설립했습니다. 단국대학교 산하 빅데이터 정보원은 디지털 크리에이티브 캠퍼스 구축을 위해 클루커스와 함께 오랜 기간 동안 산재돼 있는 데이터를 통합 관리 및 분석하는 프로젝트를 진행했습니다.

클루커스는 Azure Databricks를 활용해 빅데이터 분석 플랫폼을 구축하고 재학생 수 예측 모델을 구현했습니다. 이를 바탕으로 클루커스는 단국대학교가 효율적으로 학사구조를 개편하고 더 나아가 스마트캠퍼스로 거듭나는 데 일조하고자 했습니다.

Company Overview

단국대학교는 어떤 학교인가요?

단국대학교는 혁신과 도전으로 시대와 사회를 선도하고 지식과 문화를 창조하며 학생의 진로와 성취를 이끌고 있는 대학입니다.

특히 최근 신설한 ‘빅데이터 정보원’을 중심으로 디지털 크리에이티브 캠퍼스를 구축해 글로벌 경쟁력을 갖춘 명문 사학으로 도약하고 있습니다.
특히 단국대학교는 IT 기술에 특화된 디지로그 미래인재 양성을 위해 모빌리티·보안·반도체 등 다양한 분야의 AI 빅데이터 전문가 육성 교육과정을 적극 운영하고 있습니다.

Painpoint

프로젝트를 진행하게 된 배경은 무엇인가요?
단국대학교는 학생성공을 위한 디지털 크리에이티브 캠퍼스 구축과 지난 10여년 간 산재된 데이터를 바탕으로 새학기에 등록하는 재학생 수를 예측해 체계적인 재정 운용을 원했습니다. 학사구조 개편 시 데이터에 기반한 합리적 의사결정을 내릴 뿐만 아니라, 입학 연도 별 경향성을 파악해 새로운 강좌 개설 시 교육의 질적 향상도 제고하고자 했습니다. 또한, 데이터 분석 플랫폼을 구축해 학내외 통합 빅데이터를 고도화할 수 있는 인프라를 마련하길 원했습니다.
클루커스는 단국대학교의 <스마트캠퍼스를 위한 빅데이터 기반 재학생 수 예측 모델 구현> 공개 입찰에서 높은 점수를 받아 프로젝트를 담당했습니다. 이번 프로젝트의 목표는 데이터 분석부터 모델 결과까지 End to End 형식의 파이프라인을 구축하고, 추후에도 공동작업이 가능한 클라우드 기반의 데이터 분석 환경을 구축하는 것이었습니다. 클루커스는 Azure Databricks 인프라에서 AI, ML 관련 솔루션을 활용해 단국대학교의 학사정보 및 재학, 학적변동 등의 집계 데이터를 기반으로 코호트 분석을 진행했습니다.

Benefits

클루커스는 어떤 기여를 하였나요?
클루커스는 단국대학교의 축척된 빅데이터를 활용하기 적합한 Azure Data Lake Storage에 재학생 수 예측에 필요한 데이터를 추가해 분석 및 전처리를 진행했습니다. 데이터 업로드 후 Azure Databricks에서 전처리 작업이 실행될 수 있도록 설계해 추후에도 편리하게 데이터를 관리, 활용할 수 있도록 했습니다.
또한, Databricks AutoML을 활용해 전체 데이터를 94개의 학과로 카테고리를 표현해 학습한 모델과, 16개 단과대학으로 표현해 학습한 모델 등 다양한 방식과 알고리즘으로 예측 모델을 학습하도록 Pipeline을 구축했습니다. 재학에 관련된 예측요인을 탐색하고 구성된 주요변수와 많은 실험을 통해 최종적인 ‘재학생 수 예측모델’을 완성했습니다. 이를 바탕으로 단국대학교의 입학, 학사, 취업 간 연관성 분석 및 개선방안 고도화를 꾀했습니다.
클루커스는 데이터 분석 플랫폼 및 AI 솔루션 등을 활용해 단국대학교의 운영 예산 절감과 데이터 기반의 체계적이고 효율적인 의사결정, 업무 효율화 등 교내 혁신을 위한 빅데이터 활용 방안 마련 등을 지원하고자 했습니다. 또한, 교내 데이터 담당자들의 역량 강화를 위해 수집 및 저장부터 BI 대시보드 운영 교육, 모델 Pipeline 교육까지 추가로 진행했습니다.

Solutions

어떤 솔루션이 활용되었나요?

  • Azure Databricks
  • Azure Data Lake Storage
  • Databricks AutoML
  • Power BI

데이터와 인공지능 부문 니즈가 있으신가요?

Data & AI 전문가 클루커스에 언제든지 문의 주세요!

Secured By miniOrange