2023년 2월 진행한 방학세미나에 관련된 기록입니다.
- 30~31기 학회장팀 : 학회장 김현우 / 부학회장 윤지영
- 1월29일 ~ 2월3일 총 6일간 진행
- 오프라인 세미나 : 2월3일(금) 오후6시
Santander Customer Transaction Prediction 데이터를 이용하여, 피쳐 수가 많은 데이터에 대한 이진 분류 모델링을 5일간 진행하였습니다. 진행 방식은 Kaggle에 Competition을 활용하여 F1-score가 가장 높은 모델을 찾아내는 방식입니다. 총 3팀으로 구성되었으며, 12명의 30기 학회원들이 참여하였습니다. 불균형 클래스, 파생변수 생성, 다양한 변수들에 대한 EDA 및 하이퍼파라미터 튜닝 등 다양한 분석 과제에 대해 다뤄보았습니다. 분석한 내용을 PPT로 제작하여 오프라인 세미나 때 학회원들에게 발표하는 시간을 가졌습니다.
- 1팀 : 김진혁 김민우 채희지 변석주
- 2팀 : 정승민 임지훈 심수현 이수린
- 3팀 : 김수빈 김민 안은선 조건우
- P-SAT 30기 겨울방학 Kaggle Competition : https://www.kaggle.com/t/13e19dd9c7ca422d9a94915b2e7cdff5
- Santander Customer Transaction Prediction : https://www.kaggle.com/c/santander-customer-transaction-prediction