Skip to content
This repository has been archived by the owner on Jun 20, 2023. It is now read-only.

2022 추계 작물학회 학술발표 "밀 생산량 예측을 위한 데이터 중요도 분석 및 주요 조사항목 선정"

Notifications You must be signed in to change notification settings

riverallzero/WheatYieldModel

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

밀 생산량 예측을 위한 머신러닝 기반 생육 데이터 중요도 분석 및 주요 조사항목 선정

설명

  • 2022 추계 작물학회 학술발표 in 고려대학교(10/13~14)
  • 이용 기술 : pandas, scikit-learn, matplotlib
  • 데이터 보안을 위해 Input 폴더 삭제

코드 설명

1_Clean Data

모델링을 위한 데이터 전처리 과정

2_Model

XGBoost, Linear Regression, RandomForest를 이용한 모델링

  • correlation.py: 데이터 간 상관관계 분석
    • 생체중과 건조중의 상관성이 있어 생체중만 사용하기로 결정
  • XGBoost | xgb_model.py

- RandomForest | randomforest_model.py

- Linear Regression | linear_model.py

3_EDA

  • 2022-05-03, 2022-05-17, 2022-05-31단위로 데이터의 분포 stripplot

결론

생산량 예측모델 중 XGBoost모델(MAE 163.44)은 개화기 이후 4주차의 SPAD 및 잎의 너비, 개화기의 잎 너비, LAI, 개화기 이후 2주차의 LAI가 중요한 변수로 나타났다. RandomForest모델(MAE 184.11)은 개화기 이후 4주차의 잎의 너비, SPAD, LAI, 개화기 LAI, 개화기 이후 2주차의 잎의 너비가 중요한 변수로 나타났다. Linear Regression모델(MAE 191.22)은 개화기 이후 2주차 수분함량과 LAI, 개화기의 LAI와 잎의 길이가 중요한 변수로 나타났다. 본 연구에서 생육조사를 통해 밀의 생육단계별 작황에 따라 주요한 조사항목을 선별한 의미가 있다. 하지만 대상지역이 한 지역으로 한정되어 기상, 토양 등 환경요인을 반영하지 못한 점이 한계로 생각되는 바, 향후 연구에서는 지속적인 모니터링과 다른 지역의 생육자료를 확보하여, 환경조건, 생육조건을 모두 고려할 계획이다.

About

2022 추계 작물학회 학술발표 "밀 생산량 예측을 위한 데이터 중요도 분석 및 주요 조사항목 선정"

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages