Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
kfold 구현중입니다.
kfold_train.py
학습 구현 중 나중에 train.py로 바꾸는 것이 목표입니다.
kfold_train에서 data를 k개로 분할합니다.
-------> 현재 각 데이터 셋을 csv로 저장하고 있습니다.
pandas 데이터 프레임으로 바꾸고 train함수로 넘겨줍니다.
train
기존 train과 같습니다. 데이터셋은 kfold_train에서 만든 데이터를 이용하여 제작합니다.
학습 후 test 평가를 /dataset/kfold/eval_log.txt에 저장합니다.
train을 k번 반복합니다.
/dataset/kfold/
kfold.csv : 기존 train.csv와 dev.csv를 합친 데이터셋입니다.
eval_log.txt kfold의 각 모델 학습마다 test 평가 결과를 기록해나갑니다.
kfold_dev_실험시작시간_k : k번째 dev 셋입니다.
kfold_train_실험시작시간_k : k번째 train 셋입니다.
이후 해야할 것?
kfold를 했을 때 종합결과를 계산해야할까? 어떻게 만들 수 있을까?(prob를 더해서 k로 나눈 뒤 pred라벨을 다시 계산하나?)
inference도 만들어야 할까?(그럼 앙상블과 다를 게 없는데?)