kfold : store_kfold_csv & traning #12

hello0U0 · 2022-11-25T14:17:51Z

kfold 구현중입니다.

학습 구현 중 나중에 train.py로 바꾸는 것이 목표입니다.

kfold_train에서 data를 k개로 분할합니다.
-------> 현재 각 데이터 셋을 csv로 저장하고 있습니다.
pandas 데이터 프레임으로 바꾸고 train함수로 넘겨줍니다.

기존 train과 같습니다. 데이터셋은 kfold_train에서 만든 데이터를 이용하여 제작합니다.
학습 후 test 평가를 /dataset/kfold/eval_log.txt에 저장합니다.

train을 k번 반복합니다.

kfold.csv : 기존 train.csv와 dev.csv를 합친 데이터셋입니다.

eval_log.txt kfold의 각 모델 학습마다 test 평가 결과를 기록해나갑니다.

kfold_dev_실험시작시간_k : k번째 dev 셋입니다.
kfold_train_실험시작시간_k : k번째 train 셋입니다.

kfold를 했을 때 종합결과를 계산해야할까? 어떻게 만들 수 있을까?(prob를 더해서 k로 나눈 뒤 pred라벨을 다시 계산하나?)

inference도 만들어야 할까?(그럼 앙상블과 다를 게 없는데?)

hello0U0 · 2022-11-25T14:21:06Z

.gitignore: dataset/kfold 추가 : 학습시 생성된 csv와 log를 git으로 넘기지 않게 하기 위해 막아뒀습니다.

Ilikestrawberry · 2022-11-28T02:48:04Z

구현 완전히 끝난 건가요?

hello0U0 added 2 commits November 25, 2022 13:59

kfold : store_kfold_csv & traning

3b56ce8

add ignore dataset/kfold/

b55e5d2

modfiy error

72b1044