Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

kfold : store_kfold_csv & traning #12

Open
wants to merge 3 commits into
base: dev
Choose a base branch
from
Open

kfold : store_kfold_csv & traning #12

wants to merge 3 commits into from

Conversation

hello0U0
Copy link
Contributor

kfold 구현중입니다.

kfold_train.py

학습 구현 중 나중에 train.py로 바꾸는 것이 목표입니다.

kfold_train에서 data를 k개로 분할합니다.
-------> 현재 각 데이터 셋을 csv로 저장하고 있습니다.
pandas 데이터 프레임으로 바꾸고 train함수로 넘겨줍니다.

train

기존 train과 같습니다. 데이터셋은 kfold_train에서 만든 데이터를 이용하여 제작합니다.
학습 후 test 평가를 /dataset/kfold/eval_log.txt에 저장합니다.

train을 k번 반복합니다.

/dataset/kfold/

kfold.csv : 기존 train.csv와 dev.csv를 합친 데이터셋입니다.

eval_log.txt kfold의 각 모델 학습마다 test 평가 결과를 기록해나갑니다.

kfold_dev_실험시작시간_k : k번째 dev 셋입니다.
kfold_train_실험시작시간_k : k번째 train 셋입니다.

이후 해야할 것?

kfold를 했을 때 종합결과를 계산해야할까? 어떻게 만들 수 있을까?(prob를 더해서 k로 나눈 뒤 pred라벨을 다시 계산하나?)

inference도 만들어야 할까?(그럼 앙상블과 다를 게 없는데?)

@hello0U0
Copy link
Contributor Author

.gitignore: dataset/kfold 추가 : 학습시 생성된 csv와 log를 git으로 넘기지 않게 하기 위해 막아뒀습니다.

@Ilikestrawberry
Copy link
Contributor

구현 완전히 끝난 건가요?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants