2018年度映像メディア学　最終レポート

コードの動かし方

学習済みモデルのインポート
make_npz.batの実行
注意！:　wgetをPCにインストール事前にしておかなければいけない．
./models/coco_posenet.npzがインストールされていればOK.
pose_detection_demo.pyの実行
コマンドプロンプトにpython pose_detection_demo.py --img ./data/~~~と入力する．
~~~の部分は/dataディレクトリに保存しているPoseを出力したいPNGファイル名を入れる．
出力結果
importされているOpenCVが出力画像をShowする．
加えて，/data/~~~_result.pngファイルが作成されている．

学習に関して

今回は，以下の理由から学習済みモデルを使用する．

HWの限界
今回学習に使用する教師データは「COCO 2016 keypoints」であるが，作成したコード「train_pose.py」では，すべてのデータを学習器に入力すると，GPUのメモリがOverflowを起こし，動作が停止してしまった．目標の識別精度を達成するのに十分な学習を実現するためのHWの制約があった．
学習回数の時間的制約
今回の学習済みモデルは440000回の学習を完了させているため十分な精度を達成できるが，そのための必要時間がHWの制約上実現が難しいと考えられる．

以上より，以下の学習用コードもGithub上に挙げておくが上記の制約で動かなかった．
1)gen_ignore_mask.py
COCOデータセットからマスクを作成する関数．流用．(https://github.com/DeNA/Chainer_Realtime_Multi-Person_Pose_Estimation/blob/master/gen_ignore_mask.py)
2)train_pose.py
学習器．network_updator.pyを読み込み，学習を進める．
3)network_updator.py
オリジナルのLoss関数の作成と，Updatorの作成．

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

2018年度映像メディア学　最終レポート

コードの動かし方

学習に関して

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
data		data
models		models
.gitignore		.gitignore
Constants.py		Constants.py
Network2.py		Network2.py
README.md		README.md
gen_ignore_mask.py		gen_ignore_mask.py
make_npz.bat		make_npz.bat
network_updator.py		network_updator.py
pose_detection_demo.py		pose_detection_demo.py
train_pose.py		train_pose.py

mikihiroikura/Eizou_Media_2018_Submit

Folders and files

Latest commit

History

Repository files navigation

2018年度映像メディア学 最終レポート

コードの動かし方

学習に関して

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

2018年度映像メディア学　最終レポート

Packages