文科省策定の常用漢字一覧をコーパスとした日韓漢字読み比較を実装した。 一般的に知られている日韓の漢字読みの対応を定量的に明らかにする。
データ | 情報源 |
---|---|
コーパス | Wikipedia 常用漢字一覧 |
ハングル漢字変換 | 한글 <-> 한자 코드 변환 |
漢字読み旧仮名遣い仮名変換 | 歴史的仮名遣い変換辞書「快適仮名遣ひ」 |
韓国語体(旧字体)日本語体(新字体)変換 | 旧字体・新字体変換 |
- Python (パイプライン制御)
- luigi
- Ruby (解析全般)
- romaji
./joyo-jpkr-analysis.py