Yazılımımızda amacımız pos-tagging yöntemini Türkçe'ye uyarlayarak, Türkçe'nin NLP işlemede diğer dillerin kullandığı yöntemleri kullanabilmesi ve dillerin birbirine dönüştürüldüğünde (aşağıda açıklanan tag set ile) hızlı işlenebilmesi amacıyla katkı sunmak istedik.
Universal Tag Set, tüm dillerin ortak groundunun oluşması için belirlenmiş temel taglerden oluşmaktadır.Bu dillerin birbiri yerine kullanılmasını kolaylaştırır. Seti seçerken aşağıdaki linkteki oranları baz aldık. Tag Set Tanıtım
Veri setimiz kaggle'dan karışık haberlerden alınmıştır.
Ecem Bölük
Merve Din
Dilara Kanalıcı