Skip to content

Commit

Permalink
Introduce work in three lexicons
Browse files Browse the repository at this point in the history
Types: ITKONEN, KYROE, HYPPAE
  • Loading branch information
rueter committed Dec 6, 2023
1 parent d4d2fee commit 88a0b1e
Show file tree
Hide file tree
Showing 3 changed files with 73 additions and 60 deletions.
14 changes: 13 additions & 1 deletion src/fst/affixes/propernouns.lexc
Original file line number Diff line number Diff line change
Expand Up @@ -34,6 +34,14 @@ LEXICON PROP_SEM/PLC_
!!
LEXICON PROP_TOP_
PROP_SEM/PLC_ ;

LEXICON PROP_ITKONEN_sur ! Itkonen:Itko
+Sem/Sur+Sg+Nom:nen K ;
+Sem/Sur+Sg+Gen:s K ;
+Sem/Sur+Sg+Loc:sest K ;
+Sem/Sur+Sg+Com:sin K ;
+Sem/Sur+Sg+Ill:ssa K ;

LEXICON PROP_TOP_ATOM
: ATTESTED-TOPONYM-STEM ;
PROP_ATOM ;
Expand Down Expand Up @@ -347,6 +355,8 @@ LEXICON PROP_KAQLBB
!LEXICON PROP_HOQPPI
!: NMN_HOQPPI ;

LEXICON PROP_KYROE_sur
+Sem/Sur: NMN_RADIO ;
LEXICON PROP_RADIO
: NMN_RADIO ;

Expand Down Expand Up @@ -394,6 +404,8 @@ LEXICON PROP_BIOLOGIA
!: NMN_BUKVA ;
LEXICON PROP_MERJA
: NMN_MERJA ;
LEXICON PROP_HYPPAE_sur
+Sem/Sur: NMN_MERJA ;
LEXICON PROP_TRUUBA-ani
+Sem/Ani: NMN_TRUUBA ;
LEXICON PROP_TRUUBA-fem
Expand Down Expand Up @@ -627,7 +639,7 @@ LEXICON PROP_SEM/MAL_RADIO
!LEXICON PROP_SEM/SUR_
!+Sem/Sur: # ;

LEXICON PROP_SEM/SUR_PAPP
LEXICON PROP_PAPP_sur
! This works for surnames in -off
+Sem/Sur: NMN_PAPP ;

Expand Down
118 changes: 59 additions & 59 deletions src/fst/stems/propernouns_newwords.lexc
Original file line number Diff line number Diff line change
Expand Up @@ -265,22 +265,22 @@ Tuomas+N+Prop:Tuoma%^1VOWs PROP_SEM/MAL_SAJOS ;


!! SURNAMES
Feodoroff+N+Prop:Feodoro%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Fedotoff+N+Prop:Fedoto%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Fofanoff+N+Prop:Fofano%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Fofonoff+N+Prop:Fofono%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Gauriloff+N+Prop:Gaurilo%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Gerasimoff+N+Prop:Gerasimo%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Jefremoff+N+Prop:Jefremo%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Jeffremoff+N+Prop:Jeffremo%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Karpoff+N+Prop:Karpo%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Kiprianoff+N+Prop:Kipriano%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Lietoff+N+Prop:Lieto%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Ljetoff+N+Prop:Ljeto%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Moshnikoff+N+Prop:Moshniko%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Semenoff+N+Prop:Semeno%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Sverloff+N+Prop:Sverlo%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Titoff+N+Prop:Tito%^1VOW%{ʹØ%}ff PROP_SEM/SUR_PAPP "" ;
Feodoroff+N+Prop:Feodoro%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Fedotoff+N+Prop:Fedoto%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Fofanoff+N+Prop:Fofano%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Fofonoff+N+Prop:Fofono%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Gauriloff+N+Prop:Gaurilo%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Gerasimoff+N+Prop:Gerasimo%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Jefremoff+N+Prop:Jefremo%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Jeffremoff+N+Prop:Jeffremo%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Karpoff+N+Prop:Karpo%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Kiprianoff+N+Prop:Kipriano%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Lietoff+N+Prop:Lieto%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Ljetoff+N+Prop:Ljeto%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Moshnikoff+N+Prop:Moshniko%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Semenoff+N+Prop:Semeno%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Sverloff+N+Prop:Sverlo%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;
Titoff+N+Prop:Tito%^1VOW%{ʹØ%}ff PROP_PAPP_sur "" ;

Avaskari+N+Prop:Avaskari PROP_SEM/SUR_TERHI ;
Kangasniemi+N+Prop:Kangasniemi PROP_SEM/SUR_TERHI ;
Expand Down Expand Up @@ -339,67 +339,67 @@ Haltta+N+Prop:Haltta PROP_SEM/SUR_MERJA ;
Magga+N+Prop:Magga PROP_SEM/SUR_MERJA ;
Arola+N+Prop:Arola PROP_SEM/SUR_MERJA ;
Harju+N+Prop:Harju PROP_OULU ;
Niittyvuopio-Jämsä+N+Prop+Sem/Sur:Niittyvuopio-Jämsä SURNAME_DUMMY ;
Hyppä+N+Prop+Sem/Sur:Hyppä SURNAME_DUMMY ;
Hyyppä+N+Prop+Sem/Sur:Hyyppä SURNAME_DUMMY ;
Sipilä+N+Prop+Sem/Sur:Sipilä SURNAME_DUMMY ;
Jouste+N+Prop:Jouste PROP_JOUSTE ;
Laine+N+Prop:Laine PROP_JOUSTE ;
Juutinen+N+Prop+Sem/Sur:Juutinen SURNAME_DUMMY ;
Halonen+N+Prop+Sem/Sur:Halonen SURNAME_DUMMY ;
Jääskö+N+Prop+Sem/Sur:Jääskö SURNAME_DUMMY ;
Kyrö+N+Prop+Sem/Sur:Kyrö SURNAME_DUMMY ;
Kiviniemi+N+Prop:Kiviniemi PROP_SEM/SUR_TERHI ;
Lumikivi+N+Prop:lumikivi PROP_SEM/SUR_TERHI ;
Aikio-Puoskari+N+Prop:Aikio-Puoskari PROP_SEM/SUR_TERHI ;
Lindberg+N+Prop+Sem/Sur:Lindberg SURNAME_DUMMY ;
Jomppanen+N+Prop+Sem/Sur:Jomppanen SURNAME_DUMMY ;
Lehtinen+N+Prop+Sem/Sur:Lehtinen SURNAME_DUMMY ;
Leivo+N+Prop:Leivo PROP_SEM/SUR_RADIO ;
Aikio+N+Prop:Aikio PROP_SEM/SUR_RADIO ;
Paltto+N+Prop:Paltto PROP_SEM/SUR_RADIO ;
Sanila-Aikio+N+Prop:Sanila-Aikio PROP_SEM/SUR_RADIO ;
Lotvonen+N+Prop+Sem/Sur:Lotvonen SURNAME_DUMMY ;
Juutinen+N+Prop+Sem/Sur:Juuti PROP_ITKONEN_sur ;
Halonen+N+Prop:Halo PROP_ITKONEN_sur ;
Jomppanen+N+Prop:Jomppa PROP_ITKONEN_sur ;
Lehtinen+N+Prop:Lehti PROP_ITKONEN_sur ;
Lotvonen+N+Prop:Lotvo PROP_ITKONEN_sur ;
Lumisalmi+N+Prop:Lumisalmi PROP_SEM/SUR_TERHI ;
Mustonen+N+Prop+Sem/Sur:Mustonen SURNAME_DUMMY ;
Mäenpää+N+Prop+Sem/Sur:Mäenpää SURNAME_DUMMY ;
Määttä+N+Prop+Sem/Sur:Määttä SURNAME_DUMMY ;
Mustonen+N+Prop:Musto PROP_ITKONEN_sur ;
Nuorteva+N+Prop:Nuorteva PROP_SEM/SUR_MERJA ;
Näkkäläjärvi+N+Prop:Näkkäläjärvi PROP_SEM/SUR_TERHI ;
Porsanger+N+Prop+Sem/Sur:Porsanger SURNAME_DUMMY ;
Rantakeisu+N+Prop:Rantakeisu PROP_OULU ;
Ruotsala+N+Prop:Ruotsala PROP_SEM/SUR_MERJA ;
Saijets+N+Prop+Sem/Sur:Saijets SURNAME_DUMMY ;
Semenoja+N+Prop:Semenoja PROP_SEM/SUR_MERJA ;
Sivertsen+N+Prop+Sem/Sur:Sivertsen SURNAME_DUMMY ;
Tapiola+N+Prop:Tapiola PROP_SEM/SUR_MERJA ;
Rantala+N+Prop:Rantala PROP_SEM/SUR_MERJA ;
Valjakka+N+Prop:Valjakka PROP_SEM/SUR_MERJA ;
! -nen
Valtonen+N+Prop+Sem/Sur:Valtonen SURNAME_DUMMY ;
Väyrynen+N+Prop+Sem/Sur:Väyrynen SURNAME_DUMMY ;
Lappalainen+N+Prop:Lappalainen SURNAME_DUMMY ;
Pietarinen+N+Prop:Pietarinen SURNAME_DUMMY ;
Pirinen+N+Prop:Pirinen SURNAME_DUMMY ;
Koponen+N+Prop:Koponen SURNAME_DUMMY ;
Korhonen+N+Prop:Korhonen SURNAME_DUMMY ;
Hyttinen+N+Prop:Hyttinen SURNAME_DUMMY ;
Tuukkanen+N+Prop:Tuukkanen SURNAME_DUMMY ;
Manninen+N+Prop:Manninen SURNAME_DUMMY ;
Kaartinen+N+Prop:Kaartinen SURNAME_DUMMY ;
Valkonen+N+Prop:Valkonen SURNAME_DUMMY ;
Lesonen+N+Prop:Lesonen SURNAME_DUMMY ;
Keränen+N+Prop:Keränen SURNAME_DUMMY ;
Heikkinen+N+Prop:Heikkinen SURNAME_DUMMY ;
Toivainen+N+Prop:Toivainen SURNAME_DUMMY ;
Suoninen+N+Prop:Suoninen SURNAME_DUMMY ;
Seppänen+N+Prop:Seppänen SURNAME_DUMMY ;
Pohjonen+N+Prop:Pohjonen SURNAME_DUMMY ;
Nykänen+N+Prop:Nykänen SURNAME_DUMMY ;
Karjalainen+N+Prop:Karjalainen SURNAME_DUMMY ;
Joentakanen+N+Prop:Joentakanen SURNAME_DUMMY ;
Itkonen+N+Prop:Itkonen SURNAME_DUMMY ;
Hänninen+N+Prop:Hänninen SURNAME_DUMMY ;
Valtonen+N+Prop:Valto PROP_ITKONEN_sur ;
Väyrynen+N+Prop:Väyry PROP_ITKONEN_sur ;
Lappalainen+N+Prop:Lappalai PROP_ITKONEN_sur ;
Pietarinen+N+Prop:Pietari PROP_ITKONEN_sur ;
Pirinen+N+Prop:Piri PROP_ITKONEN_sur ;
Koponen+N+Prop:Kopo PROP_ITKONEN_sur ;
Korhonen+N+Prop:Korho PROP_ITKONEN_sur ;
Hyttinen+N+Prop:Hytti PROP_ITKONEN_sur ;
Tuukkanen+N+Prop:Tuukka PROP_ITKONEN_sur ;
Manninen+N+Prop:Manni PROP_ITKONEN_sur ;
Kaartinen+N+Prop:Kaarti PROP_ITKONEN_sur ;
Valkonen+N+Prop:Valko PROP_ITKONEN_sur ;
Lesonen+N+Prop:Leso PROP_ITKONEN_sur ;
Keränen+N+Prop:Kerä PROP_ITKONEN_sur ;
Heikkinen+N+Prop:Heikki PROP_ITKONEN_sur ;
Toivainen+N+Prop:Toivai PROP_ITKONEN_sur ;
Suoninen+N+Prop:Suoni PROP_ITKONEN_sur ;
Seppänen+N+Prop:Seppä PROP_ITKONEN_sur ;
Pohjonen+N+Prop:Pohjo PROP_ITKONEN_sur ;
Nykänen+N+Prop:Nykä PROP_ITKONEN_sur ;
Karjalainen+N+Prop:Karjalai PROP_ITKONEN_sur ;
Joentakanen+N+Prop:Joentaka PROP_ITKONEN_sur ;
Itkonen+N+Prop:Itko PROP_ITKONEN_sur ;
Hänninen+N+Prop:Hänni PROP_ITKONEN_sur ;
Jääskö+N+Prop:Jääskö PROP_KYROE_sur ;
Kyrö+N+Prop:Kyrö PROP_KYROE_sur ;
Niittyvuopio-Jämsä+N+Prop:Niittyvuopio-Jämsä PROP_HYPPAE_sur ;
Hyppä+N+Prop:Hyppä PROP_HYPPAE_sur ;
Hyyppä+N+Prop:Hyyppä PROP_HYPPAE_sur ;
Sipilä+N+Prop:Sipilä PROP_HYPPAE_sur ;
Mäenpää+N+Prop:Mäenpää PROP_HYPPAE_sur ;
Määttä+N+Prop:Määttä PROP_HYPPAE_sur ;
! STILL WORK NEEDED
Lindberg+N+Prop+Sem/Sur:Lindberg SURNAME_DUMMY ;
Porsanger+N+Prop+Sem/Sur:Porsanger SURNAME_DUMMY ;
Saijets+N+Prop+Sem/Sur:Saijets SURNAME_DUMMY ;
Sivertsen+N+Prop+Sem/Sur:Sivertsen SURNAME_DUMMY ;

Wesslin+N+Prop+Sem/Sur:Wesslin SURNAME_DUMMY ;
Wetterstrand+N+Prop+Sem/Sur:Wetterstrand SURNAME_DUMMY ;
Expand Down
1 change: 1 addition & 0 deletions src/scripts/smi-sms-conversion.pl
Original file line number Diff line number Diff line change
Expand Up @@ -30,6 +30,7 @@ BEGIN
s/(NIKOSIIJA|ACCRA|SIJTE|HAWAII)(\-plc)/PROP_TRUUBA$2/g ;
s/(NIKOSIIJA|ACCRA|SIJTE|HAWAII)(\-sur)/PROP_TRUUBA$2/g ;
s/^([^+]*\+)/$1N+Prop+/g ;
s/C-FI-NEN-sur/PROP_ITKONEN_sur/g ;
# s/BALAK/LONDON/g ;
# s/SKANIK/SULLOT/g ;
# s/RONDANE-LOAN/BERN/g ;
Expand Down

0 comments on commit 88a0b1e

Please sign in to comment.