From a7e61049c2306cecaba47afab5b5352ae98e74c5 Mon Sep 17 00:00:00 2001 From: Andriy Rysin Date: Mon, 27 Sep 2021 16:03:59 -0400 Subject: [PATCH] small changes, v5.5.2 --- VERSION | 3 +- data/dict/base.lst | 4 +-- distr/hunspell/build.gradle | 2 +- .../src/main/resources/extra_words.txt | 32 +++++++++++++++++++ out/stats/dict_stats.txt | 6 ++-- .../groovy/org/dict_uk/expand/Expand.groovy | 17 ++++++---- .../org/dict_uk/expand/ExpandTest.groovy | 26 +++++++++++---- test/dict/base.lst | 3 ++ 8 files changed, 73 insertions(+), 20 deletions(-) diff --git a/VERSION b/VERSION index 7acd1cb0..37d7c44c 100644 --- a/VERSION +++ b/VERSION @@ -1 +1,2 @@ -5.5.1 +5.5.2 + diff --git a/data/dict/base.lst b/data/dict/base.lst index 05d526b6..fe856a49 100644 --- a/data/dict/base.lst +++ b/data/dict/base.lst @@ -71586,8 +71586,8 @@ західництво /n2n західницький /adj західність /n30 -західніш adv:short -західніше adv +західніш adv:compc:short +західніше adv:compc західнобережний /adj західнодемократичний /adj західнодіаспорний /adj diff --git a/distr/hunspell/build.gradle b/distr/hunspell/build.gradle index 54aa81d7..1c4244ed 100644 --- a/distr/hunspell/build.gradle +++ b/distr/hunspell/build.gradle @@ -117,7 +117,7 @@ task getSpellWords (type: Exec) { inputs.files "${projectDir}/../../out/dict_corp_lt.txt" outputs.files "${projectDir}/build/words_spell.txt" - def cmd = "grep -vE \"noun:inanim:.:v_kly|(:inf|:3).*:short|:2:long|advp.*long|adv.*:comp.*:short|adj.*:long|:(bad|slang|alt|subst|arch|rare)|[.'] \"" + def cmd = "grep -vE \"noun:inanim:.:v_kly|(:inf|:3).*:short|:2:long|advp.*long|adv.*:short|adj.*:long|:(bad|slang|alt|subst|arch|rare)|[.'] \"" cmd += " ${projectDir}/../../out/dict_corp_lt.txt | cut -d ' ' -f 1 | sort -u > ${projectDir}/build/words_spell.txt" commandLine "sh", "-c", "${cmd}" diff --git a/distr/hunspell/src/main/resources/extra_words.txt b/distr/hunspell/src/main/resources/extra_words.txt index 85ad1de6..c5591a04 100644 --- a/distr/hunspell/src/main/resources/extra_words.txt +++ b/distr/hunspell/src/main/resources/extra_words.txt @@ -2212,3 +2212,35 @@ Мудриголів Паликорів Семигір +хочте +соколі +увіп'є +увіп'ємо +увіп'ємось +увіп'ємося +увіп'єте +увіп'єтесь +увіп'єтеся +увіп'ється +увіп'єш +увіп'єшся +увіпнемось +увіпнемося +увіпнетесь +увіпнетеся +увіпнеться +увіпнешся +увіпнись +увіпнися +увіпнімось +увіпнімося +увіпнімся +увіпніться +увіпнусь +увіпнуся +увіпнуться +увіп'ю +увіп'юсь +увіп'юся +увіп'ють +увіп'ються diff --git a/out/stats/dict_stats.txt b/out/stats/dict_stats.txt index 5122295f..8d43c7b1 100644 --- a/out/stats/dict_stats.txt +++ b/out/stats/dict_stats.txt @@ -1,5 +1,5 @@ -Всього лем: 416771 - словникових лем (без advp/bad/slang/alt, без омонімів imperf/perf) 337011 +Всього лем: 416766 + словникових лем (без advp/bad/slang/alt, без омонімів imperf/perf) 337006 Частоти за тегами: adj 103492 @@ -7,7 +7,7 @@ adj 103492 imperf 7710 nv 143 perf 11738 -adv 22315 +adv 22310 compb 1698 imperf 2 advp 65764 diff --git a/src/main/groovy/org/dict_uk/expand/Expand.groovy b/src/main/groovy/org/dict_uk/expand/Expand.groovy index 1a6ef1eb..1db86a06 100644 --- a/src/main/groovy/org/dict_uk/expand/Expand.groovy +++ b/src/main/groovy/org/dict_uk/expand/Expand.groovy @@ -1203,9 +1203,11 @@ class Expand { // forms += expand("щояк" + word, "/adj$extraFlags :comps" + idx + extra_tags) if( nayForms ) { - forms += createSimilar(nayForms, "що") - forms += createSimilar(nayForms, "як") - forms += createSimilar(nayForms, "щояк") + if( ! word.startsWith("й") ) { + forms += createSimilar(nayForms, "що") + forms += createSimilar(nayForms, "як") + forms += createSimilar(nayForms, "щояк") + } } // forms = forms.collect { DicEntry entry -> @@ -1277,10 +1279,11 @@ class Expand { } newExtraTags = newExtraTags.replace(':&predic', '') - forms += composeComparAdv("що" + word, "adv:comps" + newExtraTags) - forms += composeComparAdv("як" + word, "adv:comps" + newExtraTags) - - // if( word =~ /[^тд]ше$/ ) { + if( ! word.startsWith("й") ) { + forms += composeComparAdv("що" + word, "adv:comps" + newExtraTags) + forms += composeComparAdv("як" + word, "adv:comps" + newExtraTags) + } + // if( word =~ /[^тд]ше$/ ) { if( origWord.endsWith('ше') ) { String advIsh = origWord.replaceFirst(/ше$/, 'ш') forms += expandSubposAdv(advIsh, extraTags) diff --git a/src/test/groovy/org/dict_uk/expand/ExpandTest.groovy b/src/test/groovy/org/dict_uk/expand/ExpandTest.groovy index cabf918d..d5ab52d6 100644 --- a/src/test/groovy/org/dict_uk/expand/ExpandTest.groovy +++ b/src/test/groovy/org/dict_uk/expand/ExpandTest.groovy @@ -379,12 +379,26 @@ def multilineFull = '''.trim() - @Test - void testMultilineWithExtraTag2() { - def lines = ["вагомо adv \\", " +cs=вагоміше :coll"] - assertEquals(multilineFull21, join(expand.process_input(lines))) - } - + @Test + void testMultilineWithExtraTag2() { + def lines = ["вагомо adv \\", " +cs=вагоміше :coll"] + assertEquals(multilineFull21, join(expand.process_input(lines))) + } + + +def multilineFull22 = +''' +ймовірніше ймовірніше adv:compc +ймовірніш ймовірніше adv:compc:short +ймовірно ймовірно adv:compb +'''.trim() + + @Test + void testMultilineWithException() { + def lines = ["ймовірно adv \\", " +cs=ймовірніше"] + assertEquals(multilineFull22, join(expand.process_input(lines))) + } + def taggedIn = ''' diff --git a/test/dict/base.lst b/test/dict/base.lst index 7fab22d9..e6439bb7 100644 --- a/test/dict/base.lst +++ b/test/dict/base.lst @@ -288,3 +288,6 @@ аерований /adj.adv :&adjp:pasv:imperf:perf \ +cs=аерованіший + +ймовірно adv:&insert \ + +cs=ймовірніше