-
Notifications
You must be signed in to change notification settings - Fork 12
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
negative PARTicles #71
Comments
Checked the negative particles in UD-PT using query PART in http://universaldependencies.org/svalidation.html, while "A não ser que, não só, não obstante" seem to me reasonable mwes, "já não" particularly in |
@vcvpaiva estou tentando fechar algumas issues esta semana. "Já não" me parece ok para uma mwe de negação, como "não só", são composicionais, mas ainda são mwe. Qual o ponto exatamente desta issue? Veja, mesmo dentro de uma mwe, as partículas negativas deveriam estar anotadas como PART, pois dentro de uma mwe, ainda cada palavra tem a sua POS. Verifiquei aqui como andam as partículas negativas dentro de MWE. Algumas são etiquetadas como NOUN e outras como ADV: [Bosque-ud-train]
Para mim, é estranho tagear "não" como PART e não como ADV, mas as guidelines me parecem suficientes claras para tagearmos "não" como PART. Assim o que resolve este issue é tagear as partículas negativas dentro de mwe de NOUN e ADV para PART. É isto? |
@livyreal eu estava tentando verificar porque tem mais PARTs no UD-Portuguese do que no Portuguese-Bosque. e a razao sao os "nao" que estao marcados no UD-Portuguese como parte de uma mwe, como as que eu mostrei. pra verificar procure por PART no corpus UD-PT. algumas das mwes me parecem estranhas, mas no PT-Bosque nao temos essas mwes. dai que se voce acha que essas mwes estao corretas, precisamos adiciona-las ao PT-Bosque, com a tag PART, como voce disse. pelo que entendo nao temos nenhuma PART=nao no PT-Bosque, correto? |
decidimos anotar "não" como ADV e prefixos estão como PART #46 |
mas @claudiafreitas tem 39 parts=NAO que precisam ser transformadas em ADV entao. e' pra fechar esse issue sem te-lo feito? |
@vcvpaiva eu não achei nenhum deles, vc pode listá-los? @claudiafreitas pensei em um exemplo do uso de "não" como PART, não tem no corpus, mas posso já deixar claro nas diretivas. "não-lugar", "não ser". O que vc acha? |
@livyreal eu sei q tem 19 por causa das stats, que dao 19 naos como PART no UD-Portuguese e nenhum no Portuguese-Bosque. mas sei como lista-los sim, coloco a lista aqui mais tarde. |
ok, então no nosso não tem nada errado!? por isto que a issue tinha sido fechada então :) |
@livyreal , nao precisa ir longe... talvez haja não-fumante. Concordo em termos o "não", nesse caso, como PART.. Já que se trata de caso ´próximo a neo-realismo. |
@livyreal o exemplo que eu dei
no nosso corpus 'nao' esta' marcado como NOUN, o que faz desaparecer a negacao!! tem 40 casos desses, pelo menos. se voce olhar 'neg' nas stats vai uma diferenca maior: pra fechar esse issue, tem que abrir individuais pra "Já não", "nao obstante", etc..
sim, concordo completamente. mss entao preciamos achar e consertar os 40 naos que nao aparecem no Bosque, mas aparecem na versao UD-PT,ne? |
@livyreal os outros problemas dos 40 NEG PART que nao temos no PT-Bosque. o que eu fiz: olhei no UD_PT PART, tem 44 aparentemente. nao olhei os prefixos, mas olhei os NEG, pois se nao temos nenhum PART neg no Bosque, esses 40 PART nao devem estar mal marcados. alem de "ja' nao" e de "nao obstante" achei duas mwes: "a_não_ser_que" e "não só".
"a nao ser que" tem ser= noun in "a nao ser que"???? em
|
e mais "não só" mwe tambem?
|
oi @vcvpaiva , acho que sim, são dois issues diferentes, o "não só" e o "a não ser que". o "não só" será como o já não, em #98. vc quer abrir, por favor? já o "a não ser que", acho que ele será Valeria, o que vc chama de colar bonitinho da interface de TUrku? Colar as árvores? Acho que só dá usando print. |
tb eu fecho esse issue, ja' que abrimos dois novos pras mwes que eu sei que estao erradas. mas veja que o numero de negativas 'e diferente nos dois corpora por quase 100, acho que as mwes nos dao uns 40. o que acontece com os outros 60? alguma sugestao? acho que 'e capaz de ser coisas que nem "nem feijao ele podia comprar" ou "nada funcionava". enfim.. e obrigada, o colar de janelas conll funciona pra mim tb! |
Associated with #69 . Negative particles as described in https://github.com/own-pt/bosque-UD/blob/master/ud-docs/_pt-pos/PART.md do not show up at all in the Portuguese-Bosque. this is odd as Zeman's version of the corpus has 39 of these. need to see if these 39 are mistagged now.
Related to number 32 in list at #69 http://universaldependencies.org/svalidation.html
The text was updated successfully, but these errors were encountered: