-
Notifications
You must be signed in to change notification settings - Fork 12
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
mwe: já não #98
Comments
@livyreal |
CP911-6 como está:
como fica:
|
@livyreal este e' um exemplo generico? Todos os "ja's" devem se conectar via |
sim. |
@livyreal seu exemplo está errado token 10 está apontando para o próprio token 10. |
obrigada, @arademaker! como está:
como fica:
|
@livyreal features ficam nulas mesmo? Não lembro por que estamos insistindo em manter no campo misc estes valores MWE e MWEPOS. E o campo misc não pode ter espaço, se formos manter isso, preicsamos de um separador, talvez o mesmo |
não há nada nas mudanças de V2 que indicam uma nova marcação de quais são as expressões MWE então mantemos o span da mwe e também o general POS tag, como era em V1. Já era assim, mas nosso corpus estava incompleto. De fato tem a feature Finalmente deve ficar:
|
@livyreal não entendi seu argumento!! Talvez seja melhor falarmos. Podemos pelas dependências recuperar a MWE original sim, não perdemos nada ao jogar fora estes valores MWE e MWEPOS do campo misc, eu acho. |
MWEPOS é o campo mais importante de todos... pq é ele que é relevante para a deprel que vai ligar a MWE ao resto da sentença! Se for uma mwe NOUN, ela pode participar da deprel Não dá pra jogar fora não. a MWE pós até daria mas não vejo pq já que as guidelines dizem isto e nós estamos com o corpus todo correto neste sentido. |
@livyreal por mais que eu goste da idéia de ter um sistema de tipos nas relações que pudessem garantir que uma dada relação pede determinadas POS tags nos seus extremos, nada nas documentações ou no script validate.py sugere que este tipo de validação seja feita. Não temos os valores de MWE consistentes não, dado exatamente o caso #23. Acho que manter coisas que não são pedidas e podem ser recuperadas é tornar o trabalho de manutenção mais trabalhoso do que o necessário. |
só pra constar, depois do comentário acima do @arademaker , escrevi para a lista de UD (MWEPOS é o assunto do e-mail) e discutimos extensivamente como e onde marcar MWEPOS e MWEspan. MWEspan é redundante, mas MWEPOS é necessário (ainda que um parser comum não vá considerar estas expressões). já que temos todas as MWEspan no corpus e falta algumas MWEPOS, decidimos por manter as duas, já que a informação reducante está correta. |
@livyreal sim, documentar é bom. Correções: não temos um valor |
gostaria de re-abrir esse issue pra perguntar: perdemos a marcacao de negativity entao completamente? |
A negativity foi transferida para a feature |
podemos fechar? |
@vcvpaiva do you have concrete examples? The v2 UD spec removed the relation 'neg', it was not our decision. But we can argue if we understand the concrete cases that justify the limits of polarity alone for characterize negations |
claro que eu sei que a decisao foi deles @arademaker. veja no corpus SICK 1 Nobody nobody NOUN NN _ 3 nsubj _ PRP|?|? there is nothing indicating a negation, but that is there, right? Now, the difference of having a word marked as Polarity=Neg versus a relation, is that the relation at least gives you some indication of where the scope of your negation is, while a word marked, does not. But NO, there is no reason to take this to the UD guys, who know this fairly well. |
The scope of the negation can be the subtree of the given node. Not true that using |
"já não" está tageado errado. não deveria ser ADV e a relação entre eles deveria ser "mwe".
aqui então temos que pegar todos os "já não" que são MWE e mudar a pós de "não NOUN" para "não ADV", a MWEPOS geral é ADV; a
deprel
de "não" aponta para "já" pormwe
e a deprel dejá
aponta para a mesma coisa que "não" apontava" pela relação "neg".Como era:
Como fica
@concordam, @vcvpaiva e @claudiafreitas ?
The text was updated successfully, but these errors were encountered: