Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

extract additional ditransitive verbs #69

Closed
leoalenc opened this issue Jan 30, 2022 · 3 comments
Closed

extract additional ditransitive verbs #69

leoalenc opened this issue Jan 30, 2022 · 3 comments
Assignees
Labels
enhancement New feature or request

Comments

@leoalenc
Copy link
Contributor

leoalenc commented Jan 30, 2022

Como desdobramento de #19, esta issue objetiva:

  1. Expandir a hierarquia de tipos com a inclusão de tipos adicionais de verbos bitransitivos com argumentos nominais, uma vez que a gramática se limita atualmente a verbos bitransitivos desse tipo com primeiro argumento no acusativo (acc) e segundo argumento marcado com o caso recipient (rec), goal (goa) ou dative (dat), por exemplo, doar.
  2. Povoar essa hierarquia com entradas extraídas automaticamente do UD Bosque.
  3. Avaliar manualmente a correção das entradas, seguindo o que foi feito em evaluate entries automatically extracted from Bosque #66.
  4. Construir sentenças com as novas variantes de verbos e avaliar os resultados do parsing dessas sentenças.

Com esta issue, deverão ser analisados exemplos simplificados análogos a estes do UD Bosque:

Computador na sala de aula não salva ninguém da ignorância.
No final do último ano, Coelho dividiu a cena com o tenor espanhol Plácido Domingo.
[...] os homens públicos exigem dos candidatos a solução de problemas nacionais [...]
O mercado brasileiro de cigarros apresentou uma queda de 6,5% com o total de unidades vendidas passando de 127,8 bilhões em 92 para 119,5 bilhões no ano passado.

@leoalenc leoalenc added the enhancement New feature or request label Jan 30, 2022
@leoalenc leoalenc self-assigned this Jan 30, 2022
leoalenc added a commit that referenced this issue Jan 30, 2022
@leoalenc
Copy link
Contributor Author

Com 7da90ec, adicionei 72 novas entradas geradas automaticamente a partir de dados do UD Bosque. Essas entradas seguem o formato proposto em #56. Exemplo:

discutir_v2 := nom-acc-com-ditransitive-verb-lex &
  [ STEM < "discutir" >,
    SYNSEM.LKEYS.KEYREL.PRED "_discutir_v_2_rel" ]
  """
  Britto já informou a Streck que é favorável, mas ficou de discutir a questão com o PMDB gaúcho.
  """. 

@leoalenc
Copy link
Contributor Author

leoalenc commented Feb 1, 2022

  1. Avaliar manualmente a correção das entradas, seguindo o que foi feito em evaluate entries automatically extracted from Bosque #66.

265f7b6 resolve a tarefa 3. Detectei 18 erros nas 72 entradas geradas automaticamente, perfazendo 75% de acurácia.

leoalenc added a commit that referenced this issue Feb 2, 2022
@leoalenc
Copy link
Contributor Author

leoalenc commented Feb 2, 2022

Em 922f6ba, incluí resultados do parsing das seguintes sentenças, que exemplificam os novos tipos criados com esta issue:

634 o artista dividiu a cena com a estudante 1 226
635 tive de dividir os alunos em grupos 4 1829
636 ele ficou de discutir a questão com a professora 1 740
637 eles querem revestir o piso com madeira 1 565
638 comentei os beijos com uma amiga 1 125
639 as aulas combinam teoria com prática 1 162
640 os hospitais consumiam uma fortuna com internações 1 148
641 ele trocaria a preocupação por a descontração 1 196
642 ele culpou o artista de homicídio 1 384
643 o juiz converteu a prisão em multa 4 251
644 o jogador falou uma bobagem sobre o time 1 314
645 o país passou de euforia para depressão 4 688

Essas sentenças baseiam-se nos exemplos do treebank UD_Portuguese-Bosque, inseridas como docstrings em new-ditrans.tdl. Por exemplo:

dividir_v7 := nom-acc-com-ditransitive-verb-lex & ; FER
  [ STEM < "dividir" >,
    SYNSEM.LKEYS.KEYREL.PRED "_dividir_v_7_rel" ]
  """
  No final do último ano, Coelho dividiu a cena com o tenor espanhol Plácido Domingo.
  """. 

dividir_v6 := nom-acc-ine-ditransitive-verb-lex & ; FER
  [ STEM < "dividir" >,
    SYNSEM.LKEYS.KEYREL.PRED "_dividir_v_6_rel" ]
  """
  Tive de dividir os homens em grupos mais pequenos.
  """. 

consumir_v3 := nom-acc-com-ditransitive-verb-lex & ; LEO
  [ STEM < "consumir" >,
    SYNSEM.LKEYS.KEYREL.PRED "_consumir_v_3_rel" ]
  """
  Uma das consequências disso é outra aberração na saúde brasileira: em 1991, os hospitais psiquiátricos cadastrados à rede federal consumiam 7,5% das despesas com internações realizadas pelo SUS e representavam o equivalente a 18% dos leitos.
  """. 

culpar_v3 := nom-acc-gen-ditransitive-verb-lex & ; FER
  [ STEM < "culpar" >,
    SYNSEM.LKEYS.KEYREL.PRED "_culpar_v_3_rel" ]
  """
  O Conselho de Arbitragem da Associação de Futebol de Lisboa apoiou ontem Jorge Coroado e contestou a Comissão de Arbitragem da Liga Portuguesa de Futebol Profissional, que excluiu aquele árbitro do jogo FC Porto-V.Guimarães depois de ter montado um esquema para culpar Coroado de fugas de informação.
  """. 

passar_v10 := nom-gen-goa-ditransitive-verb-lex & ; BOR
  [ STEM < "passar" >,
    SYNSEM.LKEYS.KEYREL.PRED "_passar_v_10_rel" ]
  """
  O mercado brasileiro de cigarros apresentou uma queda de 6,5% com o total de unidades vendidas passando de 127,8 bilhões em 92 para 119,5 bilhões no ano passado.
  """.  

@leoalenc leoalenc closed this as completed Feb 2, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

1 participant