Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Синтаксический парсинг: рекурсия, связность и другие вольности #8

Open
saarus72 opened this issue Jun 22, 2021 · 0 comments

Comments

@saarus72
Copy link

saarus72 commented Jun 22, 2021

На сайте CoNLL-U сказано, что "The HEAD and DEPREL values define the basic dependencies which must be strictly a tree." Дерево, как мы знаем, это связный граф без циклов. Словнет, при всей своей маленькости, позволяет себе и не-связность, и циклы.

Например, для предложения "Не знаю, что и сказать, мистер Холмс" получается что-то вроде такого:

      ┌►  1 Не                   PART  advmod
┌─────└─  2 знаю                 VERB  
│ ┌────►  3 ,                    PUNCT punct
│ │ ┌──►  4 что                  SCONJ obj
│ │ │ ┌►  5 и                    PART  advmod
│ └─└─└─  6 сказать              VERB  
│   └──►  7 ,                    PUNCT punct
└────►┌─  8 мистер               NOUN  nsubj
      └►  9 Холмс                PROPN appos

Или так.
image
Токен "сказать", страшно сказать, имеет самого себя в head. Наверное, это считается за рекурсию, но другой пример с рекурсией, честное слово, найти несложно.

Я полагаю, всё это следствие того, что нейронка творит что хочет. Юдипайп такого ожидаемо не творит. Диппавлов делает так же?

Есть идеи, как это можно обойти после инфера? Вероятности брать не максимальные, а комплексно, пробегая вероятностной моделью, например.

Идеи, как это обойти, иначе обучая?

Планы сделать первое или второе в обозримом будущем?

@saarus72 saarus72 changed the title Синтаксический парсинг: рекурсия, Синтаксический парсинг: рекурсия, связность и другие вольности Jun 22, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant