ImportError: cannot import name ‘TagMorphTokenizer’ from ‘yargy.tokenizer’
В своих проектах ( New.HR, GeekJob.ru ) я использую библиотеку для извлечения фактов Natasha.
Natasha — библиотека для поиска и извлечения именованных сущностей (Named-entity recognition) из текстов на русском языке. В библиотеке собраны грамматики и словари для парсера Yargy.
Написана она на питоне и очень не плохо показывает себя. Есть свои косяки и недочеты, но эта библиотека у меня работает в связке с эвристиками и другими библиотеками. Так вот к чему это я. После недавнего обновления вдруг перестал запускаться парсер выдавая ошибку:
ImportError: cannot import name ‘TagMorphTokenizer’ from ‘yargy.tokenizer’
Если вы столкнулись с этой проблемой, то лечится это следующим образом:
pip install natasha==0.10.0 yargy==0.11.0
Ишью по этому поводу создано. Для тех кто не знал — попробуйте, интересная опенсорс разработка для обработки неструктурированных текстов.
Доументация по библиотеке http://natasha.readthedocs.io/ru/latest/