pymorphy2 v0.3 Release Notes

Release Date: 2013-03-11 // about 11 years ago
    • Рефакторинг: теперь при необходимости можно дописывать свои "шаги" морфологического анализа ("предсказатели") и комбинировать их с существующими (документация пока не готова, и API может поменяться);
    • на вход больше не обязательно подавать слова в нижнем регистре (но на выходе при этом регистр сохраняться не обязан - используйте функцию pymorphy2.shapes.restore_word_case, если требуется восстановить регистр полученных слов);
    • улучшено предсказание неизвестных слов по словообразовательным префиксам (учитывается больше таких префиксов);
    • реализован разбор (и склонение) слов с дефисами;
    • результаты разбора теперь включают в себя полную информацию о том, как слово разбиралось; наличие para_id и idx при этом больше не обязательно;
    • анализатор теперь отмечает пунктуацию тегом PNCT, числа - тегом NUMB, слова, записанные латиницей - тегом LATN;
    • улучшено предсказание по неизвестному префиксу (добавлено ограничение по граммеме Apro);
    • улучшения в тестах и бенчмарках;
    • удален атрибут morph.dict_meta (используйте morph.dictionary.meta);
    • удален (возможно, временно) метод MorphAnalyzer.inflect (используйте метод inflect у результата разбора);
    • 📜 удален метод MorphAnalyzer.decline (используйте parse.lexeme);
    • 📜 удалено свойство Parse.paradigm.

    В результате этих изменений улучшилось качество разбора, качество склонения и возможности по расширению библиотеки (втч для настройки под конкретную задачу), но скорость работы "из коробки" по сравнению с 0.2 снизилась примерно на треть.