All Versions
16
Latest Version
Avg Release Cycle
185 days
Latest Release
1299 days ago

Changelog History
Page 2

  • v0.3.3 Changes

    April 12, 2013
    • Исправлен тег, который выдает RomanNumberAnalyzer (теперь это ROMN, как в OpenCorpora);
    • добавлена функция pymorphy2.tokenizers.simple_word_tokenize, которая разбивает текст по пробелам и пунктуации (но не дефису);
    • исправлена ошибка с разбором слов вроде "ретро-fm" (pymorphy2 раньше падал с исключением).
  • v0.3.2 Changes

    April 03, 2013
    • добавлен RomanNumberAnalyzer для разбора римских чисел;
    • MorphAnalyzer и OpencorporaTag теперь можно сериализовывать с помощью pickle;
    • улучшены тесты;
    • при компиляции словаря версия xml печатается раньше.
  • v0.3.1 Changes

    March 12, 2013
    • Поправлен метод MorphAnalyzer.word_is_known, который раньше учитывал регистр слова (что неправильно);
    • исправлена ошибка в разборе слов с дефисом (тех, у которых лишний дефис справа или слева).
  • v0.3 Changes

    March 11, 2013
    • Рефакторинг: теперь при необходимости можно дописывать свои "шаги" морфологического анализа ("предсказатели") и комбинировать их с существующими (документация пока не готова, и API может поменяться);
    • на вход больше не обязательно подавать слова в нижнем регистре (но на выходе при этом регистр сохраняться не обязан - используйте функцию pymorphy2.shapes.restore_word_case, если требуется восстановить регистр полученных слов);
    • улучшено предсказание неизвестных слов по словообразовательным префиксам (учитывается больше таких префиксов);
    • реализован разбор (и склонение) слов с дефисами;
    • результаты разбора теперь включают в себя полную информацию о том, как слово разбиралось; наличие para_id и idx при этом больше не обязательно;
    • анализатор теперь отмечает пунктуацию тегом PNCT, числа - тегом NUMB, слова, записанные латиницей - тегом LATN;
    • улучшено предсказание по неизвестному префиксу (добавлено ограничение по граммеме Apro);
    • улучшения в тестах и бенчмарках;
    • удален атрибут morph.dict_meta (используйте morph.dictionary.meta);
    • удален (возможно, временно) метод MorphAnalyzer.inflect (используйте метод inflect у результата разбора);
    • 📜 удален метод MorphAnalyzer.decline (используйте parse.lexeme);
    • 📜 удалено свойство Parse.paradigm.

    В результате этих изменений улучшилось качество разбора, качество склонения и возможности по расширению библиотеки (втч для настройки под конкретную задачу), но скорость работы "из коробки" по сравнению с 0.2 снизилась примерно на треть.

  • v0.2 Changes

    February 18, 2013
    • Улучшения в предсказателе: учет словоизменительных префиксов;
    • улучшения в предсказателе: равноценные варианты разбора не отбрасываются;
    • изменена схема проверки совместимости словарей;
    • изменен формат словарей (нужно обновить pymorphy2-dicts до 2.0);
    • 📜 добавлено свойство Parse.paradigm.
  • v0.1 Changes

    February 14, 2013

    Первый альфа-релиз. Релизована основа: эффективный разбор и склонение, обновление словарей, полная поддержка буквы ё.

    Многие вещи, которые были доступны в pymorphy, пока не работают (разбор слов с дефисом, разбор фамилий, поддержка шаблонов django, утилиты из contrib).

    Кроме того, API пока не зафиксирован и может меняться в последующих релизах.