All Versions
30
Latest Version
Avg Release Cycle
136 days
Latest Release
635 days ago

Changelog History
Page 3

  • v0.24 Changes

    December 28, 2012

    1) 解决了没有标点的长句子分词效果差的问题,问题在于连续的小概率乘法可能会导致浮点下溢或为0. 2) 修复了0.23的全模式下英文分词的bug

  • v0.23 Changes

    December 12, 2012

    1) 修复了之前版本不能识别中英混合词语的问题

  • v0.22 Changes

    November 28, 2012

    1) 新增jieba.cut_for_search方法, 该方法在精确分词的基础上对“长词”进行再次切分,适用于搜索引擎领域的分词,比精确分词模式有更高的召回率。 2) 开始支持Python3.x版。 之前一直是只支持Python2.x系列,从这个版本起有一个单独的jieba3k

  • v0.21 Changes

    November 23, 2012

    1) 修复了全模式分词中散字过多的问题 2) 用户自定义词典函数load_userdict支持file-like object作为输入

  • v0.20 Changes

    November 06, 2012

    1) 新增词性标注功能

  • v0.19 Changes

    October 25, 2012

    1) 提升了模块加载的速度 2) 增加了用户自定义词典的接口

  • v0.18 Changes

    October 16, 2012

    1) 增加关键词提取功能

  • v0.17 Changes

    October 12, 2012

    1) 将词典文件dict.txt排序后存储,提升了Trie树构建速度,使得组件初始化时间缩短了10%; 2) 增强了人名词语的训练,增强了未登录人名词语的识别能力

  • v0.16 Changes

    October 09, 2012

    1)将求最优切分路径的记忆化递归搜索算法改用循环实现,使分词速度提高了15%

    2) 修复了Viterbi算法实现上的一个Bug

  • v0.14 Changes

    October 07, 2012

    1) 结巴分词被发布到了pypi,用户可以通过easy_install或者pip快速安装该组件; 2) 合并了搜狗开源词库2006版,删除了一些低频词 3) 优化了代码,缩短了程序初始化时间。 4) 增加了在线效果演示