MMSeg一个基于最大匹配算法的两种变体的中文单词识别系统。是中文分词中一个常见的、基于词典的分词算法(作者主页:HTTP://chtsai.org/index_tw.HTML),简单、效果相对较好。由于它的简易直观性,实现起来不是很复杂,运行速度也比较快。

MMSeg 算法有两种分词方法:Simple和CompLex,都是基于正向最大匹配。Complex 加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。

Python中文分词实现方法(安装pymmseg)
本篇内容主要为大家讲解的是Python中文分词实现方法(安装pymmseg)。感兴趣的同学可以参考学习下,具体内容如下文:

发布于 2016-06-25 14:01:40 | 129 次阅读


Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务