jieba.NET 特点 介绍
jieba.NET 是 jieba 中文分词的 .NET 版本(C#实现)。当前版本为
0.37.1,基于 jieba 0.37,目标是提供与 jieba 一致的功能与接口,但以后可能会在 jieba
基础上提供其它扩展功能。当前主要提供分词、词性标注和关键词提取功能。
特点
-
支持三种分词模式:
-
精确模式,试图将句子最精确地切开,适合文本分析;
-
全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
-
搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
-
-
支持繁体分词
-
支持自定义词典
-
MIT 授权协议
jieba.NET 特点 官网
https://github.com/anderscui/jieba.NET/
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。