操作步骤
1、进入elasticsearch的plugin,进入ik。进入config。
2、在config下面建立以.dic为后缀的字典。在建立的时候一定要注意文本的报错格式,请保存为utf-8格式的,其他格式不能使用。文件如果在linux中通过vi生成,则不用管格式。可以直接使用。
3、建立好后,在里面输入我们的扩展词语。每个扩展词语一行。
4、维护好字典后,编辑IKAnalyzer.cfg.xml。
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典,多个字典使用;号进行隔开 -->
<entry key="ext_dict">custom.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">custom.dic</entry>
</properties>
所谓停止词字典,就是说如果遇到该词请不要认为是一个词。
5、重启后,分词效果即生效。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。