IK分词器是什么
- Elasticsearch 中常用的一款中文分词插件
能够干嘛
- 中文分词:能够将中文文本按照语义和语法规则切分成词语
- 提高搜索准确性:通过更合理的分词,使得在搜索时能够更准确地匹配用户输入的关键词和文档中的内容,从而提高搜索结果的相关性和准确性。
- 自定义词库:可以根据自己的业务需求,添加自定义的词汇到分词器的词库中。
安装IK分词器(需要和Elasticsearch版本一样)
-
下载解压到elasticsearch文件下的plugins文件夹下,然后重启elasticsearch

-
使用kibana测试
- ik_smart:最少切分,保留词语的完整性

- ik_max_word: 最细粒度划分,能获得更加精确的分词结果

- ik_smart:最少切分,保留词语的完整性
-
自定义词库
- 输入

- 发现被拆分了,因为词典没有这个词这种自己需要的词,需要加到分词器的词典中
- 增加自己需要的词
- 找到IKAnalyzer,cfg,xml

- 添加自己的词典名

- 创建自己的词典

- 输入
重启elasticsearch,
然后就能识别到了
