Laravel开发简书es一章问题:无法搜索中文的词语
来源:9-7 使用laravel的Command实现搜索引擎索引和模版的建立

轩脉刃
2018-05-16
laravel开发简书搭建 elasticsearch 进行中文搜索的时候,你会发现,按照视频和 这篇文章: http://www.imooc.com/article/22449 的es:init 搭建完成并且使用 scout:import 导入数据之后,一篇文章包含“爱情”这个中文单词,但是我们搜索的时候,按照“爱” 进行搜索可以搜索出来,但是按照“爱情”搜索却搜索出来条数为0。
这里的原因并不是由于我们的分词错误。按照 http://www.imooc.com/article/22449 这篇文章的表示,我们的分词选择器使用的是 ik_max_word ,可以参考https://github.com/medcl/elasticsearch-analysis-ik 的说明,ik-max-word 会把文本按照字典切割出最多的单词。
问题是出在我们的查询上,我们跟踪
`$posts = \App\Post::search($query)->paginate(2);`
的源码,最终在vendor/tamayo/laravel-scout-elastic/src/ElasticsearchEngine.php 的里面可以看到
这里的query使用的是*{$builder->query}* 换句话说,如果我们搜索“爱情”的时候,它实际是搜索“*爱情*”。这个在中文分词插件ik中就会把带星号的词汇当作单词来进行搜索了(这个scout包这么写的原因也是因为没有考虑到文本分词)。
所以解决办法,把这里的星号给去掉。
就可以进行单词搜索了。
2回答
-
zjx2017
2018-05-16
好的!
00 -
西门夜说
2018-06-21
但是把*去掉了之后,又出现了数字找不到了。
122019-11-23
相似问题