es排序问题

来源:10-13 【阶段总结】搜索2.0架构之搜索接入之基本调试

慕桂英6345398

2019-11-14

老师,我看到文章说 es 的 agg + sort + size(topn),如果数据在不同的分片,那么必须指定 shard_size = topn,否则按照默认的 size * 1.5 + 10 来收集各 shard 的聚合数据,主节点聚合的结果就会不准确。文章链接 https://cloud.tencent.com/developer/article/1435354
请问如果只是 sort + size,es 是否也会按照上面默认的公式来从各 shard 获取数据后再排序,然后导致排序错误?

写回答

2回答

龙虾三少

2019-11-14

这种情况在分布式的环境下很难避免 若设置太大的shard size则会导致网络和运算流量几何倍数增长 一般搜索要求的是第一页的数据足够准确

0
3
慕桂英6345398
回复
龙虾三少
好的,这就放心些。谢谢老师啦!
2019-11-14
共3条回复

慕桂英6345398

提问者

2019-11-14

这是否暗示,只用 sort + size 也会出现不准确的情况(如果不指定shard size的话)?

0
0

ES7+Spark 构建高匹配度搜索服务+千人千面推荐系统

ElasticSearch实现高相关性搜索,Spark MLlib实现个性化推荐

1384 学习 · 559 问题

查看课程