老师可以说一下如何设置这个分词器吗?

来源:2-10 【项目文档】Hive、Hbase、ES、clickhouse表结构

Crazy酱汁

2022-07-27

看到有个脚本es_create_index.sh,但是es7直接跑报错
{
“error” : “Content-Type header [application/x-www-form-urlencoded] is not supported”,
“status” : 406
}

图片描述

写回答

2回答

小简同学

2022-07-28

同学你好,analysis是分词,也就是将文本切割为一个个单词的过程,analyzer(分词器)是analysis的实现,这里的analyzer,使用的是自定义的分词器,这个自定义分词器,命名为“imooc_tags”, 类型设置为 Pattern (正则表达式) 模式,这个Pattern指定为 |,也就是以 | 作为单词切割的依据,例如 "我|你",这样就切割为两个单词:我,你。祝学习愉快!

0
0

小简同学

2022-07-28

同学你好,这个脚本针对的es版本是es5,es7和es5有很大的不同,直接运行到es7会报很多错误的。你这个问题是es7增加了安全性的过滤,需要指定 Content-Type header 的类型,也就是这样子:curl -H "Content-Type:application/json" -XPUT "http://127.0.0.1:9200/imooc?pretty" -d '。但即使脚本能够运行,在es7还是会报错的,建议还是运行在 es5 版本下。祝学习愉快!

0
0

Spark+ES+ClickHouse 构建DMP用户画像

大数据主流技术,数据挖掘核心算法,用户画像完整知识轻松掌握

306 学习 · 219 问题

查看课程