对于无序的英文编号如何进行分词呢

来源:3-11 -自定义分词

颐和园的昆

2018-07-10

对于商品的编码如何进行分词 如8JO 99 99Y UDS 应该如何分词和检索呢

写回答

2回答

rockybean

2018-07-10

如果你要解决空格的问题,可以用下面这种自定义分词的方法


GET _analyze

{

  "char_filter": [

    {

      "type": "pattern_replace",

      "pattern": "\\s",

      "replacement": ""

    }

  ],

  "tokenizer": {

    "type": "ngram",

    "min_gram": 3,

    "max_gram":11

  },

  "text": "8JO 99 99Y UDS"

}


0
1
颐和园的昆
好的老师 我目前是在java程序中去除的空格,然后按照ngram 3+3的方式进行分词。查询的时候用的simple_query_string 在程序中根据长度/3 拼加号 如8JO+99 99Y+UDS 然后问题解决了 谢谢老师
2018-07-10
共1条回复

rockybean

2018-07-10

如何分词要看你的需求?

业务需求要求如何搜索呢?

0
8
rockybean
回复
颐和园的昆
学会用 _analyze 接口查看分词后的结果,方便对结果进行分析
2018-07-10
共8条回复

Elastic Stack从入门到实践,动手搭建数据分析系统

有了Elastic Stack,不用写一行代码,你也可以玩转大数据分析!

1367 学习 · 397 问题

查看课程