Elasticsearch的高阶使用方法有哪些?

518 阅读5分钟

今天是刘小爱自学Java的第160天。

感谢你的观看,谢谢你。

学习计划安排,关于搜索功能:

  • 搜索结果过滤的补充说明。

  • 布尔组合查询、范围查询…等多种高级查询。

  • 以及非常重要的聚合查询,其两种常用类型:桶和度量的说明与使用。

昨天学了match匹配和term匹配,这是两种最基础也很重要的查询方式,使用起来也简单。

一、结果过滤

补充一个知识点,关于结果过滤。

先将例子中索引库的数据做一个简单的说明,昨天的学习中也有详细介绍。

索引库liuxiaoai01中有title和price两个字段,添加了“小爱手机”、“大爱手机”、“超爱手机”和“小爱电视”一共4条数据。

如果不将结果过滤,在结果中会将title和price对应的数据都显示出来。

而通过"_source"就能指定字段,上图中指定了title字段,所以价格数据就被过滤掉了。

除了上述用法,还有两种用法

①includes的使用

includes翻译过来就是包含的意思。

根据其语义理解其作用,也就是说如果索引库中有多个字段,可以通过includes来指定想要显示的字段。

②excludes的使用

excludes翻译过来就是排除的意思。

也就是可以通过excludes指定不想要显示的字段,很好理解

二、高阶查询

1布尔组合查询

关键字是bool,它本身并不是一种查询方式,而是将查询方式通过逻辑运算组合起来了。

①must

翻译过来就是必须的意思,可以填写多个查询条件(中括号本身表示的也就是数组)

多个查询条件通过must连接,相当于以前常用的and,说白了也就是逻辑运算符“与”。

②must_not

刚好就和上述must相反,说白了也就是逻辑运算符“与”。

③should

通用的道理:多个查询条件通过should连接,相当于以前常用的or,说白了也就是逻辑运算符“与”。

ps:关于其格式使用,不要看它图中好像挺复杂的样子,其实都可以通过工具有提示,并且这些写多了基本也就知道了。

2范围查询

商品都有自己的价格,用户可以通过设定价格区间搜索到对应的商品。

range就可以实现范围查询,其中通过四种字符说明查询的区间。

  • gt:表示大于
  • get:表示大于等于
  • lt:表示小于
  • lte:表示小于等于

3模糊查询

实际应用中用户搜索时输入的词条与实际词条存在偏差,但也能搜索到对应的数据,这就需要使用到模糊查询了。

关键字是fuzzy,翻译过来也就是模糊的。

上述例子中,我添加了一个apple数据,查询的时候通过appla就可以模糊查询到,但是偏差的编辑距离不能超过2,其中也可以通过fuzziness来指定允许的编辑距离。

此外还有过滤,排序这些操作,并且上述这些操作一般都是组合起来使用的,其实无外乎就是记住关键字:

  • 关于过滤对应的也就是filter。
  • 关于排序也就对应着sort。

三、聚合aggregations

Elasticsearch中的聚合包含多种类型,最常用的有两种:

①桶(bucket)

其实蛮好理解的,比如上海现在一直在执行的垃圾分类,就有多个桶:干垃圾桶、湿垃圾桶、有害垃圾桶以及可回收物桶。

所以桶的作用就在于按照某种方式对数据进行分组,它只负责分组,不进行运算。

②度量(metrics)

也就是我们以前学的聚合函数,比如求平均值、最大值、最小值以及求和…等这些运算。

2聚合的使用

在使用之前,我们需要创建一个索引库并添加数据,作为聚合的测试数据。

cars索引库,有color和make两个字段,字段类型都为keyword,也就是不分词。

也就是关于汽车的一个索引库,有颜色和生产商这两个字段。

根据我们这两天的学习情况就可以简单地实现,具体添加了哪些数据就不做说明了。

桶的使用

size表示是查询条数,我这里设置为1,主要在于一个了解,重点在于聚合结果。

aggs也就是聚合aggregations的简写,说明这是一个聚合查询:

  • popular_make:聚合名,这是自定义的一个名称,尽量见名知义即可。
  • terms:划分桶的方式,有多种方式,这里是根据词条划分。
  • field:划分桶的字段,这里根据make划分。

这样聚合之后,索引库中的数据就根据field这个字段划分成了4个桶:例子中也就是"honda"、"ford"、"toyota"、"bmw"。

elasticsearch中关于桶的划分方式有多种:

  • Date Histogram:根据日期分组。
  • Historgram:根据数值分组。
  • Terms:根据词条内容分组,也就是上述使用的。
  • Range:数值和日期的范围分组。
  • ……等等多种方式。

度量的使用

认真观察①和②会发现它们的格式就是一样的,格式无外乎就是4步骤:

  • aggs说明是聚合查询。
  • 给这个聚合自定义一个名称。
  • 说明聚合类型:①中terms是桶的类型,②中avg是度量的类型。
  • field说明聚合字段:①中根据make划分成多个桶,②中求桶中price字段的平均值。

上述例子也能看出聚合之间能嵌套使用。

elasticsearch中度量的划分方式也有多种:

Avg求平均值;Max求最大值;Min求最小值;Sum求和……等等多种度量聚合方式

当然关于聚合的使用,spring集成了一个子模块Spring Data Elasticsearch,在Java中使用起来更简单,具体后续说明。

最后

行有不得反求诸己,我是@刘小爱

一个白天上班晚上学习的95后沪漂,不为其它,只为学会自律做好自己,也愿我的每日打卡能给你带来勇气,欢迎点赞关注和评论。

本文使用 mdnice 排版