Elasticsearch查询及聚合类DSL语句宝典
作者:京东科技 纪海雨
前言
随着使用es场景的增多,工作当中避免不了去使用es进行数据的存储,在数据存储到es当中以后就需要使用DSL语句进行数据的查询、聚合等操作,DSL对SE的意义就像SQL对MySQL一样,学会如何编写查询语句决定了后期是否能完全驾驭ES,所以至关重要,本专题主要是分享常用的DSL语句,拿来即用。
一、match
如果match 查询数字,日期,布尔值或者not_analyzed 的字符串时,会精确匹配搜索值,不做分词解析;如果match 查询全文本,会对查询词做分词解析,然后搜索。
比如对keyword 类型的tag 查询,"京东总部"不会分词,必须完全相等的词才会被搜索出来
{a
"query": {
"match": {
"content" : {
"tag" : "京东总部"
}
}
}
}
比如"宝马多少马力"会被分词为"宝马 多少 马力", 所有有关"宝马 多少 马力", 那么所有包含这三个词中的一个或多个的文档就会被搜索出来。并且根据lucene的评分机制(TF/IDF)来进行评分
{
"query": {
"match": {
"content" : {
"query" : "宝马多少马力"
}
}
}
}
二、match_phrase
如果想要精确匹配所有同时包含"宝马 多少 马力"的文档,就要使用 match_phrase 了
{
"query": {
"match_phrase": {
"content" : {
"query" : "宝马多少马力"
}
}
}
}
三、mult_match
如果我们希望两个字段进行匹配,其中一个字段有这个文档就满足的话,使用multi_match
{
"query": {
"multi_match": {
"query" : "我的宝马多少马力",
"fields" : ["title", "content"]
}
}
}
四、term
关键字精确匹配,不分词解析。注意 term 包含(contains) 操作,而非 等值(equals)判断。如果文档包含full_text 及其他词,也会命中返回。
使用term要确定的是这个字段是否“被分析”(analyzed),默认的字符串是被分析的。
比如下面的例子,其中的full_text是被分析过的,所以full_text的索引中存的就是[quick, foxes],而extra_value中存的是[Quick Foxes!]
PUT my_index
{
"mappings": {
"my_type": {
"properties": {
"full_text": {
"type": "string"
},
"exact_value": {
"type": "string",
"index": "not_analyzed"
}
}
}
}
}
PUT my_index/my_type/1
{
"full_text": "Quick Foxes!",
"exact_value": "Quick Foxes!"
}
请求不出数据的,因为full_text分词后的结果中没有[Quick Foxes!]这个分词
GET my_index/my_type/_search
{
"query": {
"term": {
"full_text": "Quick Foxes!"
}
}
}
五、terms
指定多值精确匹配,如果字段包含了指定值中的任何一个值,那么文档满足条件。类似sql中的in
{
"terms": {
"tag": [
"search",
"full_text",
"nosql"
]
}
}
六、range
数字/时间的区间查询,操作符:
- 01-09搞定 Redis 数据存储原理,别只会Set、Get 了
- 01-09多数据库Citus集群的维护
- 01-09MySQL批量导入数据时,为何表空间膨胀了N倍
- 01-09关系型数据库设计三大范式
- 01-09面试官:MySQL主键为什么不是连续递增的?
- 01-09大型互联网系统数据库切换方案
- 01-11全球最受赞誉公司揭晓:苹果连续九年第一
- 12-09罗伯特·莫里斯:让黑客真正变黑
- 12-09谁闯入了中国网络?揭秘美国绝密黑客小组TA
- 12-09警示:iOS6 惊现“闪退”BUG
- 05-27拼多多一季度营收376.4亿 研发投入环比增加
- 05-27国产量子计算云平台重磅上线
- 05-27AI换脸技术不能野蛮生长
- 05-27网信办:从严整治“自媒体”乱象专项行动取
- 05-22今年扎克伯格财富暴涨440亿美元,涨幅居亿万