空白搜索

搜索API最常用的一种形式就是空白搜索,也就是不加任何查询条件的,只是返回集群中所有文档的搜索。

  1. GET /_search

返回内容如下(有删减):

  1. {
  2. "hits" : {
  3. "total" : 14,
  4. "hits" : [
  5. {
  6. "_index": "us",
  7. "_type": "tweet",
  8. "_id": "7",
  9. "_score": 1,
  10. "_source": {
  11. "date": "2014-09-17",
  12. "name": "John Smith",
  13. "tweet": "The Query DSL is really powerful and flexible",
  14. "user_id": 2
  15. }
  16. },
  17. ... 9 个结果被隐藏 ...
  18. ],
  19. "max_score" : 1
  20. },
  21. "took" : 4,
  22. "_shards" : {
  23. "failed" : 0,
  24. "successful" : 10,
  25. "total" : 10
  26. },
  27. "timed_out" : false
  28. }

hits

返回内容中最重要的内容就是hits,它指明了匹配查询的文档的总数hits数组里则会包含前十个匹配文档——也就是搜索结果。

hits数组中的每一条结果都包含了文档的_index, _type以及_id信息,以及_source字段。这也就意味着你可以直接从搜索结果中获取到整个文档的内容。这与其他搜索引擎只返回给你文档编号,还需要自己去获取文档是截然不同的。

每一个元素还拥有一个_score字段。这个是相关性评分,这个数值表示当前文档与查询的匹配程度。通常来说,搜索结果会先返回最匹配的文档,也就是说它们会按照_score由高至低进行排列。在这个例子中,我们并没有声明任何查询,因此_score就都会返回1

max_score数值会显示所有匹配文档中的_score的最大值。

took

took数值告诉我们执行这次搜索请求所耗费的时间有多少毫秒。

shards

_shards告诉了我们参与查询分片的总数,以及有多少successfulfailed。通常情况下我们是不会得到失败的反馈,但是有的时候它会发生。如果我们的服务器突然出现了重大事故,然后我们丢失了同一个分片中主从两个版本的数据。在查询请求中,无法提供可用的备份。这种情况下,Elasticsearch就会返回`failed提示,但是它还会继续返回剩下的内容。

timeout

timed_out数值告诉了我们查询是否超时。通常,搜索请求不会超时。如果相比完整的结果你更需要的是快速的响应时间,这是你可以指定timeout值,例如10"10ms"(10毫秒)或者"1s"(1秒钟):

  1. GET /_search?timeout=10ms

Elasticsearch会尽可能地返回你指定时间内它所查到的内容。


Timeout并不是终止者

这里应该强调一下timeout并不会终止查询,它只是会在你指定的时间内返回当时已经查询到的数据,然后关闭连接。在后台,其他的查询可能会依旧继续,尽管查询结果已经被返回了。

使用超时是因为你要保障你的品质,并不是因为你需要终止你的查询。