按距离聚合

按距离聚合对于类似“找出距我1公里内的所有pizza店”这样的检索场景很适合。
检索结果需要确实地只返回距离用户1km内的文档,不过我们可以再加上一个“1-2km内的结果集”:

  1. GET /attractions/restaurant/_search
  2. {
  3. "query": {
  4. "filtered": {
  5. "query": {
  6. "match": { <1>
  7. "name": "pizza"
  8. }
  9. },
  10. "filter": {
  11. "geo_bounding_box": {
  12. "location": { <2>
  13. "top_left": {
  14. "lat": 40,8,
  15. "lon": -74.1
  16. },
  17. "bottom_right": {
  18. "lat": 40.4,
  19. "lon": -73.7
  20. }
  21. }
  22. }
  23. }
  24. }
  25. },
  26. "aggs": {
  27. "per_ring": {
  28. "geo_distance": { <3>
  29. "field": "location",
  30. "unit": "km",
  31. "origin": {
  32. "lat": 40.712,
  33. "lon": -73.988
  34. },
  35. "ranges": [
  36. { "from": 0, "to": 1 },
  37. { "from": 1, "to": 2 }
  38. ]
  39. }
  40. }
  41. },
  42. "post_filter": { <4>
  43. "geo_distance": {
  44. "distance": "1km",
  45. "location": {
  46. "lat": 40.712,
  47. "lon": -73.988
  48. }
  49. }
  50. }
  51. }
  • <1> 主查询查找饭店名中包含了 “pizza” 的文档。
  • <2> 矩形框过滤器让结果集缩小到纽约区域。
  • <3> 距离聚合器计算距用户1km和1km-2km的结果数。
  • <4> 最后,后置过滤器(post_filter)再把结果缩小到距离用户1km的饭店。

上例请求的返回结果如下:

  1. "hits": {
  2. "total": 1,
  3. "max_score": 0.15342641,
  4. "hits": [ <1>
  5. {
  6. "_index": "attractions",
  7. "_type": "restaurant",
  8. "_id": "3",
  9. "_score": 0.15342641,
  10. "_source": {
  11. "name": "Mini Munchies Pizza",
  12. "location": [
  13. -73.983,
  14. 40.719
  15. ]
  16. }
  17. }
  18. ]
  19. },
  20. "aggregations": {
  21. "per_ring": { <2>
  22. "buckets": [
  23. {
  24. "key": "*-1.0",
  25. "from": 0,
  26. "to": 1,
  27. "doc_count": 1
  28. },
  29. {
  30. "key": "1.0-2.0",
  31. "from": 1,
  32. "to": 2,
  33. "doc_count": 1
  34. }
  35. ]
  36. }
  37. }
  • <1> 后置过滤器(post_filter)已经结果集缩小到满足“距离用户1km”条件下的唯一一个pizza店。
  • <2> 聚合器包含了”距离用户2km”的pizza店的检索结果。

这个例子中,我们统计了落到各个环形区域中的饭店数。
当然,我们也可以使用子聚合器再在每个环形区域中进一步计算它们的平均价格,最流行,等等。