Stats Aggregation

一种多值度量标准聚合,用于计算从聚合文档中提取的数值的统计信息。可以从文档中的特定数字字段提取这些值,也可以通过提供的脚本生成这些值。

返回的统计数据包括:min,max,sum,count和avg。

假设数据由代表考试成绩(0到100)的学生组成

  1. POST /exams/_search?size=0
  2. {
  3. "aggs" : {
  4. "grades_stats" : { "stats" : { "field" : "grade" } }
  5. }
  6. }

上述聚合计算所有文档的成绩统计。聚合类型是统计数据,字段设置定义将在其上计算统计数据的文档的数字字段。以上将返回以下内容:

  1. {
  2. ...
  3. "aggregations": {
  4. "grades_stats": {
  5. "count": 2,
  6. "min": 50.0,
  7. "max": 100.0,
  8. "avg": 75.0,
  9. "sum": 150.0
  10. }
  11. }
  12. }

聚合的名称(上面的grades_stats)也可以作为从返回的响应中检索聚合结果的密钥。

Script

根据脚本计算成绩统计:

  1. POST /exams/_search?size=0
  2. {
  3. "aggs" : {
  4. "grades_stats" : {
  5. "stats" : {
  6. "script" : {
  7. "lang": "painless",
  8. "source": "doc['grade'].value"
  9. }
  10. }
  11. }
  12. }
  13. }

这将使用painliess脚本语言并且没有脚本参数将脚本参数解释为内联脚本。要使用存储的脚本,请使用以下语法:

  1. POST /exams/_search?size=0
  2. {
  3. "aggs" : {
  4. "grades_stats" : {
  5. "stats" : {
  6. "script" : {
  7. "id": "my_script",
  8. "params" : {
  9. "field" : "grade"
  10. }
  11. }
  12. }
  13. }
  14. }
  15. }

Value Script

事实证明,考试高于学生的水平,需要进行等级校正。我们可以使用值脚本来获取新的统计信息:

  1. POST /exams/_search?size=0
  2. {
  3. "aggs" : {
  4. "grades_stats" : {
  5. "stats" : {
  6. "field" : "grade",
  7. "script" : {
  8. "lang": "painless",
  9. "source": "_value * params.correction",
  10. "params" : {
  11. "correction" : 1.2
  12. }
  13. }
  14. }
  15. }
  16. }
  17. }

Missing value

缺少的参数定义了应该如何处理缺少值的文档。默认情况下,它们将被忽略,但也可以将它们视为具有值。

  1. POST /exams/_search?size=0
  2. {
  3. "aggs" : {
  4. "grades_stats" : {
  5. "stats" : {
  6. "field" : "grade",
  7. "missing": 0 # @1
  8. }
  9. }
  10. }
  11. }

@1: 在成绩字段中没有值的文档将与值为0的文档属于同一个存储桶。