Sentinel 提供对所有资源的实时监控。如果需要实时监控,客户端需引入以下依赖(以 Maven 为例):

  1. <dependency>
  2. <groupId>com.alibaba.csp</groupId>
  3. <artifactId>sentienl-transport-simple-http</artifactId>
  4. <version>x.y.z</version>
  5. </dependency>

引入上述依赖后,客户端便会主动连接 Sentinel 控制台。通过 Sentinel 控制台 即可查看客户端的实时监控。

通常您并不需要关心以下 API,但是如果您对开发控制台感兴趣,以下为监控 API 的文档。

簇点监控

获取簇点列表

相关 API: GET /clusterNode

当应用启动之后,可以运行下列命令,获得当前所有簇点(ClusterNode)的列表(JSON 格式):

  1. curl http://localhost:8719/clusterNode

结果示例:

  1. [
  2. {"avgRt":0.0, //平均相应时间
  3. "blockRequest":0, //每分钟拦截的请求个数
  4. "blockedQps":0.0, //每秒拦截个数
  5. "curThreadNum":0, //并发个数
  6. "passQps":1.0, // 每秒成功通过请求
  7. "passReqQps":1.0, //每秒到来的请求
  8. "resourceName":"/registry/machine", 资源名称
  9. "timeStamp":1529905824134, //时间戳
  10. "totalQps":1.0, // 每分钟请求数
  11. "totalRequest":193},
  12. ....
  13. ]

查询某个簇点的详细信息

可以用下面命令模糊查询该簇点的具体信息,其中 id 对应 resource name,支持模糊查询:

  1. curl http://localhost:8719/cnode?id=xxxx

结果示例:

  1. idx id thread pass blocked success total aRt 1m-pass 1m-block 1m-all exeption
  2. 6 /app/aliswitch2/machines.json 0 0 0 0 0 0 0 0 0 0
  3. 7 /app/sentinel-admin/machines.json 0 1 0 1 1 6 0 0 0 0
  4. 8 /identity/machine.json 0 0 0 0 0 0 0 0 0 0
  5. 9 /registry/machine 0 2 0 2 2 1 192 0 192 0
  6. 10 /app/views/machine.html 0 1 0 1 1 2 0 0 0 0

簇点调用者统计信息

可以用下列命令查询该簇点的调用者统计信息:

  1. curl http://localhost:8719/origin?id=xxxx

结果示例:

  1. id: nodeA
  2. idx origin threadNum passedQps blockedQps totalQps aRt 1m-passed 1m-blocked 1m-total
  3. 1 caller1 0 0 0 0 0 0 0 0
  4. 2 caller2 0 0 0 0 0 0 0 0

其中的 origin 由 ContextUtil.enter(resourceName,origin) 方法中的 origin 指定。

链路监控

我们可以通过命令 curl http://localhost:8719/tree 来查询链路入口的链路树形结构:

  1. EntranceNode: machine-root(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0)
  2. -EntranceNode1: Entrance1(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0)
  3. --nodeA(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0)
  4. -EntranceNode2: Entrance1(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0)
  5. --nodeA(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0)
  6. t:threadNum pq:passQps bq:blockedQps tq:totalQps rt:averageRt prq: passRequestQps 1mp:1m-passed 1mb:1m-blocked 1mt:1m-total

历史资源数据

1.资源的秒级日志

所有资源的秒级日志在 ${home}/logs/csp/${appName}-${pid}-metrics.log.${date}.xx。例如,该日志的名字可能为 app-3518-metrics.log.2018-06-22.1

  1. 1529573107000|2018-06-21 17:25:07|sayHello(java.lang.String,long)|10|3601|10|0|2
index 例子 说明
1 1529573107000 时间戳
2 2018-06-21 17:25:07 日期
3 sayHello(java.lang.String,long) 资源名称
4 10 每秒到来的资源请求个数
5 3601 每秒资源被拦截的个数
6 10 每秒成功通过的资源个数
7 0 每秒资源的异常个数
8 2 资源平均相应时间

2.被拦截的秒级日志

同样的,每秒的拦截日志也会出现在 <用户目录>/logs/csp/sentinel-block.log 文件下。如果没有发生拦截,则该日志不会出现。

  1. 2014-06-20 16:35:10|1|sayHello(java.lang.String,long),FlowException,default,origin|61,0
  2. 2014-06-20 16:35:11|1|sayHello(java.lang.String,long),FlowException,default,origin|1,0
index 例子 说明
1 2014-06-20 16:35:10 时间戳
2 1 该秒发生的第一个资源
3 sayHello(java.lang.String,long) 资源名称
4 XXXException 拦截的原因, 通常 FlowException 代表是被限流规则拦截, DegradeException 则表示被降级,SystemException 则表示被系统保护拦截
5 default 生效规则的调用应用
6 origin 被拦截资源的调用者。可以为空
7 61,0 61 被拦截的数量,0则代表可以忽略

3.实时查询

  1. curl http://localhost:8719/metric?identity=XXX&startTime=XXXX&endTime=XXXX&maxLines=XXXX

返回和资源的秒级日志格式一样的内容。

指定的开始时间(startTime),结束时间(endTime),最大行数为maxLines的指定资源(identity)的值。

  1. 1529998904000|2018-06-26 15:41:44|abc|100|0|0|0|0
  2. 1529998905000|2018-06-26 15:41:45|abc|4|5579|104|0|728
  3. 1529998906000|2018-06-26 15:41:46|abc|0|15698|0|0|0
  4. 1529998907000|2018-06-26 15:41:47|abc|0|19262|0|0|0
  5. 1529998908000|2018-06-26 15:41:48|abc|0|19502|0|0|0
  6. 1529998909000|2018-06-26 15:41:49|abc|0|18386|0|0|0
  7. 1529998910000|2018-06-26 15:41:50|abc|0|19189|0|0|0
  8. 1529998911000|2018-06-26 15:41:51|abc|0|16543|0|0|0
  9. 1529998912000|2018-06-26 15:41:52|abc|0|18471|0|0|0
  10. 1529998913000|2018-06-26 15:41:53|abc|0|19405|0|0|0

原文: https://github.com/alibaba/Sentinel/wiki/%E5%AE%9E%E6%97%B6%E7%9B%91%E6%8E%A7