核心概念

APM

Application Performance Management,即应用性能管理,对企业的应用系统进行实时监控,用于优化系统性能和故障管理的系统化解决方案。

Erda 也集成了 APM 的功能,以代码零入侵、自动接入的方式,提供针对企业应用实时监控的解决方案。

可以在对应的应用的 部署中心 里,找到 应用监控 插件,点击进入 APM 相关的页面。

核心概念 - 图1

核心概念 - 图2

Trace

分布式链路追踪,用于追踪并记录整个系统中的请求所经过的逻辑节点以及相关的性能指标,这里的逻辑节点称为 Span

一条 Trace 代表针对一次请求的记录,一条 Trace 下面会包含多个 逻辑节点 Span ,每个 Trace 和 Span 都会有相关性能指标记录。

考虑对业务系统的影响,一般并不会针对每次请求进行追踪,而是通过一定的采样率,对部分请求进行追踪记录。

Metric

通过一组数据来反应的系统性能,这些数据称为 Metric,即性能指标。

单调递增的指标称为 Counter ,比如网络流量,随着时间的推进,网络流量是累计增加的。

数值会上下波动的指标称为 Gauge ,比如 CPU使用率,会随着业务应用的运行情况而变化。

通过对一组数据的聚合计算,能够发现系统的异常情况,从而发出告警,也能够通过图标展示反应系统的性能趋势。

Log

日志,是指应用程序为了反应运行情况而输出的文本信息。

日志可以和 Trace、Exception 关联,表示一次请求所打印的全部日志。

Exception

异常,是在程序运行过程中发生的、会打断程序正常执行的事件。业务逻辑未处理的异常,会被 APM 系统所记录。

异常也可以和一次请求关联,表示因为某个请求而导致的。

应用拓扑

把整个系统中的每个服务、中间件作为一个节点,而绘制出的 服务之间调用关系的 拓扑结构图,能反应出整个系统的结构、流量走向、以及每个节点的性能情况。

主动监控

根据用户配置信息,主动发起对某个目标的定时巡检,从而记录该目标的异常及性能情况。

浏览监控

又称页面监控、前端监控,是指针对业务系统的 Web页面 的性能分析,能反应页面的加载性能、PV等情况。

APP性能

是指针对 移动端APP 的性能监控,能反应出 APP里的每个界面打开的性能,次数等情况。