监控指标

监控指标

概览

我们为节点增加了指标计算。用户添加 with 选项 inlong.metric.labels 后 Sort 会计算指标，inlong.metric.labels 选项的值由三部分构成：groupId={groupId}&streamId={streamId}&nodeId={nodeId}。用户可以使用 metric reporter 去上报数据。

指标

支持的 extract 节点

指标名	Extract 节点	描述
groupId_streamId_nodeId_numRecordsIn	kafka,mongodb-cdc,mysql-cdc,oracle-cdc,postgresql-cdc,pulsar,sqlserver-cdc	输入记录数
groupId_streamId_nodeId_numBytesIn	kafka,mongodb-cdc,mysql-cdc,oracle-cdc,postgresql-cdc,pulsar,sqlserver-cdc	输入字节数
groupId_streamId_nodeId_numRecordsInPerSecond	kafka,mongodb-cdc,mysql-cdc,oracle-cdc,postgresql-cdc,pulsar,sqlserver-cdc	每秒输入记录数
groupId_streamId_nodeId_numBytesInPerSecond	kafka,mongodb-cdc,mysql-cdc,oracle-cdc,postgresql-cdc,pulsar,sqlserver-cdc	每秒输入字节数

支持表级别指标

它是用于整库同步场景

指标名	Extract 节点	描述
groupId_streamId_nodeId_database_table_numRecordsIn	mysql-cdc	输入记录数
groupId_streamId_nodeId_database_schema_table_numRecordsIn	oracle-cdc,postgresql-cdc	输入记录数
groupId_streamId_nodeId_database_collection_numRecordsIn	mongodb-cdc	输入记录数
groupId_streamId_nodeId_database_table_numBytesIn	mysql-cdc	输入字节数
groupId_streamId_nodeId_database_schema_table_numBytesIn	oracle-cdc,postgresql-cdc	输入字节数
groupId_streamId_nodeId_database_collection_numBytesIn	mongodb-cdc	输入字节数
groupId_streamId_nodeId_database_table_numRecordsInPerSecond	mysql-cdc	每秒输入记录数
groupId_streamId_nodeId_database_schema_table_numRecordsInPerSecond	oracle-cdc,postgresql-cdc	每秒输入记录数
groupId_streamId_nodeId_database_collection_numRecordsInPerSecond	mongodb-cdc	每秒输入记录数
groupId_streamId_nodeId_database_table_numBytesInPerSecond	mysql-cdc	每秒输入字节数
groupId_streamId_nodeId_database_schema_table_numBytesInPerSecond	oracle-cdc,postgresql-cdc	每秒输入字节数
groupId_streamId_nodeId_database_collection_numBytesInPerSecond	mongodb-cdc	每秒输入字节数

支持的 load 节点

指标名	Load 节点	描述
groupId_streamId_nodeId_numRecordsOut	clickhouse,elasticsearch,greenplum,hbase, hdfs,hive,iceberg,kafka, mysql,oracle,postgresql,sqlserver,tdsql-postgresql	输出记录数
groupId_streamId_nodeId_numBytesOut	clickhouse,elasticsearch,greenplum,hbase, hdfs,hive,iceberg,kafka, mysql,oracle,postgresql,sqlserver,tdsql-postgresql	输出字节数
groupId_streamId_nodeId_numRecordsOutPerSecond	clickhouse,elasticsearch,greenplum, hbase,hdfs,hive,iceberg, kafka,mysql,oracle,postgresql,sqlserver,tdsql-postgresql	每秒输出记录数
groupId_streamId_nodeId_numBytesOutPerSecond	clickhouse,elasticsearch,greenplum, hbase,hdfs,hive,iceberg,kafka, mysql,oracle,postgresql,sqlserver,tdsql-postgresql	每秒输出字节数
groupId_streamId_nodeId_dirtyRecordsOut	clickhouse,elasticsearch,greenplum,hbase, hdfs,hive,iceberg,kafka,mysql, oracle,postgresql,sqlserver,tdsql-postgresql	输出脏数据记录数
groupId_streamId_nodeId_dirtyBytesOut	clickhouse,elasticsearch,greenplum,hbase, hdfs,hive,iceberg,kafka,mysql, oracle,postgresql,sqlserver,tdsql-postgresql	输出脏数据字节数

支持表级别指标

它是用于整库同步场景

指标名	Load node	描述
groupId_streamId_nodeId_database_table_numRecordsOut	doris,iceberg,starRocks	输出记录数据
groupId_streamId_nodeId_database_schema_table_numRecordsOut	postgresql	输出记录数据
groupId_streamId_nodeId_topic_numRecordsOut	kafka	输出记录数据
groupId_streamId_nodeId_database_table_numBytesOut	doris,iceberg,starRocks	输出字节数据
groupId_streamId_nodeId_database_schema_table_numBytesOut	postgresql	输出字节数据
groupId_streamId_nodeId_topic_numBytesOut	kafka	输出字节数据
groupId_streamId_nodeId_database_table_numRecordsOutPerSecond	doris,iceberg,starRocks	每秒记录数据
groupId_streamId_nodeId_database_schema_table_numRecordsOutPerSecond	postgresql	每秒记录数据
groupId_streamId_nodeId_topic_numRecordsOutPerSecond	kafka	每秒记录数据
groupId_streamId_nodeId_database_table_numBytesOutPerSecond	doris,iceberg,starRocks	每秒输出字节数量
groupId_streamId_nodeId_database_schema_table_numBytesOutPerSecond	postgresql	每秒输出字节数量
groupId_streamId_nodeId_topic_numBytesOutPerSecond	kafka	每秒输出字节数量
groupId_streamId_nodeId_database_table_dirtyRecordsOut	doris,iceberg,starRocks	输出脏数据记录数
groupId_streamId_nodeId_database_schema_table_dirtyRecordsOut	postgresql	输出脏数据记录数
groupId_streamId_nodeId_topic_dirtyRecordsOut	kafka	输出脏数据记录数
groupId_streamId_nodeId_database_table_dirtyBytesOut	doris,iceberg,starRocks	输出脏数据字节数据
groupId_streamId_nodeId_database_schema_table_dirtyBytesOut	postgresql	输出脏数据字节数据
groupId_streamId_nodeId_topic_dirtyBytesOut	kafka	输出脏数据字节数据

用法

这里将介绍一个同步MYSQL数据到PostgreSQL的例子，同时介绍指标的使用。

flink sql 的使用


 create table `table_groupId_streamId_nodeId1`(
     `id` INT,
    `name` INT,
    `age` STRING,
    PRIMARY KEY(`id`) NOT ENFORCED)
    WITH (
        'connector' = 'mysql-cdc-inlong',
        'hostname' = 'xxxx',
        'username' = 'xxx',
        'password' = 'xxx',
        'database-name' = 'test',
        'scan.incremental.snapshot.enabled' = 'true',
        'server-time-zone' = 'GMT+8',
        'table-name' = 'user',
        'inlong.metric' = 'mysqlGroup&mysqlStream&mysqlNode1'
);
 CREATE TABLE `table_groupId_streamId_nodeId2`(
     PRIMARY KEY (`id`) NOT ENFORCED,
     `id` INT,
     `name` STRING,
     `age` INT)
     WITH (
         'connector' = 'jdbc-inlong',
         'url' = 'jdbc:postgresql://ip:5432/postgres',
         'username' = 'postgres',
         'password' = 'inlong',
         'table-name' = 'public.user',
         'inlong.metric' = 'pggroup&pgStream&pgNode'
         );
 INSERT INTO `table_groupId_streamId_nodeId2`
 SELECT
     `id`,
     `name`,
     `age`
 FROM `table_groupId_streamId_nodeId1`;

我们可以在flink-conf.yaml中添加metric report配置

metric.reporters: promgateway
metrics.reporter.promgateway.class: org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter
metrics.reporter.promgateway.host: ip
metrics.reporter.promgateway.port: 9091
metrics.reporter.promgateway.interval: 60 SECONDS

ip 和 port 是你的 pushgateway 的配置。

执行上面的sql后，我们可以访问 pushgateway 的 url: http://ip:port

当我们使用的 metric report 是 org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter 指标名将添加前缀 flink_taskmanager_job_task_operator。
我们可以看到完整的指标名如下:
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numRecordsIn,
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numBytesIn,
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numRecordsInPerSecond,
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numBytesInPerSecond,
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numRecordsOut,
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numBytesOut,
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numRecordsOutPerSecond,
flink_taskmanager_job_task_operator_groupId_streamId_nodeId_numBytesOutPerSecond.