日志可视化工具

介绍

和众多其他系统软件一样,IoTDB在运行时会产生大量各种各样的日志。debug和trace级别的日志可以帮助 开发者掌握IoTDB的运行时状态,找出潜在的或是尚不明确的bug。而info级别的日志可以用来判断系统的健康程度, 并且可以为系统调优提供一个指导方向。一旦出现warn时甚至error级别的日志,就代表了系统正处于一个危险的 状态或者是发生了某种异常(往往是某种bug或者黑客攻击),系统管理员可以通过分析这些日志及时对系统调整, 避免系统走向崩溃,或是在系统崩溃后找寻系统崩溃的原因。

鉴于日志对于监控系统的运行状态具有重大意义,许多学术界和工业界的专家都致力于研究如何对日志进行挖崛来 提取其中的有价值的信息。传统的日志分析需要对系统和日志高度熟悉的人对日志进行有针对性的仔细阅读与分析 才能发现日志背后的价值。通常,由不同数据源(例如Java中不同的类)产生的日志混合在若干个文件中,只有经验 丰富的开发或运维人员才能快速地从海量的日志中找到想要的日志,而那些资历尚浅的人则需要花费大量的时间 阅读和排除无用的日志才能最终找到他们所希望的日志。并且,日志的形式通常是包含了一些系统状态量的字符串, 对于人类来说,要从这些字符串中发现其背后的趋势显然没有通过图表和统计信息等其他形式来得容易。

为了方便开发和运维人员了解日志背后的系统状态的变化,以及将它们进行对比分析,我们推出了一个简易的日志 可视化工具LogVisualizer。在用户通过正则表达式指定了日志中他们所感兴趣的变量后,LogVisualizer将自动 抽取这些变量,按照对应日志的产生时间为这些变量生成时间序列,并以折线图的形式绘制这些变量的变化,以 方便后续的比较和分析。同时,LogVisualizer还会对这些时间序列进行统计,找出其中的最大值、最小值、平均值、 日志条数等信息,使得用户能有一个总体性的认识。

准备工作

在使用LogVisualizer之前,您需要对其进行构建。LogVisualizer被集成到server模块作为一个系统工具,因此您 可以通过构建server模块来同时构建LogVisualizer。您可以使用以下命令:

mvn clean package -pl server -DskipTests

之后您能在这个目录下找到LogVisualizer的启动脚本: server/target/iotdb-server-{project-version}/tools/logVisualize

如果您想要掌握本工具的一些进阶使用方法,您需要对正则表达式(特别是Java风格的正则表达式)有一些基本的 了解。您只有在熟悉正则表达式以后才能新建可视化计划或者对已有的计划进行修改。如果您对正则表达式一无所知, 我们也提供了一些预设的可视化计划供您使用,但这些可视化计划仅限于分析IoTDB。

使用方法(图形界面)

启动图形界面

您可以通过脚本log-visualizer-gui.sh (在Windows下为log-visualizer-gui.bat)来启动LogVisualizer. 这将会启动一个如下图所示的图形界面:

日志可视化工具 - 图1

选择日志文件

首先,您需要点击图示的按钮选择一个含有待可视化日志的文件或者一个仅包含该类文件的文件夹。注意:我们 目前仅支持单行日志,多行日志无法被正确解析而会被忽略。

日志可视化工具 - 图2

选择解析器配置文件

然后,您还需要选择一个解析器配置文件,该文件将告诉LogVisualizer如何解析日志。对于IoTDB产生的日志,我们在 server/src/assembly/resources/tools/logVisualize/default.log.pattern里提供了一个例子。如果您需要 解析的日志与IoTDB的日志具有相同的格式,您可以直接使用该文件。否则,您需要仔细阅读该样例文件,并根据 您的日志结构进行相应的修改。

日志可视化工具 - 图3

载入日志

之后,点击Load logs按钮来让LogVisualizer准备对这些日志进行解析。如果准备成功,按钮上方将显示 Logs are successfully loaded。否则将会弹出一个对话框提示错误,您需要根据错误内容进行相应处理。

日志可视化工具 - 图4

加载可视化计划

接下来,您可以选择加载磁盘上已有的可视化计划或者新建计划。要加载已有的计划,只需要点击 Load plans 按钮,并在弹出的对话框中选择想要加载的计划文件或者包含计划文件的文件夹。注意,如果选择文件夹,该文件 夹必须只包含计划文件。

日志可视化工具 - 图5

新建可视化计划

现在,我们将展示如何使用图形界面创建一个新的可视化计划,您也可以参考已有的计划文件,使用文本编辑器编写。 首先点击Create plan按钮并选择存放新计划的文件,新计划将出现在左边的列表。选择的文件名将作为新计划的 名称,该名称不能与已有的计划重复。

日志可视化工具 - 图6

编辑可视化计划

在创建了一个新的计划以后,您可以在右边的面板中对其进行编辑。我们在 server/src/assembly/resources/tools/logVisualize/plans/flushTimeConsumption.plan.example 提供了一个样例来帮助您理解计划的每一个字段的含义以及应该如何设置它们,我们强烈推荐您仔细阅读该样例。 您也可以编辑其他已经加载了的计划。编辑结束后请务必点击Save plan按钮来保存您的修改。在下图的例子中, 我们给出了如何设计一个计划让它能对任务的完成时间进行可视化,并将任务按照其类别进行分组。

日志可视化工具 - 图7

删除可视化计划

如果您不再想使用某个计划,您可以选中它并点击Delete plan按钮。这将永久地把该计划从磁盘上移除。

执行可视化计划

最后,选中一个计划并点击Execute plan就可以执行该计划。请确保您之前已经加载了日志。计划执行以后, 主界面上将会多出两个页面,第一个页面包含了若干个时间序列图,每一个对应了计划里的一个分组并且包含了 计划中的所有测点(measurement),第二个页面包含了对每一组的日志的每个测点的统计信息。当您结束对一个 页面的浏览以后,您可以点击页面右上角的按钮将其关闭。

日志可视化工具 - 图8 日志可视化工具 - 图9 日志可视化工具 - 图10

使用方法(命令行)

我们也提供了LogVisualizer的命令行版本,您可以通过log-visualizer-cmd.sh (或 log-visualizer-cmd.bat) 来使用。使用时必须输入四个参数,它们是:日志文件的路径解析器配置文件的路径可视化计划的路径结果输出路径。运行该脚本,LogVisualizer将根据参数读取日志和可视化计划,执行每一个可视化计划,并将 每一个计划的结果存储到输出路径的一个子文件夹下。 例如:

./log-visualizer-cmd.sh all.log default.log.pattern planB.plan results