2.2.1 使用 heapdump

heapdump 是一个 dump V8 堆信息的工具。v8-profiler 也包含了这个功能,这两个工具的原理都是一致的,都是 v8::Isolate::GetCurrent()->GetHeapProfiler()->TakeHeapSnapshot(title, control),但是 heapdump 的使用简单些。下面我们以 heapdump 为例讲解如何分析 Node.js 的内存泄漏。

这里以一段经典的内存泄漏代码作为测试代码:

app.js

  1. const heapdump = require('heapdump')
  2. let leakObject = null
  3. let count = 0
  4. setInterval(function testMemoryLeak() {
  5. const originLeakObject = leakObject
  6. const unused = function () {
  7. if (originLeakObject) {
  8. console.log('originLeakObject')
  9. }
  10. }
  11. leakObject = {
  12. count: String(count++),
  13. leakStr: new Array(1e7).join('*'),
  14. leakMethod: function () {
  15. console.log('leakMessage')
  16. }
  17. }
  18. }, 1000)

为什么这段程序会发生内存泄漏呢?首先我们要明白闭包的原理:同一个函数内部的闭包作用域只有一个,所有闭包共享。在执行函数的时候,如果遇到闭包,则会创建闭包作用域的内存空间,将该闭包所用到的局部变量添加进去,然后再遇到闭包,会在之前创建好的作用域空间添加此闭包会用到而前闭包没用到的变量。函数结束时,清除没有被闭包作用域引用的变量。

这段代码内存泄露原因是:在 testMemoryLeak 函数内有两个闭包:unused 和 leakMethod。unused 这个闭包引用了父作用域中的 originLeakObject 变量,如果没有后面的 leakMethod,则会在函数结束后被清除,闭包作用域也跟着被清除了。因为后面的 leakObject 是全局变量,即 leakMethod 是全局变量,它引用的闭包作用域(包含了 unused 所引用的 originLeakObject)不会释放。而随着 testMemoryLeak 不断的调用,originLeakObject 指向前一次的 leakObject,下次的 leakObject.leakMethod 又会引用之前的 originLeakObject,从而形成一个闭包引用链,而 leakStr 是一个大字符串,得不到释放,从而造成了内存泄漏。

解决方法:在 testMemoryLeak 函数内部的最后添加 originLeakObject = null 即可。

运行测试代码:

  1. $ node app

然后先后执行次:

  1. $ kill -USR2 `pgrep -n node`

在当前目录下生成了两个 heapsnapshot 文件:

  1. heapdump-100427359.61348.heapsnapshot
  2. heapdump-100438986.797085.heapsnapshot

2.2.2 Chrome DevTools

我们使用 Chrome DevTools 来分析前面生成的 heapsnapshot 文件。调出 Chrome DevTools -> Memory -> Load,按顺序依次加载前面生成的 heapsnapshot 文件。单击第 2 个堆快照,在左上角有个下拉菜单,有如下 4 个选项:

  1. Summary:以构造函数名分类显示。
  2. Comparison:比较多个快照之间的差异。
  3. Containment:查看整个 GC 路径。
  4. Statistics:以饼状图显示内存占用信息。

通常我们只会用前两个选项;第 3 个选项一般用不到,因为在展开 Summary 和 Comparison 中的每一项时,都可以看到从 GC roots 到这个对象的路径;第 4 个选项只能看到内存占用比,如下图所示:

heapdump - 图2

切换到 Summary 页,可以看到有如下 5 个属性:

  1. Contructor:构造函数名,例如 Object、Module、Socket,(array)、(string)、(regexp) 等加了括号的分别代表内置的 Array、String 和 Regexp。
  2. Distance:到 GC roots (GC 根对象)的距离。GC 根对象在浏览器中一般是 window 对象,在 Node.js 中是 global 对象。距离越大,则说明引用越深,有必要重点关注一下,极有可能是内存泄漏的对象。
  3. Objects Count:对象个数。
  4. Shallow Size:对象自身的大小,不包括它引用的对象。
  5. Retained Size:对象自身的大小和它引用的对象的大小,即该对象被 GC 之后所能回收的内存大小。

小提示: 一个对象的 Retained Size = 该对象的 Shallow Size + 该对象可直接或间接引用到的对象的 Shallow Size 之和。Shallow Size == Retained Size 的有 (boolean)、(number)、(string),它们无法引用其他值,并且始终是叶子节点。

我们单击 Retained Size 选择降序展示,可以看到 (closure) 这一项引用的内容达到 98%,继续展开如下:

heapdump - 图3

可以看出:一个 leakStr 占了 8% 的内存,而 leakMethod 引用了 81% 的内存。对象保留树(Retainers,老版本 Chrome 叫 Object’s retaining tree)展示了对象的 GC path,单击如上图中的 leakStr(Distance 是 13),Retainers 会自动展开,Distance 从 13 递减到 1。

我们继续展开 leakMethod,如下所示:

heapdump - 图4

可以看出:有一个 count=”10” 的 originLeakObject 的 leakMethod 函数的 context(即上下文) 引用了一个 count=”9” 的 originLeakObject 对象,而这个 originLeakObject 对象的 leakMethod 函数的 context 又引用了 count=”8” 的 originLeakObject 对象,以此类推。而每个 originLeakObject 对象上都有一个大字符串 leakStr(占用 8% 的内存),从而造成内存泄漏,符合我们之前的推断。

小提示:如果背景色是黄色的,则表示这个对象在 JavaScript 中还存在引用,所以可能没有被清除。如果背景色是红色的,则表示这个对象在 JavaScript 中不存在引用,但是依然存活在内存中,一般常见于 DOM 对象,它们存放的位置和 JavaScript 中的对象还是有不同的,在 Node.js 中很少遇见。

2.2.3 对比快照

切换到 Comparison 视图下,可以看到一些 #New、#Deleted、#Delta 等属性,+ 和 - 代表相对于比较的堆快照而言。我们对比第 2 个快照和第 1 个快照,如下所示:

heapdump - 图5

可以看出:(string) 增加了 10 个,每个 string 大小为 10000024 字节。

2.2.4 参考链接

上一节:2.1 gcore + llnode

下一节:2.3 memwatch-next