内存不足问题

问题现象

日志里出现如下错误:

  1. This error usually means that PostgreSQL's request for a shared memory segment
  2. exceeded available memory or swap space, or exceeded your kernel's SHMALL parameter.
  3. You can either reduce the request size or reconfigure the kernel with larger SHMALL.

原因分析

使用free命令查看内存使用情况,发现shared内存的确占用了很大一部分。

  1. # free -g
  2. total used free shared buff/cache available
  3. Mem: 31 1 2 23 27 2
  4. Swap: 3 3 0

使用ipcs命令进一步查看共享内存的使用情况,发现存在大量不再被进程使用但未回收的共享内存,即nattch为0的部分。

  1. [root@pekpeuler00671 script]# ipcs -m
  2. ------ Shared Memory Segments --------
  3. key shmid owner perms bytes nattch status
  4. 0x00000000 65536 gnome-init 777 16384 1 dest
  5. 0x00000000 131073 gnome-init 777 16384 1 dest
  6. 0x00000000 163842 gnome-init 777 3145728 2 dest
  7. 0x00000000 393219 gnome-init 600 524288 2 dest
  8. 0x00000000 425988 gnome-init 600 4194304 2 dest
  9. 0x00000000 458757 gnome-init 777 3145728 2 dest
  10. 0x00f42401 3604486 1001 600 4455342080 0
  11. 0x00f42402 14123015 1003 600 4457177088 0
  12. 0x00f42403 23592968 1005 600 4457177088 0
  13. 0x00f42404 33062921 1007 600 4457177088 0
  14. 0x00f42405 42532874 1009 600 4457177088 0
  15. 0x00f42406 52002827 1011 600 4457177088 0
  16. 0x00f42407 61472780 1013 600 4457177088 0
  17. 0x00f42408 70942733 1015 600 4457177088 0
  18. 0x00f42409 80412686 1017 600 4457177088 0
  19. 0x00f4240a 89882639 1019 600 4457177088 0
  20. 0x00f4240b 99352592 1021 600 4457177088 0
  21. 0x00f4240c 108822545 1023 600 4457177088 0
  22. 0x00f4240d 118292498 1025 600 4457177088 0
  23. 0x00f4240e 127762451 1027 600 4457177088 0
  24. 0x00f4240f 136904724 1029 600 4455342080 0
  25. 0x00f42410 146374677 1031 600 4457177088 0
  26. 0x00f42411 155844630 1033 600 4457177088 0
  27. 0x00f42412 165314583 1035 600 4457177088 0
  28. 0x00f42413 174784536 1037 600 4457177088 0

经过定位,这部分内存是由于使用kill -9命令来退出数据库进程,导致没有调用IpcMemoryDelete函数来清理共享内存,造成了内存泄漏。

处理方法

使用ipcrm释放无属主的共享内存,例如, 释放shmid3604486的共享内存,命令如下所示。

  1. ipcrm -m shid3604486