管理系统资源

总体说明

openEuler 虚拟化使用libvirt命令来管理虚拟机的系统资源,如vCPU、虚拟内存资源等。

在开始前:

  • 确保主机上运行了libvirtd守护进程。
  • 用virsh list —all命令确认虚拟机已经被定义。

管理虚拟CPU

CPU份额

概述

虚拟化环境下,同一主机上的多个虚拟机竞争使用物理CPU。为了防止某些虚拟机占用过多的物理CPU资源,影响相同主机上其他虚拟机的性能,需要平衡虚拟机vCPU的调度,避免物理CPU的过度竞争。

CPU份额表示一个虚拟机竞争物理CPU计算资源的能力大小总和。用户通过调整cpu_shares值能够设置虚拟机抢占物理CPU资源的能力。cpu_shares值无单位,是一个相对值。虚拟机获得的CPU计算资源,是与其他虚拟机的CPU份额,按相对比例,瓜分物理CPU除预留外可用计算资源。通过调整CPU份额来保证虚拟机CPU计算资源服务质量。

操作步骤

通过修改分配给虚拟机的运行时间的cpu_shares值,来平衡vCPU之间的调度。

  • 查看虚拟机的当前CPU份额:

    1. $ virsh schedinfo <VMInstance>
    2. Scheduler : posix
    3. cpu_shares : 1024
    4. vcpu_period : 100000
    5. vcpu_quota : -1
    6. emulator_period: 100000
    7. emulator_quota : -1
    8. global_period : 100000
    9. global_quota : -1
    10. iothread_period: 100000
    11. iothread_quota : -1
  • 在线修改:修改处于running状态的虚拟机的当前CPU份额,使用带—live参数的virsh schedinfo命令:

    1. $ virsh schedinfo <VMInstance> --live cpu_shares=<number>

    比如将正在运行的虚拟机openEulerVM的CPU份额从1024改为2048:

    1. $ virsh schedinfo openEulerVM --live cpu_shares=2048
    2. Scheduler : posix
    3. cpu_shares : 2048
    4. vcpu_period : 100000
    5. vcpu_quota : -1
    6. emulator_period: 100000
    7. emulator_quota : -1
    8. global_period : 100000
    9. global_quota : -1
    10. iothread_period: 100000
    11. iothread_quota : -1

    对cpu_shares值的修改立即生效,虚拟机openEulerVM能得到的运行时间将是原来的2倍。但是这一修改将在虚拟机关机并重新启动后失效。

  • 持久化修改:在libvirt内部配置中修改虚拟机的CPU份额,使用带—config参数的virsh schedinfo命令:

    1. $ virsh schedinfo <VMInstance> --config cpu_shares=<number>

    比如将虚拟机openEulerVM的CPU份额从1024改为2048:

    1. $ virsh schedinfo openEulerVM --config cpu_shares=2048
    2. Scheduler : posix
    3. cpu_shares : 2048
    4. vcpu_period : 0
    5. vcpu_quota : 0
    6. emulator_period: 0
    7. emulator_quota : 0
    8. global_period : 0
    9. global_quota : 0
    10. iothread_period: 0
    11. iothread_quota : 0

    对cpu_shares值的修改不会立即生效,在虚拟机openEulerVM下一次启动后才生效,并持久生效。虚拟机openEulerVM能得到的运行时间将是原来的2倍。

绑定QEMU进程至物理CPU

概述

QEMU主进程绑定特性是将QEMU主进程绑定到特定的物理CPU范围内,从而保证了运行不同业务的虚拟机不会干扰到邻位虚拟机。例如在一个典型的云计算场景中,一台物理机上会运行多台虚拟机,而每台虚拟机的业务不同,造成了不同程度的资源占用,为了避免存储IO密集的虚拟机对邻位虚拟机的干扰,需要将不同虚拟机处理IO的存储进程完全隔离,由于QEMU主进程是处理前后端的主要服务进程,故需要实现隔离。

操作步骤

通过virsh emulatorpin命令可以绑定QEMU主进程到物理CPU。

  • 查看QEMU进程当前绑定的物理CPU范围:

    1. $ virsh emulatorpin openEulerVM
    2. emulator: CPU Affinity
    3. ----------------------------------
    4. *: 0-63

    这说明虚拟机openEulerVM对应的QEMU主进程可以在主机的所有物理CPU上调度。

  • 在线绑定:修改处于running状态的虚拟机对应的QEMU进程的绑定关系,使用带—live参数的vcpu emulatorpin命令:

    1. $ virsh emulatorpin openEulerVM --live 2-3
    2. $ virsh emulatorpin openEulerVM
    3. emulator: CPU Affinity
    4. ----------------------------------
    5. *: 2-3

    以上命令把虚拟机openEulerVM对应的QEMU进程绑定到物理CPU2、3上,即限制了QEMU进程只在这两个物理CPU上调度。这一绑定关系的调整立即生效,但在虚拟机关机并重新启动后失效。

  • 持久化绑定:在libvirt内部配置中修改虚拟机对应的QEMU进程的绑定关系,使用带—config参数的virsh emulatorpin命令:

    1. $ virsh emulatorpin openEulerVM --config 0-3,^1
    2. $ virsh emulatorpin openEulerVM --config
    3. emulator: CPU Affinity
    4. ----------------------------------
    5. *: 0,2-3

    以上命令把虚拟机openEulerVM对应的QEMU进程绑定到物理CPU0、2、3上,即限制了QEMU进程只在这三个物理CPU上调度。这一绑定关系的调整不会立即生效,在虚拟机下一次启动后才生效,并持久生效

调整虚拟CPU绑定关系

概述

把虚拟机的vCPU绑定在物理CPU上,即vCPU只在绑定的物理CPU上调度,在特定场景下达到提升虚拟机性能的目的。比如在NUMA系统中,把vCPU绑定在同一个NUMA节点上,可以避免vCPU跨节点访问内存,避免影响虚拟机运行性能。如果未绑定,默认vCPU可在任何物理CPU上调度。具体的绑定策略由用户来决定。

操作步骤

通过virsh vcpupin命令可以调整vCPU和物理CPU的绑定关系。

  • 查看虚拟机的当前vCPU绑定信息:

    1. $ virsh vcpupin openEulerVM
    2. VCPU CPU Affinity
    3. ----------------------
    4. 0 0-63
    5. 1 0-63
    6. 2 0-63
    7. 3 0-63

    这说明虚拟机openEulerVM的所有vCPU可以在主机的所有物理CPU上调度。

  • 在线调整:修改处于running状态的虚拟机的当前vCPU绑定关系,使用带—live参数的vcpu vcpupin命令:

    1. $ virsh vcpupin openEulerVM --live 0 2-3
    2. $ virsh vcpupin openEulerVM
    3. VCPU CPU Affinity
    4. ----------------------
    5. 0 2-3
    6. 1 0-63
    7. 2 0-63
    8. 3 0-63

    以上命令把虚拟机openEulerVM的vCPU0绑定到PCPU2、3上,即限制了vCPU0只在这两个物理CPU上调度。这一绑定关系的调整立即生效,但在虚拟机关机并重新启动后失效。

  • 持久化调整:在libvirt内部配置中修改虚拟机的vCPU绑定关系,使用带—config参数的virsh vcpupin命令:

    1. $ virsh vcpupin openEulerVM --config 0 0-3,^1
    2. $ virsh vcpupin openEulerVM --config
    3. VCPU CPU Affinity
    4. ----------------------
    5. 0 0,2-3
    6. 1 0-63
    7. 2 0-63
    8. 3 0-63

    以上命令把虚拟机openEulerVM的vCPU0绑定到物理CPU0、2、3上,即限制了vCPU0只在这三个物理CPU上调度。这一绑定关系的调整不会立即生效,在虚拟机下一次启动后才生效,并持久生效

CPU热插

概述

在线增加(热插)虚拟机CPU是指在虚拟机处于运行状态下,为虚拟机热插CPU而不影响虚拟机正常运行的方案。当虚拟机内部业务压力不断增大,会出现所有CPU均处于较高负载的情形。为了不影响虚拟机内的正常业务运行,可以使用CPU热插功能(在不关闭虚拟机情况下增加虚拟机的CPU数目),提升虚拟机的计算能力。

约束限制

  • 如果处理器为AArch64架构,创建虚拟机时指定的虚拟机芯片组类型(machine)需为virt-4.1或virt更高版本。如果处理器为x86_64架构,创建虚拟机时指定的虚拟机芯片组类型(machine)需为pc-i440fx-1.5或pc更高版本。
  • 在配置Guest NUMA的场景中,必须把属于同一个socket的vcpu配置在同一vNode中,否则热插CPU后可能导致虚拟机softlockup,进而可能导致虚拟机panic。
  • 虚拟机在迁移、休眠唤醒、快照过程中均不支持CPU热插。
  • 虚拟机CPU热插是否自动上线取决于虚拟机操作系统自身逻辑,虚拟化层不保证热插CPU自动上线。
  • CPU热插同时受限于Hypervisor和GuestOS支持的最大CPU数目。
  • 虚拟机启动、关闭、重启过程中可能出现热插CPU失效的情况,但再次重启会生效。
  • 热插虚拟机CPU的时候,如果新增CPU数目不是虚拟机CPU拓扑配置项中Cores的整数倍,可能会导致虚拟机内部看到的CPU拓扑是混乱的,建议每次新增的CPU数目为Cores的整数倍。
  • 若需要热插CPU在线生效且在虚拟机重启后仍有效,virsh setvcpus接口中需要同时传入—config和—live选项, 将热插CPU动作持久化。

操作步骤

一、配置虚拟机XML

  1. 使用CPU热插功能,需要在创建虚拟机时配置虚拟机当前的CPU数目、虚拟机所支持的最大CPU数目,以及虚拟机芯片组类型(对于AArch64架构,需为virt-4.1及以上版本。对于x86_64架构,需为pc-i440fx-1.5及以上版本)。这里以AArch64架构虚拟机为例,配置模板如下:

    1. <domain type='kvm'>
    2. ...
    3. <vcpu placement='static' current='m'>n</vcpu>
    4. <os>
    5. <type arch='aarch64' machine='virt-4.1'>hvm</type>
    6. </os>
    7. ...
    8. <domain>

    管理系统资源 - 图1 说明:

    • placement的值必须是static。
    • m为虚拟机当前CPU数目,即虚拟机启动后默认的CPU数目。n为虚拟机支持热插到的最大CPU数目,该值不能超过Hypervisor支持的虚拟机最大CPU规格及GuestOS支持的最大CPU规格。n大于或等于m。

    例如,配一个虚拟机当前CPU数目为4,最大支持的热插CPU上限为64的XML配置为:

    1. <domain type='kvm'>
    2. ……
    3. <vcpu placement='static' current='4'>64</vcpu>
    4. <os>
    5. <type arch='aarch64' machine='virt-4.1'>hvm</type>
    6. </os>
    7. ……

二、热插并上线CPU

  1. 如果热插CPU后需要自动上线热插的CPU,可以使用root权限在虚拟机内部创建udev rules文件/etc/udev/rules.d/99-hotplug-cpu.rules,并在其中定义udev规则,内容参考如下:

    1. # automatically online hot-plugged cpu
    2. ACTION=="add", SUBSYSTEM=="cpu", ATTR{online}="1"

    管理系统资源 - 图2 说明: 如果没有使用udev rules自动上线热插CPU,可以在热插CPU后,使用root权限,参考如下命令手动上线:

    1. for i in `grep -l 0 /sys/devices/system/cpu/cpu*/online`
    2. do
    3. echo 1 > $i
    4. done
  2. 利用virsh工具进行虚拟机CPU热插操作。例如给虚拟机openEulerVM热插CPU到6,且在线生效的参考命令如下:

    1. virsh setvcpus openEulerVM 6 --live

    管理系统资源 - 图3 说明: virsh setvcpus 进行虚拟机CPU热插操作的格式如下:

    1. virsh setvcpus <domain> <count> [--config] [--live]
    • domain: 参数,必填。指定虚拟机名称。
    • count: 参数,必填。指定目标CPU数目,即热插后虚拟机CPU数目。
    • —config: 选项,选填。虚拟机下次启动时仍有效。
    • —live: 选项,选填。在线生效。

管理虚拟内存

NUMA简介

传统的多核运算使用SMP(Symmetric Multi-Processor)模式:将多个处理器与一个集中的存储器和I/O总线相连。所有处理器只能访问同一个物理存储器,因此SMP系统也被称为一致存储器访问(UMA)系统。一致性指无论在什么时候,处理器只能为内存的每个数据保持或共享唯一一个数值。很显然,SMP的缺点是可伸缩性有限,因为在存储器和I/O接口达到饱和的时候,增加处理器并不能获得更高的性能。

NUMA(Non Uniform Memory Access Architecture) 模式是一种分布式存储器访问方式,处理器可以同时访问不同的存储器地址,大幅度提高并行性。 NUMA模式下,处理器被划分成多个“节点”(NODE), 每个节点分配一块本地存储器空间。所有节点中的处理器都可以访问全部的物理存储器,但是访问本节点内的存储器所需要的时间,比访问某些远程节点内的存储器所花的时间要少得多。

配置Host-NUMA

为提升虚拟机性能,在虚拟机启动前,用户可以通过虚拟机XML配置文件为虚拟机指定主机的NUMA节点,使虚拟机内存分配在指定的NUMA节点上。本特性一般与vCPU绑定一起使用,从而避免vCPU远端访问内存。

操作步骤

  • 查看host的NUMA拓扑结构:

    1. $ numactl -H
    2. available: 4 nodes (0-3)
    3. node 0 cpus: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
    4. node 0 size: 31571 MB
    5. node 0 free: 17095 MB
    6. node 1 cpus: 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
    7. node 1 size: 32190 MB
    8. node 1 free: 28057 MB
    9. node 2 cpus: 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
    10. node 2 size: 32190 MB
    11. node 2 free: 10562 MB
    12. node 3 cpus: 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63
    13. node 3 size: 32188 MB
    14. node 3 free: 272 MB
    15. node distances:
    16. node 0 1 2 3
    17. 0: 10 15 20 20
    18. 1: 15 10 20 20
    19. 2: 20 20 10 15
    20. 3: 20 20 15 10
  • 在虚拟机XML配置文件中添加numatune字段,创建并启动虚拟机。例如使用主机上的NUMA node 0给虚拟机分配内存,配置参数如下:

    1. <numatune>
    2. <memory mode="strict" nodeset="0"/>
    3. </numatune>

    假设虚拟机的vCPU也绑定在NODE0的物理CPU上,就可以避免由于vCPU访问远端内存带来的性能下降。

    管理系统资源 - 图4 说明:

    • 分配给虚拟机的内存不要超过该NUMA节点剩余的可用内存,否则可能导致虚拟机启动失败。
    • 建议虚拟机内存和vCPU都绑定在同一NUMA节点,避免vCPU访问远端内存造成性能下降。例如将上例中vCPU也绑定在NUMA node 0上。

配置Guest-NUMA

虚拟机中运行的很多业务软件都针对NUMA架构进行了性能优化,尤其是对于大规格虚拟机,这种优化的作用更明显。openEuler提供了Guest NUMA特性,在虚拟机内部呈现出NUMA拓扑结构。用户可以通过识别这个结构,对业务软件的性能进行优化,从而保证业务更好的运行。

配置Guest NUMA时可以指定vNode的内存在HOST上的分配位置,实现内存的分块绑定,同时配合vCPU绑定,使vNode上的vCPU和内存在同一个物理NUMA node上。

操作步骤

在虚拟机的XML配置文件中,配置了Guest NUMA后,就可以在虚拟机内部查看NUMA拓扑结构。项是Guest NUMA的必配项。

  1. <cputune>
  2. <vcpupin vcpu='0' cpuset='0-3'/>
  3. <vcpupin vcpu='1' cpuset='0-3'/>
  4. <vcpupin vcpu='2' cpuset='16-19'/>
  5. <vcpupin vcpu='3' cpuset='16-19'/>
  6. </cputune>
  7. <numatune>
  8. <memnode cellid="0" mode="strict" nodeset="0"/>
  9. <memnode cellid="1" mode="strict" nodeset="1"/>
  10. </numatune>
  11. [...]
  12. <cpu>
  13. <numa>
  14. <cell id='0' cpus='0-1' memory='2097152'/>
  15. <cell id='1' cpus='2-3' memory='2097152'/>
  16. </numa>
  17. </cpu>

管理系统资源 - 图5 说明:

  • 项提供虚拟机内部呈现NUMA拓扑功能,“cell id”表示vNode编号,“cpus”表示vCPU编号,“memory”表示对应vNode上的内存大小。
  • 如果希望通过Guest NUMA提供更好的性能,则需要配置,使vCPU和对应的内存分布在同一个物理NUMA NODE上:
    • 中的“cellid”和中的“cell id”是对应的;“mode”可以配置为“strict”(严格从指定node上申请内存,内存不够则失败)、“preferred”(优先从某一node上申请内存,如果不够则从其他node上申请)、“interleave”(从指定的node上交叉申请内存);“nodeset”表示指定物理NUMA NODE。
    • 中需要将同一cell id中的vCPU绑定到与memnode相同的物理NUMA NODE上。

内存热插

概述

在虚拟化场景下,虚拟机的内存、CPU、外部设备都是软件模拟呈现的,因此可以在虚拟化底层为虚拟机提供内存在线调整的能力。当前openEuler版本支持在线给虚拟机添加内存,当虚拟机出现物理内存不足又无法关闭虚拟机的时候,可以使用此特性增加虚拟机的物理内存资源。

约束限制

  • 创建虚拟机的时候,AArch64平台上指定的主板类型(machine)需为virt-4.1或更高virt以上,x86平台上指定的主板类型需要为pc-i440fx-1.5以上版本。
  • 内存热插特性依赖于Guest NUMA,虚拟机必须配置Guest NUMA,否则无法完成内存热插流程。
  • 热插内存时候必须指定新增内存所属的Gust NUMA node编号,否则内存热插失败。
  • 虚拟机内核必须支持内存热插能力,否则虚拟机无法识别新增内存或者无法上线内存。
  • 配置使用大页的虚拟机,热插内存的容量必须是系统hugepagesz的整数倍,否则会导致热插失败。
  • 热插内存的大小必须为Guest物理内存块大小block_size_bytes的整数倍,否则无法正常上线。在Guest内部执行lsmem可以获取block_size_bytes大小。
  • 配置n个virtio-net网卡后,最大可热插次数取值为min{max_slot, 64 - n},因为要给网卡预留slot。
  • vhost-user设备和内存热插特性互斥。配置了vhost-user设备的虚拟机不支持内存热插;内存热插后,不支持虚拟机热插vhost-user设备。
  • 如果虚拟机操作系统为Linux系列,请确保初始内存大于等于4GB。
  • 如果虚拟机操作系统为Windows类型,第一次热插内存必须指定到Guest NUMA node0上,否则热插内存无法被虚拟机识别。
  • 在直通场景下,由于需要预先分配内存,因此启动和热插内存都比普通虚拟机要慢(尤其是大规格虚拟机),属于正常现象。
  • 建议虚拟机可用内存与热插内存的比例至少为1:32,即热插32G内存虚拟机至少需要有1G可用内存,如果低于该比例可能会导致虚拟机卡死。
  • 热插内存是否自动上线取决于虚拟机操作系统自身逻辑,可以手动上线或者配置udev规则自动上线。

操作步骤

一、配置虚拟机XML

  1. 使用内存热插功能,需要在创建虚拟机时配置可热插内存的最大范围、预留槽位号,并配置Guest NUMA拓扑结构。

    例如,为虚拟机配置32GiB初始内存,预留256个槽位号,最大支持1TiB内存上限,2个NUMA node的配置为:

    1. <domain type='kvm'>
    2. <memory unit='GiB'>32</memory>
    3. <maxMemory slots='256' unit='GiB'>1024</maxMemory>
    4. <cpu mode='host-passthrough' check='none'>
    5. <topology sockets='2' cores='2' threads='1'/>
    6. <numa>
    7. <cell id='0' cpus='0-1' memory='16' unit='GiB'/>
    8. <cell id='1' cpus='2-3' memory='16' unit='GiB'/>
    9. </numa>
    10. </cpu>
    11. ....

管理系统资源 - 图6 说明: 其中: maxMemory字段中slots号表示预留的内存插槽,最大取值为256。 maxMemory表示虚拟机支持的最大物理内存上限。 Guest NUMA配置请参见“配置Guest NUMA”相关章节。

二、热插并上线内存

  1. 如果热插内存后需要自动上线热插的内存,可以使用root权限在虚拟机内部创建udev rules文件/etc/udev/rules.d/99-hotplug-memory.rules,并在其中定义udev规则,内容参考如下:

    1. # automatically online hot-plugged memory
    2. ACTION=="add", SUBSYSTEM=="memory", ATTR{state}="online"
  2. 根据需要热插的内存大小和虚拟机Guest NUMA Node创建内存描述xml文件。

    例如,热插1GiB内存到NUMA node0上:

    1. <memory model='dimm'>
    2. <target>
    3. <size unit='MiB'>1024</size>
    4. <node>0</node>
    5. </target>
    6. </memory>
  3. 使用virsh attach-device命令为虚拟机热插内存。其中openEulerVM为虚拟机名称,memory.xml为热插内存的描述文件,—live表示热插内存在线生效,也可以使用—config 将热插内存持久化到虚拟机xml文件中。

    1. # virsh attach-device openEulerVM memory.xml --live

    管理系统资源 - 图7 说明: 如果没有使用udev rules自动上线热插内存,也可以使用root权限,参考如下命令手动上线:

    1. for i in `grep -l offline /sys/devices/system/memory/memory*/state`
    2. do
    3. echo online > $i
    4. done