最佳实践

部署云计算服务是一项挑战。这需要在很多不同的技术之间做出选择,CLOUDSTACK以其配置灵活性可以使用很多种方法将不同的技术进行整合和配置。这个章节包含了一些在云计算部署中的建议及需求。

这些内容应该被视为建议而不是绝对性的。然而,我们鼓励想要部署云计算的朋友们,除了这些建议内容之外,最好从CLOUDSTACK的项目邮件列表中获取更多建议指南性内容。

实施最佳实践

  • 强烈建议在系统部署至生产环境之前,有一个完全模拟生产环境的集成系统。对于已经在CloudStack中做了自定义修改的系统来说,更为重要了。

  • 应该为安装,学习和测试系统预留充足的时间。简单网络模式的安装可以在几个小时内完成。但首次尝试安装高级网络模式通常需要花费几天的时间,完全安装则需要更长的时间。正式生产环境上线前,通常需要4-8周用以排除集成过程中的问题,你也可从cloudstack-users的邮件列表里得到更多帮助。

最佳实践安装

  • 每一个主机都应该配置为只接受已知设备的连接,如CLOUDSTACK管理节点或相关的网络监控软件。

  • 如果需要达到一定的高密度,可以在每个机柜提供点里部署多个集群。

  • 主存储的挂载点或是LUN不应超过6TB大小。每个集群中使用多个小一些的主存储比只用一个超大主存储的效果要好。

  • 在主存储上输出共享数据时,可用限制访问IP地址的方法避免数据丢失。更多详情,可参考”Linux NFS on Local Disks and DAS” “Linux NFS on iSCSI”这些章节。

  • 网卡绑定技术可以明显的增加系统的可靠性。

  • 当有大量服务器支持相当多的虚拟机时,推荐在存储访问的网络上采用将10G的带宽。

  • 主机可创建的虚拟机的能力,主要取决于提供给客户虚拟机的内存。因为主机的存储和CPU均可超配,但内存却基本不可以。所以内存是在系统容量设计时的主要限制因素。

  • (XenServer)可以为Xenserver的dom0分配更多的内存来让其支持更多的虚拟机。我们推荐为dom0设置的内存数值为2940 MB。至于具体操作,可以参见如下URL:http://support.citrix.com/article/CTX126531。这篇文章可同时适用于XenServer 5.6和6.0版本。

维护最佳实践

  • 监视主机的磁盘空间。很多主机故障的原因都是日志将主机的硬盘空间占满导致的。

  • 要监控每个集群里的虚拟机总量,如果达到了hypervisor所能承受的最大虚拟机数量时,就要禁止向此集群分配虚机。并且,要确定预留一定的安全迁移容量,以防止群集中有主机故障,这将增大其他主机运行虚拟机压力,就像是重新部署一批虚拟机一样。咨询你选择 hypervisor的文档,找到每台主机所能支持的最大虚拟机数量,并将此数值作为默认限制配置在CLOUDSTACK的全局设置里。监控每个群集中虚拟机的活动,保持虚拟机数量在安全线内,以防止偶然的主机故障。例如:如果集群里有N个主机,如果要让集群中一主机在任意时间停机,那么,此集群最多允许的虚拟机数量值为:(N-1) * (每宿主机最大虚拟量数量限值)。一旦达到此数量,必须在CLOUDSTACK的UI里禁止向此群集增加新的虚拟机。

警告

不及时更新相关系统补丁可能会导致虚拟机数据损失或消失。

必须保证应用了hypervisor提供商提供的所有补丁。通过提供商提供的渠道,随时追踪hypervisor开发商的补丁发布情况,并且在有最新补丁发布之后,第一时间进行更新。CLOUDSTACK并不会提醒你hypervisor开发商的系统补丁更新情况。保持hypervisor的补丁更新是很重要的。hypervisor开发商也可能会拒绝为没有更新补丁的系统提供支持。