vForum 2011:图解vCops虚拟云管理应用
2019-02-26 来源:多智时代
10月26-27日,VMware Forum 2011中国用户大会在北京召开,作为全球虚拟化解决方案的领导厂商,VMware每年都在vForum上为中国用户带来虚拟化和云计算领域的前沿技术,并引领虚拟化行业创新风潮。请IT168 vForum2011大会视频直播专题。
26日下午,在云计算基础架构—管理和运营分会场中,VMware技术讲师向我们详细介绍了最新版vCenter Operations案例分析与功能演示。
根据介绍,斯坦福大学医学院已经有4年虚拟化应用历史,虚拟化架构环境如下:
服务器:310 VMs on 21 ESXi hosts
存储:20Tb NFS datstores replicated on campus, DR site
网络:10Gb ESXi upgrades are 75% complete
由于斯坦福大学虚拟化应用历史较长,所采用的虚拟化管理软件也纷繁复杂,包括Zabbix,Cacti,Big brother,这些虚拟化管理软件提供了25930个静态阀值的监控度量目标,使得在系统环境中定位问题的根源变得极为复杂。
在我们前面的介绍vForum2011:vCops将虚拟云管理化繁为简一文中,我们已经介绍过,基于静态阀值的传统的管理工具往往会有多项具体的考量指标,针对每一项指标会有一个阀值,当超过阀值之后系统会给出相应的报警信息。以一个交易型网站为例,当某项商品正处于热销期,产生的工作负载其实极有可能超过原先预设的阀值,但这种情况却并非系统的故障,系统仍然会给出相应的出错信息。这种情况带来的问题就是,基于静态阀值的管理系统会产生大量的纷繁的信息,真正有价值的信息反而无法引起管理员的重视。
如何才能过滤掉25830个静态度量中的噪音信息,并快速定位到关键问题上呢?
vCenter Operations的管理系统则结合了衍伸指标和动态阀值的各种信息,并定义了CPU、内存、IO等第一级指标,优先考虑从第一级度量分析问题,从而降低误报的可能性,并提供了智能方式过滤噪音信号,系统管理员就能够在短期内,管理工具的高层次度量发掘底层问题根源。
这是一个SAS工作造成工作负载105超标的出错信息,与此同时,CPU健康度也下降到了24,最后分析原因,是因为在不适当的时间进行了一个大备份的操作。
这是一个邮件服务器的工作负载状况,可以看到工作负载达到100%,与此同时,内存占用也达到了100%,最终分析原因,因为存在着其他应用争用这部分内存的情况。
图示vCenter Operations界面
▲上图齿轮图标表示当前显示的是工作负载,数字则表负载大小,如果负载过重,则图标会由绿色变为橙色或红色,而且你可以从vcenter到数据中心,再到cluster,ESX主机和虚拟机逐级展开,是不是非常方便,非常直观呢?对于大型数据中心来说,这的确是一个管理vsphere虚拟化环境的利器。
▲这一幅图展现的是某个节点(一台名为db-server-01的虚拟机,在图的最上方,你可以看到它的具体位置)的细节信息,我们可以看到,这台虚拟机的工作负载过重,那么是什么原因导致的呢?通过察看细节信息,我们了解到,这一台虚拟机的磁盘I/O负载过重,我们需要减轻它的磁盘I/O负载或者为它分配更高速的存储设备。
▲下面这幅图分层显示各节点的健康状况,我们看到,其中有三台虚拟机和一台物理主机的健康状况存在问题,需要引起管理员的注意。
▲下面这幅图则是从另一个视角来查看节点的健康状况,图中那一块块的,像田地一样的方块,表示的是虚拟机,方块的面积大小表示的是工作负载的高低,方块的颜色则表示健康状况,所以我们要重点那些存在健康问题且面积较大的方块。
在不久的将来,云计算一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏云计算,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。
上一篇:资讯时代需要“大数据”
下一篇:为什么企业云计算是不可避免的