当前,数字化转型已进入深水区。对于数据中心运维管理来说,如何深化应用,并获得跨越式发展,是企业需要深入思考的问题。
本期大咖说为您分享安超数据中心管理软件ArcherDCM(以下简称安超DCM)如何帮助用户通过带外管理的方式对数据中心硬件设备进行全生命周期管理,从而达到简化运维方式、提升运维效率的目标。
本期嘉宾
薛顺胤(华云数据产品营销经理)深谙客户运维需求,多年产品实践,专注于为客户提供数据中心解决方案。
核心内容
2013年以来,我国数据中心总体规模快速增长,其中,大型以上数据中心是增长主力,年规模增速约68%,占数据中心总体数量规模近50%。随着数据中心成为为5G、物联网、AI等提供有力的基础设施保障,对设备功耗、运维部署、安全审计等有极高的要求。
数字化时代下,数据中心IT设备数量呈现出爆发式增长,人均管理设备台数由以前的几十台,发展到现在的人均几百甚至更多的设备管理台数。目前,数据中心管理遇到了人工巡检、节能要求、资产盘点、远程运维等挑战。
安超DCM是一款跨厂商、跨平台的全方位硬件监控平台软件,通过带外的方式实现所有硬件设备的统一管理,实时高效主动地监控硬件设备的状态,及时发现故障、定位故障,替代人工巡检,有效的解决人工巡检发现问题不及时,且需要频繁进出机房的弊端。
安超DCM实现对数据中心硬件设备统一集中管理,从硬件设备实时状态;设备配置信息自动获取、部件变更信息自动获取、维保信息、固件版本管理、机柜空间容量;设备级实时能耗、温度及远程管理;远程管理多个维度实现硬件设备的全生命周期管理,做到设备状态实时可查、可知、可追踪、可视化管理。
安超DCM拥有无人值守、能耗管理、资产管理、远程管理等功能。无人值守方面,不需要人工去做巡检,只要坐在办公室,就可以看到哪一个机房里的哪个机架上的哪一个U位上的哪一个设备里的哪一个部件,发生了什么样的问题,并且在清晰定位故障的同时进行自动化提示。比如硬盘预警功能,能够提早发现问题,把故障扼杀在摇篮里。
能耗管理功能主要就是通过带外管理的方式去获取我们设备的事实功率。在机房层面,安超DCM对机房机构实时空间容量、能耗数据进行统计,实时统一展现机房空间、电力资源使用情况、运行状态,确保机房用电安全,有效预防因电压不足而导致硬件设备宕机问题。在机柜层面,安超DCM自动采集X86服务器实时功率、温度,无需增加硬件设施,实现各机柜能耗数据精准收集。对机柜电力负荷进行实时统计与自动报警。在设备层面,安超DCM支持实时采集服务器进风口温度。通过进风口温度,主动发现过载服务器、僵尸服务器,根据策略进行负载优化。
资产管理功能,能够从采购到上线到管理再到下线,实现全生命周期的追踪管理。这个功能能够帮助用用户实现设备从采购、安装使用,再到运维、报废的全过程服务。并对监测数据进行分析、管理,为日常运营提供支持。
远程管理功能就是远程的KVM的功能。这个功能可以帮助用户实现无需进出机房,远程管理异地多机房。支持开机、关机、重启操作,实现数据中心异构设备的远程控制。
安超DCM是通过带外管理口的方式,能够对跨品牌、全类型硬件进行全生命周期自动化运维和可视化展现的数据中心管理平台。在设备层,实现对计算资源、网络资源、存储资源、动环、安防等设备进行跨品牌、跨平台的统一监控。在数据采集层,支持主动采集(SNMP、SSH、HTTPS、CLI)、被动采集(SNMPTrap、Syslog)与第三方系统数据整合等多种数据采集手段。在数据处理层,实现对设备硬件状态的实时分析:资产分析、故障分析、能耗数据、空间数据,等等。在展现层:支持在统一的Portal界面展现设备的运行情况、告警等信息。支持分级分权限管理,运维人员只看自己关注的信息。
目前,安超DCM已经帮助了政府、金融、证券等众多用户有效减少繁琐、重复、费时的各项运维工作,保障数据中心设备安全、稳定运行,同时降低数据中心运营成本,实现节能增效、无人值守、绿色环保、安全的AI数据中心,全面为数字化转型保驾护航。
更多内容请扫码查看