首页 云计算 服务器 大数据 存储 IT 安全 物联网 软件 商品

服务器

数据中心频道旗下栏目: 虚拟化 服务器组件 虚拟桌面 数据中心 高性能计算

比特管理瓦特 华为用AI使能数据中心智能化

来源:网络整理   发布时间:2019-06-14
摘要:服务器频道 06月14日 新闻消息(文/李祥敬): 你知道未来云数据中心会怎么发展,那你就知道应该攻克什么样的技术,给你的用户提供什么样的解决方案。比特管理瓦特,比特也要强,瓦特也要强,双管齐下。何波说。 近日,主题为芯里有数,智慧金融的2019华为

服务器频道 06月14日 新闻消息(文/李祥敬): “你知道未来云数据中心会怎么发展,那你就知道应该攻克什么样的技术,给你的用户提供什么样的解决方案。比特管理瓦特,比特也要强,瓦特也要强,双管齐下。”何波说。

近日,主题为“芯里有数,智慧金融”的2019华为全球金融峰会在上海举行,华为与2000多位海内外金融客户、伙伴及行业专家畅谈智慧金融的未来,并携手伙伴重磅发布了联合创新成果,旨在通过共同构建领先的技术和解决方案,帮助金融行业客户构建市场领导力,携手迈向智慧金融时代。

在金融行业数字化转型的进程中,ICT基础设施发挥了重要的推动作用。华为网络能源产品线数据中心能源领域总裁何波告诉记者,基于全栈数据中心的“云+AI”大平台,华为持续创新,将领先的i³@AI技术,深入智能模块化数据中心内核,使能数据中心更智能更可靠更节能,全生命周期最优。以此赋能金融科技,加速金融行业数字化转型。

华为i³@AI技术,驱动数据中心能源变革

在数据中心能源领域,华为每年有10%到15%的销售收入投入到研发中,而且2千多名研发工程师分布在德国、瑞典、中国深圳、西安、上海等地方,实现了研发资源和投入的全球化布局。在何波看来,华为在数据中心能源领域最大的创新就是比特管理瓦特,通过引进信息技术,比如云、AI等,和传统领域的电力电子、热力学技术相结合,给行业带来变革。

特别是在AI方面,华为成立了专门研究人工智能的诺亚方舟实验室,实验室拥有大量的人工智能专家,他们有一个课题就是持续研究怎么样用人工智能的技术把数据能耗PUE降下来。“华为iCooling@AI智冷技术,通过对整个数据中心基础设施各种参数的调优、提取、训练、推理,优化到最佳状态,我们自己的数据中心能耗下降了8%~15%,这是非常惊人的,对于一个10MW规模的数据中心来说,直接带来的收益就是我们每年可以节约数百万的电费。”何波说。

华为在廊坊的数据中心由于建设比较早,所以PUE居高不下,后来经过AI的加持,PUE降低0.1(廊坊数据中心三期12MW的数据中心),一年节省的电费高达数百万,在节能减排方面取得了一定的经济效应。如果说同样的AI技术,用在一个新的数据中心,PUE可以再降低10%。如果引入自然冷却技术,PUE甚至可以降低到1.1以下。

在供配电方面,华为持续不断创新。何波表示,华为把电源技术和智能化管理技术结合,使得主打的模块化UPS通过智能化的手段更可靠。“华为iPower通过供电全链路监测,可实现毫秒级的故障检测,毫秒级的故障隔离,分钟级的故障恢复,可提前消除事故隐患,大大提高数据中心能源基础设施可靠性和可用性。”

举例来说,在配电系统中,电池的重要程度不言而喻。为了预防供配电系统中电池失效的现象,华为iPower融入AI技术,可以精确预测电池的寿命和健康度,为用户提前提供维护决策依据,及时排除有失效隐患的电池组,变事后补救为事前预防,变被动响应为主动维护,大大提高数据中心供配电安全等级。华为的模块化UPS结合iPower技术,可以在电池出现温度快速升高等极端情况下,自动切断该组电池,从而避免出现起火等恶性事件,大大提升了数据中心的可靠性。

iManager通过把人在工具、运维的流程、经验等固化到工具中,从而使得数据中心运维摆脱对人的经验等方面的依赖,让数据中心更加智能化、易管理。此外iManager能对资产进行盘查,保证设备的完整性,保护重要数据;iManager还可以对资产匹配最适宜的供电、制冷、空间、带宽等资源,实现资源的最佳利用,利用AI技术,可协助对资产上下架和运营进行智能化的管理,提升运营效率和效益。通过AI实现数据中心能源管理的智能化,华为也获得了客户的认可,比如说某银行与华为联手打造智能运维管理平台,使得数据中心能够更加智能化。

双轮驱动,打造最懂客户需求的数据中心解决方案

我们知道华为的驱动力是“双轮驱动”,一个是客户需求,一个是技术发展。所以,华为做任何的技术或者产品都离不开客户的需求,一定要匹配客户的需求。何波说,“华为开发一个关键的产品和技术之前,都要和主要的行业客户进行对标,看看客户存在哪些问题,有什么痛点,然后华为再通过技术手段帮他们解决这些问题。”

众所周知,金融行业对于数据中心的可靠性会非常高,那华为是如何保障的?何波说,这种可靠性有几个层面,一个是部件设计的可靠,包括硬件和软件的设计。第二个层面是架构,比如说智能化的架构、智能化的切换,出了问题能够及时地自修复,通过技术手段实现架构上的可靠。第三,设备或者数据中心投入运行以后的运维管理易维护带来的可靠,减少人工的干预。

在部件可靠性方面,模块化数据中心、UPS、智能温控等产品是经过华为多年以来形成的一套可靠性管理体系做出来的产品。在这样的流程体系里面,华为对所有潜在的风险进行识别,转化为在实验室里进行模拟测试,每个产品都经过几千项的测试,包括自动化测试,保证产品本身的可靠性。

除了部件的可靠性,最重要的是采用智能化的技术手段使得架构更可靠。好的架构是一个部件坏了而不影响整个集体的运行,通过可自动切换、可实时监测或者提前预警,提前识别隐患。华为把AI技术运用到产品里面,通过对大量关键器件参数的采集和分析,提前识别到可能会出现的隐患,提醒用户采取措施。这就实现了自行修复和优化,甚至不需要人工干预,这就实现了最高层面的可靠性。比如UPS里面的易损件——电池、电容、风扇都要大量采用这样的技术,提前识别、预警,使得它的薄弱环节得以加强。

第三个层运维管理的可靠,华为通过免维护、免人工干预或者自动化的运维管理手段来强化可靠性。“设备的运行维护使用的过程中,越少的人工干预,越减少对人的依赖,让它自运行、自优化,我认为可靠性更高。”何波如是说。

业界很多人认为产品上市的时间越长就越可靠,这是一个错误的观念。在何波看来,可靠性应该是随着各种先进技术的发展而发展的。同时,为了保障华为的公信力,产品的可靠性通过第三方专业机构进行论证,比如说华为模块化数据中心通过了Tier IV-Ready认证,证明产品架构设计是可靠的。该认证是UPTIME颁发的全球首个TIER-Ready认证,同时也是最高级别的可靠性等级认证。

对于已经建成的客户的数据中心,能不能通过i³@AI技术进行技术改造呢?