7月30日,2022中国算力大会在济南开幕,大会突出创新、融合、绿色三大理念,多位知名院士专家、行业领军人物出席共话算力发展。蚂蚁集团基础设施委员会主席、绿色计算负责人何征宇应邀参会并接受了媒体专访,阐述蚂蚁集团在发展“绿色计算”技术上的实践和未来布局,并就提升计算效率对企业和社会的价值进行了深度探讨。

记者:为什么蚂蚁集团会发展绿色计算技术?互联网平台为什么需要巨大的算力?

何征宇:蚂蚁是一家互联网科技平台企业,有大家熟悉的支付宝、余额宝、蚂蚁森林等业务,此外蚂蚁集团还有数字科技产业,在区块链、数据库等非常基础的核心技术领域,我们已经开始服务一些重要的政府以及企业单位。在这个业务和产业背景之下,蚂蚁对算力的需求日益增长,并从软件侧观察到了算力使用效率的一些问题。

算力需求的飙升和粗放利用带来大量碳排放和能源消耗,这对于企业来说是一个巨大的发展成本,同时也是一个社会命题,需要企业主动去解决和提升。

记者:我国算力规模已达到全球第二,落实国家双碳战略,处理好发展和减排,提升算力效率迫在眉睫。技术减排的解决之道有哪些?

何征宇:我们都认同算力是重要的,是信息化时代的关键指标。算力应该有两个视角,一个是规模,一个是质量效率。降低数据中心PUE( 数据中心总能耗/IT设备能耗)是提高效率的重要手段,目前国内PUE已经可以降到非常低,PUE有极限值,再往下的进步空间变小,还有什么更好的方向?好比我们几乎都已用上优质节能灯,接下来的话题是如何更有效地使用节能灯。提高使用效率就需要“绿色计算”等技术来解决。目前业界在算力利用率上的平均水平不高,进步空间还很大。蚂蚁希望通过对绿色计算技术的研发和实践,探索一套聚焦于资源提效的技术体系,减少算力的浪费,助力算力更可持续地发展。

记者:蚂蚁探索和应用绿色计算技术的过程是怎么样的,难点在哪里,目前取得了什么效果?

何征宇:2017年,蚂蚁的算力需求进入翻倍增长。跟当时行业的情况一样,我们整个服务器利用率很低,不足10%,这是互联网业务的峰值特性导致的,为保障峰值业务而使用大量的服务器,闲置时就是巨大的浪费。

当时有一个契机,就是云时代到来。蚂蚁将自身架构做了云原生的整体升级,让蚂蚁整个集群形成了一个统一的资源池,形成了统一的可调度、可被伸缩的一个计算架构范式。这奠定了我们的绿色计算技术体系的基础。目前,蚂蚁的绿色计算能力包含了云原生、数据库存储引擎、绿色AI三大领域,其中云原生领域有三种主要技术:云原生分时调度、AI弹性容量和在离线混合部署技术。

2021年的双11期间,我们首次规模化应用了全套的绿色计算技术栈,根据第三方的审计,双11期间(10天)蚂蚁通过绿色计算减少了394吨碳排放,2021全年则减排了近3万吨,这个数字经过了北京国家金融科技认证中心的核查,也是国金认证印发的第一份碳减排核查证书。截至2021年,蚂蚁的服务器利用率已经提升到了之前的三倍以上。

关键的技术难度,在于真正有峰值来临时,计算资源是否能随时腾挪出来。解决这个问题,除了架构云原生化打下的基础,蚂蚁一直坚持的技术自主研发也起了很大作用。比如蚂蚁拥有业界领先的安全容器技术,相当于开发了一个新操作系统可以同时跑安卓、IOS,在整体 CPU 利用率达到80%以上时仍可以互不影响,在此前提下我们才能做好计算资源的调度。

记者:蚂蚁在绿色计算技术方面接下来有什么目标和计划?

何征宇:首先,蚂蚁会持续投入研发。今年我们将进一步深入解决底层存储问题,攻关数据库在离线混合部署技术,这是业界比较大的一个难点,但一旦将计算和存储打通,效率会显著提升。面向未来,蚂蚁正积极布局绿色AI技术。AI是未来算力的极大需求者,我们需要今天就开始着手攻克这个问题。

同时,蚂蚁希望能够对业界和社会开放我们的技术。前两天蚂蚁在开放原子基金会全球峰会上宣布了开源战略,就是要把蚂蚁的核心基础技术成熟一个开放一个。通过核心基础软件技术开源,降低整个行业的软件研发成本,为国家和社会创造更大的效益。今年蚂蚁集团还正式加入了“低碳专利承诺”,目前已经将首批7件“绿色计算”相关专利无偿开放,全球任何个人、企业、机构都可以免费使用这些专利。

另外,技术的进步需要源源不断的技术人才。蚂蚁也积极参与教育部产学合作协同育人项目,推出研究型实习生计划等项目,希望进一步开放我们的产业场景及技术资源,通过产学融合的方式,更好地助力解决包括绿色算力在内的社会性问题。

编辑:黄昂瑾
原创版权禁止商业转载 授权>>
转载申请事宜以及报告非法侵权行为,请联系我们:010-56807194
长按二维码
关注精彩内容