IT时报记者 王昕
Gaudi,是个浪漫的名字,取自著名西班牙艺术大师高迪之名,在近日举行的re:Invent 2020 CEO主题大会上,AWS 宣布了采用多达8个Habana Gaudi加速器的EC2实例,比目前GPU的EC2实例在机器学习性价比上提升了40%,基于Gaudi的EC2实例计划于2021年上半年提供给用户使用。
AWS首席执行官Andy Jassy强调了各行业对高性能、更实惠的人工智能工作的巨大需求。随着公司计划引入以Gaudi为特色的新EC2实例进行深度学习训练,AWS将进一步降低AI数据集的训练成本,并降低希望利用AI提供业务分析、改善效率和增强用户体验的客户的运营总成本。
据悉,Habana Labs是一家创立于以色列的科技公司,专注于提供高性能的用于AI训练和AI推理的AI处理器和解决方案。2020年1月Habana Labs被英特尔收购,成为旗下独立运营的子公司。
8卡的Gaudi 解决方案可以在TensorFlow上每秒处理12000张图像训练ResNet-50模型。每个Gaudi处理器集成了32GB的HBM2内存,并集成了用于服务器内部处理器互联的RoCE功能。凭借AWS弹性架构适配器(EFA)的技术可以跨服务器扩展,从而允许AWS及其客户无缝地扩展使用多个基于Gaudi的系统以实现高效和可扩展的分布式训练。
近几年来虽然越来越多的异构架构计算解决方案出现在AI推理和预测端,但在训练领域一直是以英伟达产品为主,很难有其他的客户在这边有所突破。Habana Labs中国区总经理于明扬表示,这一次Habana和AWS联合发布的信息,给了企业客户一个新的选择,“在训练端我们确实可以通过不同的架构来实现对AI的加速,同时在不同的架构中,也可能会给客户带来更不一样的体验。”
对于英特尔去年对Habana公司的收购,于明扬表示,英特尔的平台对Habana来说是最理想的,英特尔在AI市场有一个统一的平台架构,英特尔可以帮助Habana从一个简单的产品变成一个完整的生态,我们也可以和英特尔很多产品做整合,提供一个完整的解决方案,面向于不同客户的应用场景以及不同客户需求的完整解决方案。
据介绍,Habana在中国的业务现在发展良好,已与头部和二线互联网公司建立广泛合作,部分互联网公司已经开始使用和批量采购Habana产品。
于明扬坦言,用户选择AI产品时考虑得最多的是性价比和软件生态两大痛点,而Habana将围绕这两点为客户提供足够的竞争力。
据悉,目前Habana Gaudi采用16纳米制程,功耗约260W~300W。英伟达A100是7纳米制成,Habana Gaudi在功耗上比A100略有一点优势。
“Habana Gaudi在整个架构上相对于A100没有任何劣势。”于明扬表示,Habana接下来的布局是利用新的制程工艺提升现有产品的设计,Habana在后续训练产品发展中会采用7nm制程;同时,Habana还将配合英特尔打造OneAPI软件生态。
英特尔亚洲人工智能销售技术总监伊红卫认为,目前全球AI发展还在早期,还有很长的路可以走,在AI方面,英特尔有了Habana,未来还有GPU、FPGA,至强处理器也会有更多投入,“英特尔各个方面的战略和投入,从近期到远期,甚至是量子计算,所有产品布局都是围绕着AI、高性能计算等领域的。”