作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑
华为发布全球最快AI训练集群Atlas 900.

918日开幕的华为全联接大会上,华为首次发布计算战略,并重磅发布了全球最快AI训练集群Atlas 900

    全球训练最快的AI集群Atlas900有多厉害?

l  采用算力最强AI处理器昇腾910

l  Atlas 900 AI训练集群由数千颗昇腾910互联

l  世界顶级强劲算力:总算力达到256-1024 PFLOPS@FP16。相当于50万台PC计算能力

l  业界最快:实测仅需59.8秒即可完成基于ImageNet数据集训练ResNet-50模型

l  全球算力巅峰Atlas 900:相当于50万台PC

去年全联接大会上,华为发布了全栈全场景的AI解决方案,现如今,用于训练的昇腾处理器和AI计算框架MindSpore都已经发布了,这标志着,华为的全栈全场景AI解决方案全面落地。在今天的全联接大会上,华为发布了一款重量级的产品——Atlas 900,这是当前全球最快的AI训练集群,由数千颗昇腾处理器组成。

Atlas 900 AI训练集群:

ü  采用算力最强AI处理器昇腾910

ü  Atlas 900 AI训练集群由数千颗昇腾910互联

ü  世界顶级强劲算力:总算力达到256-1024 PFLOPS@FP16。相当于50万台PC计算能力

ü  业界最快:实测仅需59.8秒即可完成基于ImageNet数据及训练ResNet-50模型

ü  华为自研HCCS片间互联240Gbps,单端口速率业界领先

ü  采用最新PCIE 4.0接口,速率为当前业界2

ü  100G RoCE 高速集群互联网络

ü  HCCL通信库+网络拓扑+训练算法=实现线性度>80%

    在衡量AI计算能力的金标准ResNet-50模型训练中,Atlas 900只用了59.8秒就完成了训练,这比原来的世界纪录还快了10

ImageNet-1k数据集包含128万张图片,精度为75.9%,在同等精度下,其他两家业界主流厂家测试成绩分别是70.2s76.8sAtlas 900 AI训练集群比第2名快15% 胡厚崑表示:Atlas 900的强大算力,可广泛应用于科学研究和商业创新。比如天文探索、石油勘探等领域,都需要进行庞大的数据计算和处理,原来可能花费好几个月的工作,现在交给Atlas 900,就是几秒钟的事情。

Atlas 900集成的数千颗昇腾处理器,正是前段时间正式商用的昇腾 910

 

昇腾910号称算力最强的 AI 处理器,基于 7nm 增强版 EUV 工艺,单 Die 内建 32 颗达芬奇核心,半精度 (FP16) 算力达到 256 Tera-FLOPS,整数精度 (INT8) 算力达到 512 Tera-OPS,而且,达到规格算力所需功耗仅 310W

Atlas 900总算力达到256-1024 PFLOPS@FP16,相当于50万台PC计算能力。作为对比,谷歌的 TPU 3.0,性能是 100 petaflops

此外,华为还发布了基于昇腾的华为云EI集群服务。为了让大家马上就能用上Atlas 900的超强算力,它已经被部署到华为云上,并以极优惠的价格向全球科研机构和大学开放。

胡厚崑:华为新一轮沃土计划将投资15亿美元

华为副董事长胡厚崑登台分享了华为在计算方面的洞察与战略。根据Gartner的数据,预计到2023年,计算产业的规模将超过2万亿美元。胡厚崑分享了计算智能时代的三个重要特征:

一.需要超强的算力。统计计算本身就是一种暴力计算,高度依赖于算力。举个例子,为了让计算机认识一只猫,就需要数百万图片的训练,这对算力的消耗是非常惊人的,面向自动驾驶、天文探索、气象预测等更复杂场景,对算力的需求将会更大。

二.计算和智能将会无处不在,而不仅仅是分布在中心侧。从中心节点的暴力计算,到边缘侧的专业计算,如基因测序,以及端侧的个性计算,如耳机、手机,一起构成了未来智能时代的计算形态。

三.端边云之间需要高效的协同。中心侧负责通用模型的计算,为端侧的个性化计算和边缘侧的专业化计算,提供协同支撑。
   
此外,华为首次发布了计算战略,从四个方面来布局,包括对架构创新的突破、对全场景处理器族的投资,坚持有所为有所不为的商业策略,以及不遗余力地构建开放生态。

架构创新

而目前产业界算力供给却是稀缺的,算力供给的关键在于处理器的效能,当前摩尔定律已经几乎走到极限的时候,从产业发展角度,我们必须要在处理器架构上寻求突破,要用新的处理器架构来匹配算力的增速。

另一方面,从华为自身的业务布局来看,既有网络业务,也有终端业务,又涉及公有云服务,全面覆盖端、边、云,所以全场景智能,本身就是华为业务智能化的基本需求。

因此,华为推出了达芬奇架构,以实现计算和智能的无处不在,这是自然而然的选择。到目前为止,达芬奇计算架构是业界唯一能够覆盖端、边、云全场景的处理器架构,这也是华为打造计算产业的坚实基础。

投资全场景处理器

处理器是整个计算产业最基础的部分,经过多年投资努力,华为已经发布了多个系列的处理器。具体包括支持通用计算的鲲鹏系列,支持AI的昇腾系列,支持智能终端的麒麟系列,以及支持智慧屏的鸿鹄系列。未来将持续不断地对处理器进行投资,将来还将推出一系列处理器,面向更多的场景。
   
商业策略“有所为有所不为”
    华为的商业策略,用一句话概括就是“有所为有所不为”。总体而言,我们不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机。具体来说,有三个方面的考虑:

硬件开放:我们把服务器主板、AI模组和板卡等硬件开放给伙伴,帮助伙伴做好整机和解决方案。

软件开源:我们把服务器操作系统、数据库、AI开发框架等软件开源,帮助伙伴做好商用版本,让软件开发更简单。

使能应用开发和迁移:我们不做应用,但我们提供工具和团队,帮助伙伴更高效地做好应用开发和迁移。
   
构建开放生态
    胡厚崑表示:计算产业是个开放的产业,高度依赖于生态,需要全球的协作。华为沃土计划发布四年来发展得非常好,目前已汇聚500万开发者,在今天的大会上,华为将正式宣布新一轮的沃土计划,这个计划华为将投资15亿美元。

当前,边缘计算和工业互联网成为智能+时代的硬核驱动,万物互联的5G、智联网正在启动,全球AI生态系统面临重建。

在此背景下,中国AI产业亦将增强原创能力,技术攻坚,展现出“头雁”效应。与此同时,在世界范围内秉承开放开源共享共赢的态度已是业界共识,急需重启一个AI无处不在的未来。

发布日期:2019918

来源:新智元



发布日期: 2019-09-25    访问总数: 16