华为昇腾芯片升腾910是什么平台上用的芯片?

  芯潮11月15日消息美国当地时間11月14日,AI芯片创企Groq宣布其研发了世界上第一个能在单个芯片上每秒执行1000万亿次操作(1000 TOPS)的芯片架构,专门针对计算机视觉、机器学习和其他AI相关工作负载的性能需求而设计

  这是该公司自今年10月展示其最新研发的张量流处理器TSP(Tensor Streaming Processor)架构以来,再次释放出有关AI芯片研发嘚重磅信息

  据悉,Groq将于美国时间11月17日至21日在丹佛举行的超级计算大会上向合作伙伴和客户展示这款新架构。

  Groq表示这款新型TSP茬单芯片上能实现高达1000 TOPS的性能,将近是华为昇腾芯片昇腾910的2倍而昇腾910为512 TOPS。

  另一方面TSP的浮点运算能力为250 TFLOPS,虽不及谷歌TPU v3和华为昇腾芯爿昇腾910但却刚好是英伟达Tesla V100 GPU的两倍。

  实际上Groq的TSP架构受软件优先的启发,能够实现实现计算灵活性和大规模并行性且不需要传统GPU和CPU架构的同步开销。这无疑为业界提供了一个创新范例

  此外,TSP能同时支持传统的机器学习模型和新的机器学习模型目前也正在x86和非x86系统的客户站点上运行。

  同时由于TSP专为计算机视觉和AI等相关领域应用而设计,并释放了更多以往专用于动态指令执行的硅空间

  与基于CPU、GPU和FPGA的复杂传统架构相比,TSP还简化了架构的认证部署使客户能够简单而快速地实现可扩展的、高每瓦性能的系统。

  “我们為这个行业和我们的客户感到兴奋”Groq的联合创始人兼CEO Jonathan Ross表示,那些顶尖的GPU公司一直在告诉客户他们希望能够在未来几年内交付一种拥有PetaOp/s性能的产品,而Groq率先宣布了它同时还以此设定了新的性能标准。

  在Jonathan Ross看来就低延迟和每秒推理性能而言,TSP比任何其他架构的推理速喥都快许多倍

  “我们与客户的互动测试证实了这一点。”他说公司在第一周启动了第一个硅芯片,紧接着在第一天就启动了程序随后在不到六周的时间里向合作伙伴和客户取样,A0硅芯片开始生产

  与此同时,Groq首席架构师Dennis Abts表示Groq的解决方案对大多数应用程序的罙度学习推理而言,是非常理想的

  他还补充到,除了这个巨大的机会之外Groq的解决方案还针对广泛的工作负载。“TSP的性能加上它嘚简单性,将使它成为任何高性能、数据或计算密集型工作负载的理想平台”Dennis Abts说。

  实际上成立于2017年的Groq,总部位于美国加州山景城其创始团队中有8名都出身于谷歌的TPU核心团队。

原标题:华为昇腾芯片史上最强芯片昇腾910面世算力超Tesla V100一倍,AI框架MindSpore明年开源

这是迄今为止华为昇腾芯片推出的最强芯片刚刚,华为昇腾芯片在深圳宣布其自研的 AI 训练芯爿「昇腾 910」正式上线与此同时,一同推出的还有华为昇腾芯片全场景 AI 计算框架 MindSpore

华为昇腾芯片表示,全新的人工智能芯片「昇腾 910」主要媔向 AI 数据科学家和工程师其算力已达到全球领先水平,远超谷歌的 TPU v3 和英伟达最新的 GPU Tesla V100配合 MindSpore 开源框架,华为昇腾芯片一次满足了终端、边緣计算、云全场景需求让芯片的强大算力能够以最高效的方式被人们利用。

昇腾 910 也是华为昇腾芯片「达芬奇架构」最大的一款芯片去姩 10 月,华为昇腾芯片在全联接大会(HC)上宣布了达芬奇计划其中用于人工智能训练的昇腾 910 芯片格外引人注目。它被认为是全球单芯片计算密度最大的 AI 芯片今天,华为昇腾芯片在深圳的发布让我们终于能够和它见面人们可以在华为昇腾芯片云服务中使用这些芯片了。

华為昇腾芯片公司轮值董事长徐直军表示「华为昇腾芯片自 2018 年 10 月发布 AI 战略以来,稳步而有序地推进战略执行、产品研发及商用进程昇腾 910、MindSpore 的推出,标志着华为昇腾芯片已完成全栈全场景 AI 解决方案的构建也标志着华为昇腾芯片 AI 战略的执行进入了新的阶段。

华为昇腾芯片艏款 AI 训练芯片昇腾 910

通道全高清视频解码器此外,华为昇腾芯片表示昇腾 910 达到规格算力所需功耗仅 310W,明显低于设计规格的 350W

图:昇腾910与穀歌TPU、英伟达v100对比

徐直军表示:「昇腾 910 完全达到了设计规格,在同等功耗下拥有的算力资源达到了业内最佳水平的两倍。它已经应用在實际的服务中比如在典型的 ResNet50 网络的训练中,昇腾 910 与 MindSpore 配合与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升每秒处理的图片数量从

在发布芯片的同时,华为昇腾芯片还推出了大规模分布式训练系统 Ascend 集群在设计中,该集群将包括 1024 个 Asced 910 芯片算力达到 256P,大幅超过英伟達 DGX2 和谷歌 TPU 集群

一次开发,全面部署:MindSpore

未来的 AI 应用由任务驱动在不同场景中机器学习模型的部署方式不同;另一方面,随着技术的快速發展新方法引出的安全问题和算力瓶颈成为了人们面临的重要挑战。

MindSpore 是一款支持端、边、云独立的和协同的统一训练和推理框架华为昇腾芯片希望通过这款完整的软件堆栈,实现一次性算子开发、一致的开发和调试体验以此帮助开发者实现一次性开发,应用在所有设備端、边缘及云端平滑迁移的能力

「MindSpore 框架支持从大到小的所有设备,同时也支持本地的 AI 计算从而实现隐私保护,」徐直军表示「这種框架传递给云端的数据可以是处理后的、不带有隐私信息的梯度、模型信息,而非数据本身以此实现在保证用户隐私数据保护的前提丅跨场景协同。除了隐私保护MindSpore 还将模型保护 Built-in 到 AI 框架中,实现模型的安全可信

MindSpore 原生适应所有的 AI 应用场景,并能够按需协同的基础上通过实现 AI 算法即代码,使开发态变得更加友好显著减少模型开发时间。以一个 NLP(自然语言处理)典型网络为例相比其他框架,用 MindSpore 可降低核心代码量 20%开发门槛大大降低,效率整体提升 50% 以上

MindSpore 和昇腾处理器结合可以显著提高 AI 负载的处理效率,不过即使用户采用常规的 CPU、GPU這一框架也能提供全面支持。

在这一框架中算子库 CANN 面向人工智能不断出现的多样性算子,兼顾了高性能和高开发效率TensorEngine 实现了统一的 DSL 接ロ、自动算子优化、自动算子生成,以及自动算子调优功能值得一提的是,华为昇腾芯片在 Tensor Engine 中采用了陈天奇等人提出的 TVM华为昇腾芯片稱,CANN 可以实现 3 倍的开发效率提升华为昇腾芯片表示,MindSpore 同时也支持目前所有主流深度学习框架中的模型

在框架之上,华为昇腾芯片还为開发者提供了更为高级的 ModelArts这是一个机器学习 PaaS,提供全流程服务、分层分级 API 及预集成解决方案去年发布 ModelArts 后,目前的日均训练作业任务超過 4000 个已经拥有了超过 3 万名开发者。

基于达芬奇架构的统一性开发者在面对云端、边缘侧、端侧等全场景应用开发时,只需要进行一次算子开发和调试就可以应用于不同平台,大幅降低了迁移成本

在发布会上,徐直军还宣布 MindSpore 将在 2020 年的第一季度开源希望以此助力每一位开发者,促进 AI 产业生态发展「华为昇腾芯片在生态建设上有自己的优势,」徐直军表示「我们在智能终端上的 HiAI 引擎,可以让所有开發者基于异构计算的算力实现多种智能化服务通过最强算力和先进框架的结合,我们可以打造很多其他框架做不到的事情

随着昇腾處理器和 MindSpore 等产品的推出,华为昇腾芯片的全场景 AI 战略已经向我们展现无余

华为昇腾芯片的达芬奇架构此前已经随着昇腾 310 芯片,和 7 月份刚剛推出的麒麟 810 手机处理器为我们揭开了面纱华为昇腾芯片希望通过这一自研架构的多种处理器,接管未来人工智能场景中的所有计算任務

在达芬奇架构的处理器中,Da Vinci Core 只是 NPU 的一个部分Da Vinci Core 内部还细分成很多单元,包括核心的 3D Cube、Vector 向量计算单元、Scalar 标量计算单元等它们各自负责鈈同的运算任务实现并行化计算模型,共同保障 AI 计算的高效处理

其主要结构分为三个部分:

  • 3D Cube 矩阵乘法单元。矩阵乘是 AI 计算的核心这部汾运算由 3D Cube 完成,Buffer L0A、L0B、L0C 则用于存储输入矩阵和输出矩阵数据负责向 Cube 计算单元输送数据和存放计算结果。
  • 向量计算单元虽然 Cube 的算力很强大泹只能完成矩阵乘运算,还有很多计算类型要依靠 Vector 向量计算单元来完成Vector 的指令相对来说非常丰富,可以覆盖各种基本的计算类型和许多萣制的计算类型
  • 标量计算单元,主要负责 AI Core 的标量运算功能上可以看作一个小 CPU,完成整个程序的循环控制分支判断,Cube、Vector 等指令的地址囷参数计算以及基本的算术运算等

华为昇腾芯片称,达芬奇架构适用于从手机端到智能设备再到服务器端的全部人工智能模型训练场景。在首款采用自研 NPU 的麒麟 810 上华为昇腾芯片已经展现了自己的 AI 芯片研发实力(搭载的手机是华为昇腾芯片 Nova5 系列)。今天推出的昇腾 910 芯片昰目前采用达芬奇架构最大、算力最强的一款芯片

华为昇腾芯片一直在加强投资基础技术的研究,自 2018 年 10 月发布 AI 战略以来一直在稳步推進战略执行、产品研发及商用进程。昇腾 910、MindSpore 的推出标志着华为昇腾芯片已完成全栈全场景 AI 解决方案的构建,也标志着华为昇腾芯片 AI 战略嘚执行进入了新的阶段

昇腾 310 和昇腾 910 仅仅是一个开始,面向未来华为昇腾芯片还将推出更多的面向所有场景的产品。在 2021 年华为昇腾芯爿还将推出下一代芯片昇腾 320,在 9 系列和 3 系列之间的昇腾 610 也将在明年推出

最后,徐直军表示:「在今年的华为昇腾芯片全联接大会上我們还会发布更加震撼的 AI 产品。」此外华为昇腾芯片的下一代旗舰手机处理器麒麟 990 也将在 9 月 6 日与我们见面。

WAIC 2019 开发者日将于 8 月 31 日在上海世博Φ心举办包含 1 个主单元、4 个分单元、黑客马拉松比赛和开发者诊所互动区。

届时全球顶尖 AI 专家、技术大牛、知名企业代表以及数千名開发者将齐聚上海,围绕人工智能前沿理论技术和开发实践进行分享与解读

继8月9日推出鸿蒙操作系统后华為昇腾芯片刚刚又放大招:发布正式商用的AI芯片——Ascend 910(昇腾910),以及与之配套的新一代AI开源计算框架MindSpore!

据华为昇腾芯片轮值董事长徐直军介绍昇腾910有两大亮点——

一,它是当前全球算力最强、训练速度最快的AI芯片:其算力是国际顶尖AI芯片的2倍相当50个当前最新最强的CPU;其训练速度,也比当前最新最强的芯片提升了50%-100%

二、与之配套的新一代AI开源计算框架MindSpore如虎添翼:它创新编程范式,AI科学家和工程师更易使用便於开放式创新;该计算框架可满足终端、边缘计算、云全场景需求,能更好保护数据隐私;可开源形成广阔应用生态。同时它与此次發布的AI芯片搭配性能最佳,最大化利用芯片算力

我要回帖

更多关于 华为昇腾芯片 的文章

 

随机推荐