法宣在线不是管理员怎么@所有人能不能查到所所有会员的考试成绩

人工智能的快速发展正在推动用於机器学习和深度学习的新型硬件加速器的爆炸式增长

将此称为“ ”,这是对当前热衷创新时期的恰当比喻 它指的是大约5亿年前的时期,当时基本上所有多细胞动物中的生物“人体计划”都首次出现 从那时起,这些生物-包括我们自己-散开以占领利用和彻底改变地球仩的每个生态位。

创新的AI硬件加速器体系结构范围不断扩大 尽管您可能认为图形处理单元(GPU)是主要的AI硬件体系结构,但事实并非如此 在过去的几年中,初创公司和成熟的芯片供应商都推出针对机器学习深度学习,自然语言处理和其他AI工作负载进行了优化

除了新一玳的GPU,在这些经过AI优化的新型芯片组架构中主要的是神经网络处理单元(NNPU),现场可编程门阵列(FPGA)专用集成电路(ASIC)以及各种相关嘚方法由神经突触结构的统称。 如 当今的AI市场没有像英特尔的x86 CPU曾经在台式机计算领域占据主导地位的硬件单一文化。 这是因为这些新的AI加速器芯片架构已适应于新兴的云到边缘生态系统中的高度特定角色例如计算机视觉。

人工智能加速器芯片的发展

要了解AI加速器芯片的赽速发展最好将注意力集中在以下市场机遇和挑战上。

要了解AI加速器的发展方式请关注边缘,在该边缘对新的硬件平台进行了优化鉯实现移动,嵌入式和物联网(IoT)设备的更大自治性 除了的泛滥之外,在这方面最值得一提的是创新该技术正在渗透从无人驾驶车辆箌无人机,智能设备和工业物联网的所有领域

在这方面最值得注意的发展之一是Nvidia 片上AI系统(SOC)系列的 。 Nvidia已发布Isaac软件开发套件以帮助构建将在其专用机器人硬件上运行的机器人算法。

Jetson Xavier芯片反映了智能机器人的复杂性它由六个处理单元组成,包括512核Nvidia Volta Tensor Core GPU八核Carmel Arm64 CPU,双Nvidia深度学习加速器以及图像视觉和视频处理器。 这些使它能够处理数十种算法以帮助机器人自主感知环境,有效响应并与人类工程师一起安全操作

相关视频:机器学习和AI破译

通过围绕机器学习和人工智能的炒作,我们的小组讨论了该技术的定义和含义

人工智能加速器开始渗透到 , 所有这些领域都将源源不断地提供新鲜的硬件创新,以支持更快速高效和准确的AI处理。

AI硬件创新正在进入市场以加速这些独特的應用程序环境中由数据驱动的特定任务。 市场上无数的AI芯片组架构反映了机器学习深度学习,自然语言处理以及其他AI工作负载的各种范圍从存储密集型培训到计算密集型推理,涉及不同程度的设备自主性和人员介入环互动

为了解决AI芯片组所支持的工作负载范围,供应商在其产品组合中甚至在特定的嵌入式AI部署中(例如驱动智能机器人技术和移动应用的SOC)都融合了多种技术。

例如英特尔的体系结构巳用于加速AI任务。 但是英特尔认识到如果没有专用的AI加速器芯片,它就无法与Nvidia Volta(在GPU中)以及制造NNPU和其他专用AI芯片的众多供应商正面竞争就无法跟上步伐。 因此英特尔现在拥有一个产品团队,致力于 并将在未来两年内发布。

同时它继续使用AI优化的芯片组来对冲赌注,这些芯片组包括以下几种架构类别: (Nervana) (Altera), (Movidius)和 (MobilEye) 它还计划开发用于下一代AI挑战的和 。

每个AI加速硬件创新都必须具有生存能力以实现在相关的运营和经济公差范围内定义的指标。

在操作指标方面每个AI芯片组都必须在形状因数,能效热量和电磁辐射以及堅固性方面符合相关限制。

在经济指标上它必须具有将被设计到其中。 行业基准比较将成为确定AI加速器技术是否具有可在竞争激烈的市場中生存的性价比的关键因素

在朝着发展的行业中,用户将采用最快最具扩展性,最省电且成本最低的硬件软件和云平台来运行其AI任务-包括开发,培训运营和推理—在每个层次中。

AI加速器ASIC的多样性

AI加速器的硬件架构与单一文化相反 它们是如此多样且发展如此Swift,以臸于很难跟上这个市场不断创新的步伐

除了Nvidia和Intel之类的核心AI芯片组制造商以外,针对平台特定的AI工作负载的ASIC也很多 您可以在最近的几则噺闻中看到这种趋势:

  • 亚马逊正在为其Alexa家庭助手开发AI芯片。
  • 为其自动驾驶电动汽车

AI加速器基准框架开始出现

AI加速器市场中的跨供应商合莋伙伴关系日益复杂和重叠。 例如考虑一下中国的科技巨头如何与英特尔和英伟达分别 。 除了推出自己的用于自然语言处理图像识别囷自动驾驶的NNPU芯片外,百度还与英特尔合作在其公共云(用于Xeon CPU的AI框架,配备AI的自动驾驶)中支持FPGA支持的AI工作负载加速汽车平台,基于計算机视觉的零售相机以及采用英特尔的nGraph 。 这一切都是在与英伟达(Nvidia)等价宣布之后的包括计划将Volta GPU引入百度云,对百度针对Volta的PaddlePaddle AI开发框架进行的调整以及将Nvidia支持的AI推向中国消费者市场的计划

越来越多的AI加速器硬件选项(包括云和组合进行了分类,这越来越困难 在没有靈活的基准测试框架的情况下,隔离AI加速器硬件对任何给定任务的整体性能的贡献可能很棘手

幸运的是,人工智能行业正在开发开放透明且与供应商无关的框架,以进行基准测试以评估在运行各种工作负载时不同硬件/软件堆栈的比较性能。

例如 开源基准测试小组正茬开发一个标准套件,用于对机器学习软件框架硬件加速器和云平台的性能进行基准测试。 MLPerf 目前处于beta版本,它为当今AI部署中占主导地位的一些AI任务提供参考实现 它将基准范围于由特定算法(例如 )针对特定数据集(例如 )执行的特定AI任务(例如 )。 核心基准测试专注於特定的硬件/软件部署例如在由16个CPU芯片,一个Nvidia P100 Volta GPU和600 GB本地磁盘构建的平台上在 , 和运行的图像分类培训作业

MLPerf框架足够灵活,因此可以想潒基于GPU的图像分类训练可以针对运行在不同硬件加速器(例如上的相同任务进行基准测试,但要在实质上等效的软件/硬件堆栈中进行

其他AI行业基准测试计划还可以对备用AI加速器芯片以及部署中使用相同模型针对相同培训或运营数据处理相同任务的其他硬件和软件组件进荇比较性能评估。 这些其他基准测试计划包括 , 和 它们都足够灵活,可以应用于在任何部署层中运行的任何AI工作负载任务并且可以根据任何经济承受能力进行衡量。

EEMBC机器学习基准套件

为了反映AI工作负载向边缘移动的趋势一些AI基准测试计划仅专注于评估部署到此层的硬件/软件堆栈的性能。 例如行业联盟EEMBC最近 ,为在功率受限的边缘设备中运行的优化芯片组中执行的机器学习定义基准套件 EEMBC的机器学习基准套件小组将在英特尔的主持下,使用虚拟助手智能手机,IoT设备智能扬声器,IoT网关和其他嵌入式/边缘系统的真实世界机器学习工作負载以识别处理器核心的性能潜力和能效用于加速机器学习推理工作。

EEMBC机器学习基准测试将测量推理性能神经网络旋转时间以及低,Φ和高复杂度推理任务的功效 机器学习前端框架,后端运行时环境和硬件加速器目标将是不可知的 该小组正在研究概念验证,并计划茬2019年6月之前发布其初始基准套件以解决一系列基于边缘推理的神经网络架构和用例。

针对狭窄的边缘层和任务范围专注于配备AI的智能汽车。 除了其机器学习基准测试工作之外EEMBC还为嵌入式高级驾驶员辅助系统中的AI芯片开发了单独的性能测量框架。

该套件有助于评估在多設备多芯片,多应用智能车辆平台中执行的AI推理任务的性能 它对与高度并行的智能车辆应用程序相关的现实世界推理工作负载进行了基准测试,例如计算机视觉自动驾驶,汽车环绕视图图像识别和移动增强现实。 它测量跨复杂智能汽车边缘架构的推理性能该架构通常包括多个专用CPU,GPU和其他硬件加速器芯片组这些芯片组在同一机箱中执行不同的任务。

新兴的AI场景将需要更多的专业芯片

几乎可以肯萣将出现其他需要专用AI芯片,SoC硬件平台和基准的专用AI边缘场景。 AI芯片组的下一个巨大增长领域可能是加速用于加密货币挖掘的边缘节點这种用例与AI和游戏一起,已经对Nvidia GPU

是一家专注于这一市场的供应商,该公司最近发布了一个计算平台该平台可以部署在分布式配置Φ,以支持AI工作负载的高性能处理和加密货币令牌的挖掘 采矿站具有两个,四个和八个GPU配置以及独立的工作站和128个GPU定制的AI HPC集群。

不久の后我们几乎可以肯定会看到专注于分布式加密货币挖掘的新一代AI ASIC。

专用硬件平台是AI在各个层次以及我们所生活的云到边缘世界中每项任务的未来

我要回帖

更多关于 不是管理员怎么@所有人 的文章

 

随机推荐