阅读 12

阿里自研芯片问世,含光800以一打十

刚刚,达摩院院长张建锋在杭州云栖大会现场展示了含光800AI芯片。在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,“含光800是阿里巴巴在芯片领域的万里长征第一步。”

平头哥自去年的云栖大会上宣布成立以来,在过去短短的一年里,先后发布玄铁910、无剑SoC平台;今年在2019云栖大会上达摩院院长张建锋展示了含光800芯片;这一系列的新产品的推出意味着,阿里的平头哥公司产品线的初步成型,目前已经涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。

含光800是什么

含光800是一款AI芯片,偏重推理。由于人工智能芯片的差异化设计主要体现在硬件架构和软件算法上,二者需要高度适配才能发挥芯片的最大价值。从目前来看,传统CPU、GPU在深度学习推理任务上并没有完全发挥硬件能力,例如GPU架构主要针对图像处理设计,其硬件结构、软件生态几乎固化,因此对AI任务很难有深度优化。

性能如何?

含光800的芯片架构方面,采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致;含光800性能的突破得益于软硬件的协同创新。

算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等领域拥有多年研发经验,此外,平头哥团队在体系结构、编译技术等领域拥有深厚的技术储备。

含光800芯片=10个GPU

含光800的数据性能表现十分突出,根据现场的keynote的数据显示,含光800性能大约相当于GPU的十倍,能效比到达500IPS/W;制作工艺也采用了12nm,而晶体管数高达170亿哥;小编在对比了同类型的AI芯片后得出,平头哥的这款含光800芯片在业界也是处于比较领先的位置。

含光800性能数据图

实际表现

含光800目前已经被应用在阿里巴巴核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。大家经常使用的拍立淘产品为什么这么快,也是得益于含光800的使用;拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,而使用含光800后可缩减至5分钟。

小编总结:

目前含光800的售价还未公布,但是由于采用线上售卖的方式;相信这一高性能的芯片会是一个高性价比的产品;而平头哥一系列芯片的发布,也意味着国内芯片的进步;在不久的奖来,小编期待着更多的国产高性价比芯片的出现。

关注下面的标签,发现更多相似文章
评论