智能芯片+解决方案，遥望地平线的余凯能否迎来曙光？

编辑 | Vincent

AI 前线导读：“今天，地平线机器人科技举办了产品发布会，在会上公布了该公司自主研发的嵌入式智能视觉芯片，同时发布三个智能解决方案，分别面向：智能驾驶、智能城市以及智能商业。

沉寂许久之后，这是地平线第一次公开发布新产品，对于关注地平线许久的人来说，这无疑是一爆炸性的新闻。离开百度之后，走上创业之路的余凯终于在今天用实力展示了地平线布局 AI 的决心和志向，遥望“地平线”许久的他，能否如愿看到属于自己的光芒万丈？”

2017 年 12 月 20 日下午 14：00，北京，中国大饭店。

地平线机器人科技在其产品发布会上，发布了号称中国首款、全球领先的嵌入式人工智能视觉芯片 BPU（Brain Processing Unit）：面向智能摄像头的“Sunrise”旭日处理器和面向智能驾驶的“Journey”征程处理器。

地平线机器人技术创始人，前百度深度学习研究院领导人余凯博士在会上表示：早在 2015 年，地平线公司创立之时，就在行业中率先提出：打造人工智能芯片架构（BPU），比谷歌提出 TPU 架构的时间更早。

据介绍，该芯片功耗可低至 1.5W，能够同时对行人、机动车、非机动车、车道线、交通标志牌、红绿灯等 8 类目标进行精准的实时检测与识别。

除此之外，地平线还在会上公布了三个智能解决方案，分别面向：智能驾驶、智能城市以及智能商业，后两个解决方案将应用地平线的嵌入式人工智能视觉芯片，集合独有的的深度学习算法，在前端能够实现大规模人脸检测跟踪、视频结构化等应用，可广泛用于智能安防、智慧城市等场景。

AI 前线在现场得到了地平线此次发布芯片的详尽参数：

该芯片基于高斯架构，可以完成一路 1080P@30fps 的视频输入，可对毎帧图像中的 200 个目标进行检测识别；典型功耗仅为 1.5W，并且延时小于 30ms。

同时，余凯博士还在现场公布了未来几年地平线在芯片领域的战略：

2018 年，地平线将推出基于伯努利架构，拥有新型稀疏二值化神经网络结构的新款智能芯片；2019 年，将推出可同时处理 12 路 4K@30fps 视频输入的高性能芯片。

到 2025 年，中国道路上 3 千万新车都将具备自动驾驶功能，每辆自动驾驶汽车的“大脑”都基于地平线的人工智能处理器。

地平线酝酿许久的“大招”

自 2015 年 7 月成立以来，地平线目前已经发布了车道线 / 车辆 / 行人检测的智能驾驶辅助系统、 “安徒生平台”两款智能系统，分别应用在智能驾驶和智能家居领域。2016 年 7 月，在获得了新一轮融资后，地平线方面曾表示，这笔投资将用来加大对自动驾驶和智能家居领域的研发投入，加快产品研发和落地速度；推进人工智能芯片和系统的研发。在此后的 2016 年 9 月，地平线成立了南京研发中心，智能芯片的研制开始步入正轨。

从 2016 年 9 月到 2017 年 12 月这一年多的时间里，地平线仿佛从技术领域失踪了一般，对外不再放出半点消息，甚至一度引发外界猜想：如今已是战场一般的 AI 领域，地平线是否还能继续生存下去？

终于，在 2017 年 12 月，AI 前线收到来自地平线的邀请，前来参加本次的产品发布会。当了解到新品发布极有可能是芯片的时候，我们明白了：原来一直潜心钻研，默不作声的地平线是在酝酿这样的一个“大招”。

芯片大招已发，战场上能否绝杀？

现在，地平线的芯片也已发布，大招已发，但在这已经刮起风暴的智能芯片战场上，能否起到一击必杀的效果呢？纵观全球，在智能芯片领域进行布局的技术企业都已抢占了各自的山头，我们来看看目前 AI 战场的战况：

国外战场主要以大厂为主要战斗力，Intel、Nvidia、Google、Microsoft 四家老牌技术大厂各自占据一片沃土，布局 AI，疯狂生长，颇有些巨头争霸的态势。

Intel——老牌芯片厂试图焕发新机

自动驾驶车辆已经成为人工智能的主要目标之一，而 Intel 想要在这一领域牢牢巩固自己的地位。

然而，Intel 并没有把全部的精力放在内部研发上，而是通过收购来构建自身的 AI 能力。2016 年 8 月，Intel 收购了神经网络处理器制造商 Nervana Systems。

2016 年 11 月，在收购 Nervana 几个月后，Intel 宣布推出一系列处理器——Nervana，一个直接针对人工智能相关应用，如训练神经网络的平台。Intel 数据中心事业部执行副总裁兼总经理 Diane Bryant 说道：“我们期望 Intel 的 Nervana 平台再性能上能够有所突破，并大大缩短训练复杂神经网络所需的时间。预计十年之内，Intel 的性能将提高 100 倍，加速新兴的深度学习领域创新的步伐。“

2017 年 3 月，Intel 又高调地收购深度学习 ADAS 开发商 Mobileye，收购总额约为 150 亿美元。Intel 的并购战略几乎立即产生重大意义。这家芯片制造商希望在自动驾驶车辆领域占有一席之地，而且这一战略也让其一跃成为机器学习硬件的关键供应商。

去年 11 月在洛杉矶举行的 Automobility LA 贸易展览会上，Intel CEO Brian Krzanich 称，自动驾驶已成为如今最大的 game changer，并宣称 Intel 在收购 Mobileye 公司后推出的新产品 SoC 和 EyeQ5，比其最大的竞争对手——Nvidia's Xavier 的深度学习平台性能提高两倍。

Nvidia——独霸 GPU，傲视群雄

虽然市场上有不少 GPU 公司，但没有哪家公司比 Nvidia 作为这个技术的代名词更贴切。根据 Jon Peddie 研究公司的报告，Nvidia 在 2017 年第三季度的 GPU 出货量增长了 29.53％，主要竞争对手 AMD 和 Intel 在这方面均败下阵来。AMD 的出货量增加了 7.63％，而 Intel 的出货量增加了 5.01％。当然，这主要是由于视频游戏市场的推动，但 Jon Peddie Research 的分析师认为，与加密货币挖掘有关的应用程序对高端性能的需求，也对出货量增长做出贡献。

对于高性能任务处理器（如加密货币挖掘和 AI 应用程序）的需求，将 GPU 推向了 AI 硬件的最前沿。GPU 包含数百个可同时执行数千个软件线程的内核，而且比 CPU 更节能。CPU 比较泛化，且更具有跳跃性，可以执行很多任务，并擅长对大批量数据进行重复操作。GPU 之所以被称为 GPU，就是因为这一关键区别，它更擅长处理图形——因为图形处理涉及一次性处理数以千计的小计算。同时，这样的性能也使得 GPU 成为理解上述神经网络训练等任务时的理想选择。

就在今年 12 月，Nvidia 宣布推出了一款专为深度学习而设计的 PC GPU——Titan V。这款 GPU 基于 Nvidia 的 Volta 架构，使用了 Nvidia 称之为 Tensor Cores 的新型核心技术。在数学术语中，张量（tensor）的定义为“与矢量相似，但更泛化的数学对象，用一组空间坐标函数表示。”Nvidia 所做的，是针对处理深度学习和神经网络计算的需求，开发具有复杂架构的内核。

Google——专注 TPU，做好应用落地

也许没有哪家公司比 Google 对张量概念的研究更加深入。2016 年，这家搜索巨头发布了非常流行的深度学习开源框架 TensorFlow。如 Google 所说，“TensorFlow 是一个使用数据流图进行数值计算的开源软件库。图中的节点表示数学运算，而图像边缘表示在它们之间通信的多维数组（张量）。它灵活的体系结构让用户可以使用单个 API 将计算部署到桌面、服务器或移动设备中的一个或多个 CPU 或 GPU。“

2016 年，该公司发布了第一代被称为张量处理单元（TPU）的新处理器。Google 的 TPU 是专为机器学习和 TensorFlow 而量身定制的 ASIC。2017 年 5 月，Google 发布第二代 TPU，并称其性能高达 180 teraflops。

2017 年 6 月，在加拿大多伦多举行的第 44 届计算机体系结构国际研讨会（ISCA）上，Google 发布了一项研究报告，将其部署在数据中心的 TPU 与 Intel Haswell CPU，以及部署在同一数据中心的 Nvidia K80 GPU 进行了比较，结果发现，TPU 比 GPU 和 CPU 运行速度平均快 15 到 30 倍。TPU 的 TOPS per watt 也比后两者高约 30 到 80 倍。Google 表示，现在，TPU 已经用于该公司所有在线服务，如搜索、街景、Google 相册和 Google 翻译服务中。

在一些非常高端的 AI 应用中，TPU 也已经证明了其价值。TPU 是谷歌著名的 AlphaGo AI 背后的“大脑”，AlphaGo AI 去年击败了围棋世界冠军，而最近，AlphaGo 通过证明其能够在相对较短的时间内，通过自学成为围棋大师，从而实现了人工智能领域的巨大的飞跃。经过短短几个月的训练，AlphaGo 的最新版本 AlphaGo Zero 的能力就远远超过人类专家。而战胜国际象棋（一个复杂的游戏，但是比 Go 计算量小得多）专家，也就是几个小时的事情。

Microsoft——后来居上的黑马

虽然 Nvidia、Google 以及 Intel 在某种程度上都专注于为 AI 服务，但其芯片提供的服务处理过程均发生在设备上，而不是云端。微软声称，其 FPGAs 云端人工智能服务的性能与 Nvidia、Google 以及 Intel 相当，甚至更优。微软认为，这款代号为 Project Brainwave，基于 FPGA 的云端解决方案，在可扩展性和灵活性方面将优于 CPU、GPU 和 TPU。

一般来说，基于处理器的解决方案在某种程度上会受到设计上的限制，仅能完成特定的任务。但是，由于 FPGA 具有灵活性和可重编程性，让升级更容易，处理器的性能更高。根据微软的说法，在 Intel Stratix 10 FPGA 上运行时，微软的 Project Brainwave 的运行速度达到 39.5 teraflops，延时不足 1 毫秒。

FPGA 是否能为人工智能提供最佳解决方案，与其他议题一样是值得商榷的事情。微软认为，创造 AI 专用 ASIC 的生产成本太高，而另一些人则认为，FPGA 永远无法完全实现专为 AI 设计的芯片性能。

3 月份举行的 International Symposium on Field Programmable Gate Arrays (ISFPGA) 上，一些 Intel 加速器架构实验室的研究人员发表了一篇论文，称其对处理深度神经网络算法的两代 Intel FPGA（Arria10 和 Stratix 10）和 Nvidia Titan X Pascal （Titan V 处理器）进行了比较。据 Intel 研究人员称：“研究结果显示，在 pruned、Int6 和二值化 DNNs 矩阵乘法运算方面，Stratix 10 FPGA 的性能（TOP / 秒）比 Titan X Pascal 图形处理器的性能分别高 10％、50％、5.4 倍。在 Ternary-ResNet 方面上，Stratix 10 FPGA 比 Titan X Pascal GPU 的性能高 60％，而且性能功耗比高 2.3 倍。这表明，FPGA 可能成为加速下一代 DNN 的首选平台。“

反观国内，虽不如国外那般龙争虎斗，但初创企业的力量也是不容小觑的。

寒武纪在今年发布了三款智能芯片：面向低功耗场景视觉应用的寒武纪 1H8、拥有更广泛通用性和更高性能的寒武纪 1H16，以及面向智能驾驶领域的寒武纪 1M。此外，更有深鉴科技、Kneron、鲲云科技等初创企业也在专注智能芯片的研究，地平线目前的处境不敢说是草木皆兵、四面楚歌，但也绝不是占据十分有利的条件的。

地平线的雄心

在芯片之外的三套智能解决方案，也许更能体现地平线的雄心壮志。

不论是今年 Nvidia 的 GTC China 2017 大会，还是之后的百度世界大会，无数企业都提到要开始进行智慧城市的布局，今天，地平线也加入了这一队伍。

我们在文章开头提到，地平线早在 2016 年就已经在智能驾驶领域提供解决方案，余凯博士也在演讲中说了这样一句话：自动驾驶处理器对准确性、功耗、实时性、可靠性的要求之高代表了人工智能处理器的珠穆朗玛峰。 随着自家智能芯片的发布，地平线在智能驾驶、智慧城市等领域的发展有了更加充足的底气。

此次新品发布，让地平线重归人们的视野，而新发布的智能芯片能否得到业内的认可尚处于未知的状态，是一石激起千层浪，还是如同沙砾一般被大海吞没？AI 前线将持续关注地平线的最新动态，地平线是否拥有绝对实力来占据国内芯片市场的一席地位，我们十分期待光芒从地平线绽放的时刻。

有关 2018 年芯片之战的详细分析，请查看我们今日发布的第三条内容《2018 年，AI 芯片之战将打响》，同时敬请关注 AI 前线年终智能芯片专题内容！

关注我们的微信号"AI前线"，后台回复“AI”可获得《AI前线》系列PDF电子书