智能芯片+解决方案,遥望地平线的余凯能否迎来曙光?

535 阅读13分钟

编辑 | Vincent

AI 前线导读:“今天,地平线机器人科技举办了产品发布会,在会上公布了该公司自主研发的嵌入式智能视觉芯片,同时发布三个智能解决方案,分别面向:智能驾驶、智能城市以及智能商业。

沉寂许久之后,这是地平线第一次公开发布新产品,对于关注地平线许久的人来说,这无疑是一爆炸性的新闻。离开百度之后,走上创业之路的余凯终于在今天用实力展示了地平线布局 AI 的决心和志向,遥望“地平线”许久的他,能否如愿看到属于自己的光芒万丈?”


2017 年 12 月 20 日下午 14:00,北京,中国大饭店。

地平线机器人科技在其产品发布会上,发布了号称中国首款、全球领先的嵌入式人工智能视觉芯片 BPU(Brain Processing Unit):面向智能摄像头的“Sunrise”旭日处理器和面向智能驾驶的“Journey”征程处理器。

地平线机器人技术创始人,前百度深度学习研究院领导人余凯博士在会上表示:早在 2015 年,地平线公司创立之时,就在行业中率先提出:打造人工智能芯片架构(BPU),比谷歌提出 TPU 架构的时间更早。

据介绍,该芯片功耗可低至 1.5W,能够同时对行人、机动车、非机动车、车道线、交通标志牌、红绿灯等 8 类目标进行精准的实时检 测与识别。

除此之外,地平线还在会上公布了三个智能解决方案,分别面向:智能驾驶、智能城市以及智能商业,后两个解决方案将应用地平线的嵌入式人工智能视觉芯片,集合独有的的深度学习算法,在前端能够实现大规模人脸检测跟踪、视频结构化等应用,可广泛用于智能安防、智慧城市等场景。

AI 前线在现场得到了地平线此次发布芯片的详尽参数:

该芯片基于高斯架构,可以完成一路 1080P@30fps 的视频输入,可对毎帧图像中的 200 个目标进行检测识别;典型功耗仅为 1.5W,并且延时小于 30ms

同时,余凯博士还在现场公布了未来几年地平线在芯片领域的战略:

2018 年,地平线将推出基于伯努利架构,拥有新型稀疏二值化神经网络结构的新款智能芯片;2019 年,将推出可同时处理 12 路 4K@30fps 视频输入的高性能芯片。

到 2025 年,中国道路上 3 千万新车都将具备自动驾驶功能,每辆自动驾驶汽车的“大脑”都基于地平线的人工智能处理器。


地平线酝酿许久的“大招”

自 2015 年 7 月成立以来,地平线目前已经发布了车道线 / 车辆 / 行人检测的智能驾驶辅助系统、 “安徒生平台”两款智能系统,分别应用在智能驾驶和智能家居领域。2016 年 7 月,在获得了新一轮融资后,地平线方面曾表示,这笔投资将用来加大对自动驾驶和智能家居领域的研发投入,加快产品研发和落地速度;推进人工智能芯片和系统的研发。在此后的 2016 年 9 月,地平线成立了南京研发中心,智能芯片的研制开始步入正轨。

从 2016 年 9 月到 2017 年 12 月这一年多的时间里,地平线仿佛从技术领域失踪了一般,对外不再放出半点消息,甚至一度引发外界猜想:如今已是战场一般的 AI 领域,地平线是否还能继续生存下去?

终于,在 2017 年 12 月,AI 前线收到来自地平线的邀请,前来参加本次的产品发布会。当了解到新品发布极有可能是芯片的时候,我们明白了:原来一直潜心钻研,默不作声的地平线是在酝酿这样的一个“大招”。


芯片大招已发,战场上能否绝杀?

现在,地平线的芯片也已发布,大招已发,但在这已经刮起风暴的智能芯片战场上,能否起到一击必杀的效果呢?纵观全球,在智能芯片领域进行布局的技术企业都已抢占了各自的山头,我们来看看目前 AI 战场的战况:

国外战场主要以大厂为主要战斗力,Intel、Nvidia、Google、Microsoft 四家老牌技术大厂各自占据一片沃土,布局 AI,疯狂生长,颇有些巨头争霸的态势。

Intel——老牌芯片厂试图焕发新机

自动驾驶车辆已经成为人工智能的主要目标之一,而 Intel 想要在这一领域牢牢巩固自己的地位。

然而,Intel 并没有把全部的精力放在内部研发上,而是通过收购来构建自身的 AI 能力。2016 年 8 月,Intel 收购了神经网络处理器制造商 Nervana Systems。

2016 年 11 月,在收购 Nervana 几个月后,Intel 宣布推出一系列处理器——Nervana,一个直接针对人工智能相关应用,如训练神经网络的平台。Intel 数据中心事业部执行副总裁兼总经理 Diane Bryant 说道:“我们期望 Intel 的 Nervana 平台再性能上能够有所突破,并大大缩短训练复杂神经网络所需的时间。预计十年之内,Intel 的性能将提高 100 倍,加速新兴的深度学习领域创新的步伐。“

2017 年 3 月,Intel 又高调地收购深度学习 ADAS 开发商 Mobileye,收购总额约为 150 亿美元。Intel 的并购战略几乎立即产生重大意义。这家芯片制造商希望在自动驾驶车辆领域占有一席之地,而且这一战略也让其一跃成为机器学习硬件的关键供应商。

去年 11 月在洛杉矶举行的 Automobility LA 贸易展览会上,Intel CEO Brian Krzanich 称,自动驾驶已成为如今最大的 game changer,并宣称 Intel 在收购 Mobileye 公司后推出的新产品 SoC 和 EyeQ5,比其最大的竞争对手——Nvidia's Xavier 的深度学习平台性能提高两倍。

Nvidia——独霸 GPU,傲视群雄

虽然市场上有不少 GPU 公司,但没有哪家公司比 Nvidia 作为这个技术的代名词更贴切。根据 Jon Peddie 研究公司的报告,Nvidia 在 2017 年第三季度的 GPU 出货量增长了 29.53%,主要竞争对手 AMD 和 Intel 在这方面均败下阵来。AMD 的出货量增加了 7.63%,而 Intel 的出货量增加了 5.01%。当然,这主要是由于视频游戏市场的推动,但 Jon Peddie Research 的分析师认为,与加密货币挖掘有关的应用程序对高端性能的需求,也对出货量增长做出贡献。

对于高性能任务处理器(如加密货币挖掘和 AI 应用程序)的需求,将 GPU 推向了 AI 硬件的最前沿。GPU 包含数百个可同时执行数千个软件线程的内核,而且比 CPU 更节能。CPU 比较泛化,且更具有跳跃性,可以执行很多任务,并擅长对大批量数据进行重复操作。GPU 之所以被称为 GPU,就是因为这一关键区别,它更擅长处理图形——因为图形处理涉及一次性处理数以千计的小计算。同时,这样的性能也使得 GPU 成为理解上述神经网络训练等任务时的理想选择。

就在今年 12 月,Nvidia 宣布推出了一款专为深度学习而设计的 PC GPU——Titan V。这款 GPU 基于 Nvidia 的 Volta 架构,使用了 Nvidia 称之为 Tensor Cores 的新型核心技术。在数学术语中,张量(tensor)的定义为“与矢量相似,但更泛化的数学对象,用一组空间坐标函数表示。”Nvidia 所做的,是针对处理深度学习和神经网络计算的需求,开发具有复杂架构的内核。

Google——专注 TPU,做好应用落地

也许没有哪家公司比 Google 对张量概念的研究更加深入。2016 年,这家搜索巨头发布了非常流行的深度学习开源框架 TensorFlow。如 Google 所说,“TensorFlow 是一个使用数据流图进行数值计算的开源软件库。图中的节点表示数学运算,而图像边缘表示在它们之间通信的多维数组(张量)。它灵活的体系结构让用户可以使用单个 API 将计算部署到桌面、服务器或移动设备中的一个或多个 CPU 或 GPU。“

2016 年,该公司发布了第一代被称为张量处理单元(TPU)的新处理器。Google 的 TPU 是专为机器学习和 TensorFlow 而量身定制的 ASIC。2017 年 5 月,Google 发布第二代 TPU,并称其性能高达 180 teraflops。

2017 年 6 月,在加拿大多伦多举行的第 44 届计算机体系结构国际研讨会(ISCA)上,Google 发布了一项研究报告,将其部署在数据中心的 TPU 与 Intel Haswell CPU,以及部署在同一数据中心的 Nvidia K80 GPU 进行了比较,结果发现,TPU 比 GPU 和 CPU 运行速度平均快 15 到 30 倍。TPU 的 TOPS per watt 也比后两者高约 30 到 80 倍。Google 表示,现在,TPU 已经用于该公司所有在线服务,如搜索、街景、Google 相册和 Google 翻译服务中。

在一些非常高端的 AI 应用中,TPU 也已经证明了其价值。TPU 是谷歌著名的 AlphaGo AI 背后的“大脑”,AlphaGo AI 去年击败了围棋世界冠军,而最近,AlphaGo 通过证明其能够在相对较短的时间内,通过自学成为围棋大师,从而实现了人工智能领域的巨大的飞跃。经过短短几个月的训练,AlphaGo 的最新版本 AlphaGo Zero 的能力就远远超过人类专家。而战胜国际象棋(一个复杂的游戏,但是比 Go 计算量小得多)专家,也就是几个小时的事情。

Microsoft——后来居上的黑马

虽然 Nvidia、Google 以及 Intel 在某种程度上都专注于为 AI 服务,但其芯片提供的服务处理过程均发生在设备上,而不是云端。微软声称,其 FPGAs 云端人工智能服务的性能与 Nvidia、Google 以及 Intel 相当,甚至更优。微软认为,这款代号为 Project Brainwave,基于 FPGA 的云端解决方案,在可扩展性和灵活性方面将优于 CPU、GPU 和 TPU。

一般来说,基于处理器的解决方案在某种程度上会受到设计上的限制,仅能完成特定的任务。但是,由于 FPGA 具有灵活性和可重编程性,让升级更容易,处理器的性能更高。根据微软的说法,在 Intel Stratix 10 FPGA 上运行时,微软的 Project Brainwave 的运行速度达到 39.5 teraflops,延时不足 1 毫秒。

FPGA 是否能为人工智能提供最佳解决方案,与其他议题一样是值得商榷的事情。微软认为,创造 AI 专用 ASIC 的生产成本太高,而另一些人则认为,FPGA 永远无法完全实现专为 AI 设计的芯片性能。

3 月份举行的 International Symposium on Field Programmable Gate Arrays (ISFPGA) 上,一些 Intel 加速器架构实验室的研究人员发表了一篇论文,称其对处理深度神经网络算法的两代 Intel FPGA(Arria10 和 Stratix 10)和 Nvidia Titan X Pascal (Titan V 处理器)进行了比较。据 Intel 研究人员称:“研究结果显示,在 pruned、Int6 和二值化 DNNs 矩阵乘法运算方面,Stratix 10 FPGA 的性能(TOP / 秒)比 Titan X Pascal 图形处理器的性能分别高 10%、50% 、5.4 倍。在 Ternary-ResNet 方面上,Stratix 10 FPGA 比 Titan X Pascal GPU 的性能高 60%,而且性能功耗比高 2.3 倍。这表明,FPGA 可能成为加速下一代 DNN 的首选平台。“

反观国内,虽不如国外那般龙争虎斗,但初创企业的力量也是不容小觑的。

寒武纪在今年发布了三款智能芯片:面向低功耗场景视觉应用的寒武纪 1H8、拥有更广泛通用性和更高性能的寒武纪 1H16,以及面向智能驾驶领域的寒武纪 1M。此外,更有深鉴科技、Kneron、鲲云科技等初创企业也在专注智能芯片的研究,地平线目前的处境不敢说是草木皆兵、四面楚歌,但也绝不是占据十分有利的条件的。


地平线的雄心

在芯片之外的三套智能解决方案,也许更能体现地平线的雄心壮志。

不论是今年 Nvidia 的 GTC China 2017 大会,还是之后的百度世界大会,无数企业都提到要开始进行智慧城市的布局,今天,地平线也加入了这一队伍。

我们在文章开头提到,地平线早在 2016 年就已经在智能驾驶领域提供解决方案,余凯博士也在演讲中说了这样一句话:自动驾驶处理器对准确性、功耗、实时性、可靠性的要求之高代表了人工智能处理器的珠穆朗玛峰。 随着自家智能芯片的发布,地平线在智能驾驶、智慧城市等领域的发展有了更加充足的底气。

此次新品发布,让地平线重归人们的视野,而新发布的智能芯片能否得到业内的认可尚处于未知的状态,是一石激起千层浪,还是如同沙砾一般被大海吞没?AI 前线将持续关注地平线的最新动态,地平线是否拥有绝对实力来占据国内芯片市场的一席地位,我们十分期待光芒从地平线绽放的时刻。

有关 2018 年芯片之战的详细分析,请查看我们今日发布的第三条内容《2018 年,AI 芯片之战将打响》,同时敬请关注 AI 前线年终智能芯片专题内容!

关注我们的微信号"AI前线",后台回复“AI”可获得《AI前线》系列PDF电子书