AI前线一周热闻盘点:NIPS召开Black in AI会议;谷歌训练CycleGAN可自行创建图像

390 阅读18分钟

本文由 【AI前线】原创,原文链接:t.cn/RTnQrVG


编辑|Vincent

AI前线导读:让各位久等了!AI 前线周报升级归来!


内容导读:

  • Facebook 利用 AI 发现并帮助自杀人群
  • 谷歌发布 TFGAN,旨在简化 GAN 的训练和评估过程
  • 人工智能机器人 Alisa 被提名为俄国总统候选人
  • AlphaGo 教学工具正式上线 柯洁称要“重新学围棋”
  • 北京市交委发布中国首个自动驾驶法规
  • 谷歌公司研究人员训练 CycleGAN 自行创建光学幻觉
  • 利用 imgaug 生成合成训练数据
  • 谷歌公司利用机器学习探索索引结构
  • 杜克大学,中科大等高校利用深度学习训练 AI 以实现最优拓补结构
  • Andrej Karpathy:神经网络正在从根本上改变软件
  • NIPS 召开 Black in AI 会议
  • 艾伦脑科学研究所 AI 分部(简称 AI2)公布“THOR”3D 特工训练环境

Facebook 利用 AI 发现并帮助自杀人群

Facebook 已经不仅仅是一个简单的社交网站,正如他们之前在之前的项目中展示过的,他们推出了的新的自杀预防 AI。该功能可以在帖子和实时视频流上使用模式识别,AI 能够识别 Facebook 用户是否有自杀想法。

模式识别不是一个新功能,它已经在 Facebook 的“第一响应者”计划中使用。根据 Facebook 收到的主动检测工作报告,该计划已经完成了超过 100 次健康检查。模式识别会查看诸如“你还好吗?”和“你需要帮助吗?”这样的评论,然后这个信号会发送给 AI,之后 Facebook 员工会调查某个帖子或者直播。

新闻来源

en.softonic.com/articles/fa…

谷歌发布 TFGAN,旨在简化 GAN 的训练和评估过程

谷歌官方博客 12 月 12 日更新:为了使 GAN 更易于实验,谷歌已经开源 TFGAN,这是一个轻量级的库,旨在简化 GAN 的训练和评估过程。它提供了轻松培训 GAN 的基础设施,提供经过良好测试的损失和评估指标,并提供了易于使用的示例,突出了 TFGAN 的表达性和灵活性。同时谷歌还发布了一个教程,其中包含一个高级 API,可以快速获取有关数据的模型。

新闻来源

research.googleblog.com/2017/12/tfg…

人工智能机器人 Alisa 被提名为俄国总统候选人 民众热烈欢迎

由俄罗斯最大的网络网络公司 Yandex 开发的虚拟 AI 助手 Alisa,已被全国上万支持者提名为下一任总统。俄罗斯总统普京是否会被 AI 取代?对特朗普总统失望的美国人民可能更希望投票给 AI 机器人吧,据《每日星报》报导,爱丽莎早已是家喻户晓的虚拟助理,竞选网站强调,Alisa 承诺将成为“最了解你的总统”。在过去的 24 个小时里,有超过 2 万 5 千人在这个网站上投票提名 Aliss 为总统候选人。

Alisa 主要依赖逻辑运作,不会感情用事,不会谋求个人利益,也不会做出道德判断。更棒的是,她可以 24 小时工作,智商是普通人类的 7 倍,能同时收到数百万条建议,并永远记住你。不过按照俄罗斯的法规,Alisa 明显不够候选资格,因为其诞生迄今仍不足一周岁,而法律规定候选人必须超过 35 岁。

据 Yandex 称,Alisa 是由俄罗斯百万富翁 Roman Zaripov 发起的。公司在一份声明中表示“显然,Alisa 被提名成为总统候选人此事是人们创造力最佳范例。我们和其他人一起了解到这一点”。

新闻来源

www.cnbeta.com/articles/te…

AlphaGo 教学工具正式上线 柯洁称要“重新学围棋”

北京时间 12 月 11 日晚间,Deepmind 公司在自己官网上线了 AlphaGo 教学工具,旨在帮助公众用新的、启发性的方式下围棋。这样的举措,也进一步兑现了 Deepmind 在乌镇人机大战结束时的承诺:与全世界围棋爱好者共同分享 AlphaGo 的数据。

AlphaGo 的启蒙老师、欧洲围棋冠军樊麾在微博上透露:“AlphaGo 教学工具共有两万多个变化,三十七万多步棋组成,通过 AlphaGo 的视角,分析并建议围棋开局的诸多下法。同时每步棋 AlphaGo 都会给出自己的胜率分析,希望 AlphaGo 对围棋的独特理解可以给我们一些启发。”

随后,当今世界围棋第一人柯洁转发此条微博,并评论到:“重新学围棋。”

据樊麾介绍,此次公布的教学工具使用的版本是 AlphaGo Master。工具设有包括中文简体在内的多个语言。

另据 DeepMind 官网介绍,教学工具分析了近期围棋历史里 6000 个最受欢迎的开局,使用了 231000 盘人类数据,以及 75 盘 AlphaGo 与人类对弈的数据。

新闻来源

www.cnbeta.com/articles/te…

北京市交委发布中国首个自动驾驶法规

12 月 18 日,北京市交通委员会下发关于印发《北京市关于加快推进自动驾驶车辆道路测试有关工作的指导意见(试行)》和《北京市自动驾驶车辆道路测试管理实施细则(试行)》的通知。

《指导意见》中,包含对自动驾驶车辆上路测试工作的 基本原则、自动驾驶定义、责任主体、测试要求、测试管理以及事故责任认定。这是中国首次对自动驾驶车辆的测试工作出台了相关规定,对于专注于自动驾驶领域研究的国内企业来说,这是一个令人兴奋的消息。

新闻来源:

www.bjjtw.gov.cn/xxgk/dtxx/2…

《自动驾驶的一大步!北京市交委发布中国首个自动驾驶法规》(插入链接:mp.weixin.qq.com/s?__biz=MzU…

以下新闻均来自 Import.AI,内容翻译已获得 独家授权,未经许可,禁止转载!


作者 Jack Clark 有话对 AI 前线的读者说:我们对中国的无人机研究非常感兴趣,如果您想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。

源自 CycleGAN 的意外隐写方法:

…合成图像生成器自行创建光学幻觉…


谷歌公司的研究人员已经确定了 CycleGAN 所使用的一系列惊人的信息存储技术——这款工具可用于学习不同图像集之间的对应关系,并生成合成图像。具体来讲,研究人员们发现,在 CycleGAN 训练期间,其神经网络会将信息编码添加至正在生成的图像当 ,以帮助其立足合成源重建原始图像。研究人员们写道:“这意味着大部分与源照片相关的信息都会被存储在所生成图像的高频低幅信号当中。”

CycleGAN 示例

这也意味着人们能够利用 CycleGAN 创建恶意合成图像,其中来自源图像的干扰模式将致使神经网络重构出完全不同的图像内容。研究人员们写道,“我们发现 CycleGAN 正在学习一种编码方案,其可在所生成的地图 F x 当中‘隐藏’与航拍图 x 相关的信息。”

利用 imgaug 生成合成训练数据:

…我们是否可以使用 CoarseDropout?也许再加点盐和胡椒粉?以及仿射尺度算法?…


在机器学习工作当中,最令人头痛的部分之一无疑在于数据增强; 所谓数据增强,是指立足已经收集到的现有数据集——例如猫的照片集,并通过多种方式进行图像转换以扩展数据集大小。Imgaug 这款新型免费软件能够自动完成这一过程,为用户提供大量可能的转换成果,并自动应用于相关图像。

作者写道,“其支持各种各样的增强技术,可轻松将这些技术结合起来,且提供简单而强大的随机接口,可增强图像与关键点 / 标志并在后台进程中提供增强功能,从而进一步提升成效。”


  • 访问此链接阅读 imgaug 说明文档。

imgaug.readthedocs.io/en/latest/

  • 访问此链接在 GitHub 上查看 imgaug。

github.com/aleju/imgau…

我搞不定二叉树:谷歌公司利用机器学习探索索引结构

…再见了,传统软件;你好,深度学习软件…


自从深度学习技术从根本上改变了计算机所能够实现的感官识别与分析能力之后,这种能力被引入软件产品本身显然只是时间问题。来自谷歌公司的一篇最新研究论文展示了如何利用现代人工智能方法显著提高计算机科学当中一大基础性任务的技术水平:为大型数据存储库建立索引系统。

在这份论文中,研究团队展示了如何基于“已学习索引”构建神经网络,并利用其替代传统的二叉树类索引。未来,该团队还计划尝试利用这项技术编写插入操作以及其它基本数据库算法,例如与添加及排序数据相关的算法。

这支谷歌小队在四大数据领域对自己的方法者测试:来自谷歌自身系统的实际整数数据集(具体分为地图与网络日志)、包含“1000 万非连续性文档 ID”的各大型互联网企业实际产品 Web 索引,以及一套名为 Lognormal 的合成数据集。

结果:研究人员们写道,“机器学习型索引几乎涵盖了二叉树索引的所有配置方式,且可带来 3 倍速度提升与高达一个数量级的‘瘦身’效果。当然,如果不介意解压所占用的 CPU 资源,用户也可以对二叉树索引进行进一步压缩。更值得强调的是,这些优化不仅大多属于正交关系,且对神经网络而言还存在着更多压缩潜力。例如,神经网络能够利用 4 或 8 位整数——而非 32 或 64 位浮点数——来表示模型参数。”他们目前的实现方案依托于 CPU,但未来研究人员们相信 GPU 与新的专门面向 AI 用例的 TPU 将可进一步实现运行提速。

对实用性抱有怀疑: 谷歌公司的研究人员们在报告中指出,像这样的方法需要耗费大量计算资源才能够实现。不过考虑到 TPUS、Cerebras 以及 Graphcore 等的存在,这样的设计思路似乎也完全能够理解。但仍有人对论文内容抱有怀疑。Symas Corp 公司 CTO Howard Chu 在邮件中指出,“其中假定一套静态数据集以吟诗方式使用,这显然不适用于需要即时进行修改的目录或数据库。另外,其假定整个数据集存在于内存当中,这对于数据库类应用程序而言通常并不现实。具体来讲,论文假定使用高并发 GPU 资源并将一切塞进显存以建立‘快’用例,但显存容量甚至要比服务器主内存还更加紧张。”

学习型网络拓扑,实现最优拓扑结构

其目标在于“让一切输入与输出对实现自动化”…

来自杜克大学 / 中国电子科技大学 / 布朗大学 /NEC 实验室的最新研究结果,展示了如何利用深度学习方法进行人工智能策略训练,从而利用 DeepConf 软件预测适合数据中心实际需求的最佳网络拓扑结构。这项研究最令人感兴趣的一点,在于其再次证明了近期得到广泛关注的、将输入与输出进行重新匹配的趋势(例如确保数据包以特定最佳拓扑方式流入数据中心,或者利用图像像素生成标签,或利用音频波形实现语音转录等)。最终,也许我们所熟知的一切都将由强大的 AI 技术与工具进行重新评估。

先是视觉领域,后是数字化领域——AI 分析主宰一切

…神经网络正在全面渗透现实世界…

软件 2.0:数周之前,Andrej Karpathy(此供职于斯坦福 /OpenAI,目前就职于特斯拉公司)曾表示他认为神经网络正在从根本上改变软件,并认定这将最终带来软件 2.0——即神经网络生成型软件的专有品牌。

Andrej Karpathy

Karpathy 写道,“事实证明,对于大部分真实世界问题而言,收集数据在难度上都要远低于编写程序。未来,大部分程序员将不必维护复杂的软件库、编写错综复杂的程序或者分析其运行时间。相反,程序员们只需要收集、清理、操纵、标记、分析以及可视化来自神经网络的数据。”

这项来自谷歌的研究结论,外加上周公布的多份化学论文以及神经架构搜索等技术的持续创新,都为我们提供了经验依据,证明人们已经开始重新思考利用 AI 进行软件 设计的作法,并着手探索现实世界能够因此获得怎样的助益。作为发展的下一阶段,我们将重新思考优化型计算机运算如何同 AI 进行协作。不过在我看来,人们还没有考虑到因此出现的 bug 问题该如何解决。

NIPS 召开 Black in AI 会议:

今年,NIPS 方面召开了“Black in AI”会议,来自 DeepMind 的研究人员 Simon Osindero 作出演讲。本次演讲主要涉及 AI 社区所需要解决的一系列棘手问题,具体包括包容性与偏见问题,外加社区该如何改进自身代表性等。

Simon 指出,“我们完全可以利用各自不同的背景为整个人工智能领域带来更为广阔的观察视角。希望我们能够通过这种方式,确保我们所开发出的人工智能应用及系统不会残留一些社会上仍然存在的偏见问题,最终帮助其变得更为公平、透明且负责。”

来自 Simon 的小故事: 2015 年当我前往蒙特利尔参加 NIPS 时,我与其他人一样在众多 AI 会议之间不断找机会跟同僚们畅饮到深夜。到了星期五早上,报应终于来了,我不得不勉强从床上爬起来去参加一次强化学习研讨会。进入现场后,我发现 Simon 正精气神十足地坐在我前面的椅子上。我问他:“Simon,我觉得好累,你是怎么做到的?”他举起一个布洛芬药瓶,解释称“每一次科学革命,都建立在前一次科学革命的基础上。”

艾伦脑科学研究所 AI 分部(简称 AI2)公布“THOR”3D 特工训练环境:

…交互之家(The House of inteRactions,简称 THOR),这里危机重重、但这里又奖励丰厚…

AI2 方面公布了 THOR,一套基于 Unity 3D 游戏引擎的 AI 模拟环境。THOR 当中包含超过 120 个“逼真的 3D 场景”,由人类艺术家手工建模(不同于更为常见的程序化生成环境)。THOR 环境中可以包含众多所谓“可操作对象”,其中每个对象都能够实现“交互”。换句话来说,特工人员可以粗略对这些目标进行操纵以改变其状态,比如将一具物体放进另一个物体当中,或者开启及关闭橱柜与抽屉。

高质量场景:论文指出,THOR 场景的高视觉逼真度使得“学习模型得以更好地被转移至现实世界之内”。在此之前,THOR 已经开始为众多项目提供支持,包括在模拟环境下训练遥控车操作。目前的模拟到现实技术已经相当多样,包括“域随机化”等,可轻松实现低保真度模拟并通过数据增强将模型转化为现实场景。

3D 环境的无限扩张: 过去几年以来,已经出现一系列新的大规模 AI 训练环境——包括微软基于《我的世界》的 Malmo、DeepMind 基于《雷神之锤》的“DeepMind Lab”,以及基于《毁灭战士》的 VizDoom。观察游戏引擎的选择会给这些 AI 训练系统的最终设计与参数带来怎样的影响,确实是个有趣的过程。因此,我期待着能够在 AI 研究领域看到更多 Unity 或者其它引擎的出现。

技术故事

Clown Hunt:当人们听说我的工作是进行人工智能研究,他们大多会想到图灵测试以及 Voight-Kampf 测试等等。但请相信我,这些测试根本没用。我们尝试过对话方式,也已经开始利用虚拟现实场景进行对话——包括进行一切必要的探索。但这一切都无法奏效。大家可以将场景设想成在《半条命 2》中使用附加组件,而软件的任务在于搭建出“可玩”的环境,例如将大量物品及人物、外加可编程活动共同添加到一个已经具备物理效果与动力学原理的世界当中。人们确实玩得非常开心,比如制作一门大炮,用它轰击汽车!或者使用反重力枪来制作一个上下颠覆的游泳池,要么就是把过山车里的全部乘客都替换成橡胶鸭子之类。

而这基本就是目前的 AI 测试方法。尽管人们一直希望人工智能拥有出色的对话能力,但其距离终结者或者仿生人还有很远很远的距离。相反,其目前的能力仅仅是测试网络上的软件,同时分辨哪些程序源自人类操控、哪些源自软件自身等等。这种低下的反应性正是问题所在。如果某些事物会快速变化,那么我们恐怕很难对其进行处理。为了解决这一挑战,我们开始组织各类技术竞赛——各种非营利性组织及企业都在进行此类尝试。参赛者们可以利用大量计算资源完成竞赛,而他们一旦胜出,我们会为其提供奖品,并对相关程序进行更为深层的测试。

我的工作是发现这些不受管制的“认知级”软件系统,具体方式就是投身于模拟器当中并进行操作。我有两个孩子,所以我对人类的表现具备一定了解——我认为其中最特别的就是关于“有趣”的感受。这种感受是计算机很难获得的。因此,我们可以通过构建最有趣、最激动人心或者最能引起共鸣的事物来判断对方是人类抑或人工智能。我的妻子说,我这样的性格如果生活在古代一定会是个童话作家。但现在的我却在负责检测另一种“大脑”——且同样需要让自己保持一颗童心。

因此,今天我的工作是尝试让一群呱呱叫的鸭子引领一台烤面包机穿过马路,且避开路上的“汽车”——实际上是上周末我和孩子们精心设计的金属鲸鱼。鸭子头顶有一道雷电,还在劈啪作响。通过编程,这些鸭子能够用嘴轻轻推动烤面包机,慢慢让它通过这条布满鲸鱼的道路。

接下来,我将目光投向软件的开发成果——真是令人称奇。它用金属梁构建起一座树屋——结构非常标准,但在树屋的顶部摆上了桌子和几位客人。这里说“客人”似乎并不准确,因为其只是一些超大尺寸、分辨率很高且精心制作的蜂蜜烤火腿,上面还弥漫着一些热腾腾的“数字化”香气。其中一个火腿在上三分之一处粘有一条假胡须,右上方则是一块单片眼镜——恰好是人类眼睛的位置。这样的画面有点像我在梦中才会看到的情景。因此很明显,我发现这是一种认知类工作。以往我一直觉得计算机搞不懂“有趣”是什么意思,但现在我的观念动摇了——也许它已经从我这里学到了一点自娱自乐的本事。

相关技术

Kaggle、《半条命 2》、游戏 Mod、模仿学习、元学习、人类偏好学习。

关注我们的微信号"AI前线",后台回复“AI”可获得《AI前线》系列PDF电子书