《星际争霸II》AI机器人挑战顶级职业选手,你Pick谁?

1,797



相比于已经被AlphaGo彻底征服的围棋,《星际争霸》是一块更加难啃的“硬骨头”,即使与AlphaGo师出同门的AlphaStar也尚未彻底征服人类职业选手。


AlphaStar与人类职业选手的第一次对战放出的是测试比赛录像,并在一盘现场对战中失利。后来AlphaStar为了防止被职业玩家抓住漏洞,匿名参加《星际争霸II》欧洲天梯对战系统,在与大师和宗师级选手的比赛中互有胜负。


2020年6月21日下午2点,启元“星际指挥官”AI将迎战人类顶级职业选手,《星际争霸I/II》全国冠军黄慧明(TooDming),还将与首位晋级世界锦标赛全球总决赛的中国大陆选手、2018年《星际争霸II》黄金总决赛冠军李培楠(TIME)交手。这将是全国首次现场直播星际AI与人类顶级职业选手的对战。这场启元星际AI顶级职业选手挑战赛也是2020北京智源大会的系列重磅活动之一。



在AlphaGo称霸围棋棋坛之后,DeepMind把重心转移到了《星际争霸》上来。Facebook、腾讯等科技巨头近年来也都全力押注这条赛道。


作为有史以来最成功的即时战略游戏,《星际争霸》可谓人工智能的“巅峰挑战”。


相比于回合制的围棋,《星际争霸》是即时对抗类游戏,必须做出毫秒级决策;相比于围棋在361个落子点之内的选择和完全信息可见,《星际争霸》的决策空间高达10的26次方并充满了战争迷雾;相比于《DOTA2》、《王者荣耀》的5对5英雄对战,《星际争霸》涉及200个单位的战役、战术策略博弈和经济、科技发展决策,所以对AI极具挑战性。


《星际争霸》考验的是AI全方位的综合能力,既要能看得懂游戏态势,又要能深刻理解敌我局面,还要在正确的时间做出正确的决策,根据对方行动随机应变。这要求AI不仅能实时感知、认知环境,还需要适应环境,做出数千步连续决策以求得胜利。


业内把AlphaGo、AlphaStar、“星际指挥官”这一类具备自我学习、自主决策能力的AI叫做智能体(Agent),它是人工智能技术的集大成者,在虚拟世界表现为数字人,在实体世界表现为机器人。


启元世界自2017年8月创立以来,致力于创造伟大的智能体产品,并把智能体带入每个行业、每个家庭、每个人,提升产业效能和生活体验。公司团队核心成员来自BAT、Netflix、IBM、香港科大、伯克利等国内外知名高科技企业和一流学府,屡获NeurIPS、CVPR等国际竞赛大奖。


值得一提的是,作为一家创业公司,启元世界仅使用了DeepMind AlphaStar 1%的算力,就已经达到人类顶级高手的水平,并敢于在公平设定下(与人类选手近似的APM操作限制),在线下公开与顶级职业选手进行实时对战。


这背后是三年时间的自主研发,启元凭借世界一流的算法原创和工程实践能力,通过启元“智能体训练云平台”,实现智能体不断迭代进化。赛事备战冲刺期,启元智能体训练云也部署到了滴滴云,利用其底层计算资源进行智能体训练。



启元“星际指挥官”仅需几千局的小样本做启动,就能让智能体通过模仿高手、超越高手达到人类顶级选手水平。这意味着,在缺乏大数据积累的很多行业,如智能制造、能源优化、网络调度,智能体也有着广阔的落地空间。

正如DeepMind一样,在《星际争霸》中彻底战胜人类,并不是启元世界的终极目标。《星际争霸》只是启元在虚拟世界训练智能体的一块“试验田”,最终的目的是训练出具备自我学习、自主决策能力的智能体,利用新一代人工智能技术,帮助客户解决博弈、优化、控制等复杂环境下的动态决策问题。

启元世界不仅是要自己训练出水平更高的智能体,还要帮助各行各业训练出自己的智能体,助力产业升级。通过启元世界的“智能体训练云”平台产品,企业可以实现一站式的智能体应用构建,实现端到端的智能体开发、训练、评估和部署。目前,启元“智能体训练云”已在全国数十家商业组织和学术机构中得到广泛应用。

除了助力产业升级,启元世界打造的娱乐智能体还有望重塑虚拟世界。通过学习模仿人类行为的虚拟玩家、虚拟角色,结合电子游戏、互动电影、虚拟社交等产品形式,打造个性化、沉浸式的娱乐体验。

如果说乌镇围棋峰会见证了智能体时代的一扇窗被打开,此次星际挑战赛有望见证智能体真正走入各行各业。不仅如此,这次比赛或许还将标志着人工智能正式从感知时代进入智能体时代。




为研发提效,全是技术干货的滴滴云技术沙龙报名中!

马上关注滴滴云公众号:

回复「上课」获取免费报名资格

回复「服务器」免费获得云服务器入门1个月体验​​​​​​​​