一文总结 Google I/O 2023

7,218 阅读7分钟

今日凌晨举行的谷歌 I / O 2023 开发者大会上,如果说和往年有什么不同,那么应该就是更大力度的 All in AI

毕竟在去年 I/O 宣布重点投入 AI 之后,年末却被 OpenAI 的 ChatGPT “越塔偷家”,匆忙攒出一个发布会还让 Bard 爆出事实性错误,导致股价瞬间暴跌千亿美元,从而引发后续的「扩大 AI投入」并裁员 1.2万人。

作为 AI-first 公司,在经历了几个月修正之后,本次 I/O 谷歌继续携 AI 回归,而大会的主题也修订为 :让人工智能对每个人更有帮助

AI

本次谷歌 CEO 重点介绍了 AI 在谷歌生态中的日常使用,例如: Gmail 中的“帮我写”,全新沉浸式的地图视图体验,全新的 Magic Editor 体验示例等,主旨是展示人工智能对每个人的日常生活所能提供的帮助。

同时本次发布的 PaLM 2 和 Gemini 也是 Google 对 AI 新的答卷,其中 PaLM 2(Pathway Language Model)也是本次大会 AI 核心内容,这是 Google 全新的大型语言模型(LLM),在本次发布的 PaLM 2 预览版中,重点改进了多语言翻译、数学相关、程序语言、推理和自然语言生成能力等

目前 PaLM 2 提供了四个大小版本,适用于不同的使用场景,从小到大依次为:Gecko 壁虎、Otter 水獭、Bison 野牛和 Unicorn 独角兽。

其中 Gecko 甚至可以在移动端工作,并且传闻速度足够快,在离线时也能在设备上稳定运行,这算是我个人感觉最大的亮点之一,最新的三星 Galaxy 上,它能够每秒处理 16 个 token

目前 PaLM2 已经渗透到 Google 的各个产品线里,未来实际表现还有待体验,具体场景有:

  • 前面介绍的 AI 一键 P 图工具 Magic Editor:魔法换天、人物无缝移动

  • 打击 AI 图片造假,推出图像溯源功能,例如一张图片曾在网上的其他地方看到过,或者类似图片出现的时间和地点

  • 对标微软 Copilot,谷歌 Workspace 办公套件升级 Duet AI 品牌,也就是加入 AI 之后,挂了个品牌名称,还推出了一项名为“Sidekick”的新功能,该功能能够阅读、总结和回答不同谷歌应用程序中的文档问题

  • 展示了 Project Tailwind 项目,可以认为是经过用户文档训练的 AI 笔记本,定位是个性化导师或写作伴侣

    image-20230511113214457

  • 安卓 14 引入 AI 特性:可生成壁纸和信息文本,包括 Magic Compose 和生成式壁纸(Pixel 设备独占),其中 Magic Compose 功能,AI 可以根据消息内容生成回复文本

    image-20230511113231321

  • 为安卓开发者推出 AI 编程机器人 Studio Bot,该工具可以生成代码、修复 BUG、以及回答关于安卓应用开发的相关问题, Studio Bot 不会收集开发者的代码,但会收集开发者和 Studio Bot 的对话数据,目前只有 US 可以在 Canary 频道使用

    image-20230511113018767

  • 推出 AI 视频对口型技术:根据翻译语言改变人物说话方式,但不开放使用,只有谷歌授权合作伙伴才能将其用于建设性项目

  • 推出 A3 Virtual Machines 超级计算机:搭载英伟达 H100,可提供 26 exaFlops AI 性能

  • 推出 GameFace 项目,玩家通过面部表情控制 PC 游戏,开源地址 :github.com/google/proj…

  • 有着惊艳语言生成图像能力的 Adobe firefly,在未来几个月将直接集成到 Bard 中。这样在和 Bard 的对话中,就能够直接设计图片。

  • AI 聊天机器人 Bard,新增语言支持、支持将聊天记录导出到 Google Docs 和 Gmail 中,目前取消候补,开放英语版本,引入图像生成服务,改善代码处理等,另外 Bard 现在可以帮助生成、解释和调试 20 多种编程语言的代码。

  • 跟随 Bard 来的还有个 Search Lab,主要是用来做复杂问题的搜索,目前是一个探索性的产品,目前还没有全部开放,它试图帮助人们更好地分析一个复杂、或者有些模糊的问题

整体上可以看到 AI 已经渗透到 Google 的各个产品领域,所以谷歌一直说自己是 AI-first 公司没有毛病,虽然上次经历了滑铁卢,但是拥有大量产品优势的 Google ,或者真的可以再重整旗鼓去攻城略地。

另外 Gemini 属于下一代多模态基础模型,目前正和 DeepMind 联手合作,从已知资料上看,它会是一个谷歌在多模态领域的利器。

硬件

其实谷歌的硬件发布更多像是为了软件而存在,不过按照惯例每年 I/O 都会发布对应的硬件设备。

折叠屏手机 Pixel Fold

谷歌首款折叠屏手机,折叠后尺寸为 139.7x79.5x12.1 毫米,展开后尺寸为 139.7x158.8x5.8 毫米,重量为 283g,所以整体视觉上可能会比较小巧,横向内折屏幕手机,搭载谷歌自研 Tensor G2 处理器,附带 Titan M2 协处理器,售价为 1799 美元起

image-20230511114825358

Pixel Tablet

时隔多年,谷歌又重返平板市场,售价为 499 美元,印象中上一代记得是应该是 2012 年的 Nexus 7 了,不过从发布会看 Pixel Tablet 也没什么特别之处,同样采用 Tensor G2 处理器 。

Pixel 7a

传统才艺 Pixel 也跟进了 Pixel 7a ,同样是 Tensor G2 处理器、多彩配色、影像大提升,499 美元起。

总结:平平无奇。

软件

软件 Android 和一些开源项目也进行了一些更新:

  • 升级 Find My Device 服务:扩展耳机、平板类别,数十亿台安卓设备构建追踪网络,支持追踪耳机、平板电脑和其他产品类别

  • 和三星、高通合作,推出基于安卓的沉浸式 XR 平台

  • Android 14 Beta 2 面向 Pixel 手机发布,主要是修复了各种问题,例如修复了阻止用户与通知栏中通知交互问题,其中 Google I / O 上还展示了锁屏时钟和快捷方式。(Android 本次也算是一笔带过的节奏

  • ChromeOS Beta 新增支持串流使用手机 App:Chromebook 搭配 Pixel 4a / 小米 13 等安卓 13 及更新设备启用,Chromebook 现在支持 Android 手机流式传输运行应用程序。

  • Android Automotive OS 14 宣布支持多个车载显示器(甚至后座联动),YouTube 应用即将推出,它将更方便地支持将平板电脑应用移植到 Android Automotive,并且还将进一步推动 web 浏览器和游戏支持

  • 本次大会上谷歌还发布了 Wear OS 4,并计划将云备份引入平台,以及进一步增加电池待机时间,开发人员预览版本今日发布。

  • Flutter & Dart 相关开源项目更新,这纯属是我个人关注的点,具体可见:juejin.cn/post/723173…

  • I/O FLIP 小游戏 ,算是本次大会的小亮点之一,也是一个开源项目,具体可见: juejin.cn/post/723137…

  • 本次的 adventure Chat 明显没有去年 I/O 的“元宇宙”会场生动,估计预算都在 AI 上了。

最后

可以遇见, 未来的谷歌投入都会在 AI 上,也侧面反映了未来 AI 基建会是全球的主力战场,创新工场的负责人针对 AI 这个也表示过:

“GPT 现在让 NLP 技术彻底失去了神秘感,所有应用开发团队的 NLP 水平被强行拉齐,大家可以拼产品、拼运营,但要在应用侧建立 NLP 相关的技术护城河,就显得特别困难了” 。

目前 OpenAI 的 ChatGPT、GPT API、ChatGPT Plugin 核心生态已初具规模,而这个领域的烧钱程度决定了它是一个赢者通吃的垄断模式,谷歌未来的主要对手也会是 OpenAI 。

所以本次 I/O 最大的体会就是:AI 真的在来了