谷歌I/O大会全面转向人工智能：发布新一代多模态模型与智能体，重塑搜索与硬件生态

美东时间5月19日，Alphabet旗下谷歌在年度开发者大会Google I/O 2024上发布了密集的人工智能更新。从推出全新的Gemini Omni与Gemini 3.5 Flash模型，到发布能够持续执行任务的Gemini Spark智能体，再到宣布与三星合作推出新一代AI眼镜，谷歌正全方位推进其AI战略，试图将人工智能深度整合至其整个产品生态中。

Alphabet兼谷歌CEO桑达尔·皮查伊在主题演讲中透露，Gemini应用程序的月活跃用户数已在一年内翻倍，超过9亿；谷歌搜索中的“AI概览”功能月活用户已突破25亿；而使用各类“AI模式”的用户总数已超过10亿。皮查伊强调，人工智能已不再仅仅是聊天机器人，而是“下一代计算平台”，并表示“AI正在点亮公司的每一个部分”。

谷歌I/O大会All in AI：Gemini模型上新，搜索框25年来最大改版，AI眼镜回归，Spark智能体首秀

搜索框迎25年来最大变革：从信息检索转向AI任务入口

本次大会最核心的变化之一，是对谷歌搜索业务的彻底AI化改造。谷歌正在重新设计其标志性的搜索框，以更好地处理用户向AI提出的更复杂、更自然的提问。新版搜索框将支持更自然的语言输入、方便上传图片和文件，并能自动辅助用户完善搜索意图。谷歌知识与信息平台主管尼克·福克斯表示：“用户应该能够把脑海中的任何问题直接输入搜索框。”

此外，谷歌计划在搜索中加入智能体功能，帮助用户跟踪关注话题、预订服务、管理健康信息及创建个性化任务面板。业内分析认为，这意味着谷歌搜索正从传统的“链接分发器”转向一个主动的、能够执行复杂任务的AI入口。

发布最强多模态模型Gemini Omni，押注“智能体时代”

大会发布了全新的Gemini Omni模型，该模型被定位为谷歌目前最先进的多模态AI系统，能够同时处理文本、图像、视频、语音及实时交互任务。与以往模型相比，Omni更强调实时交互与跨应用、跨设备的连续任务执行能力，旨在直接对标OpenAI的GPT智能体体系及微软的Copilot生态。

更受市场关注的是Gemini Spark的发布。谷歌将其定义为一种“持续运行的AI智能体”，可以长期在后台执行任务，例如自动整理邮件、监控日程、跟踪网页信息、管理文档乃至完成跨应用工作流。谷歌副总裁乔什·伍德沃德表示：“Spark代表Gemini的一次重大转变。”这标志着谷歌的AI战略正从“聊天助手”转向“任务执行平台”。

推出轻量级模型Gemini 3.5 Flash，调整AI订阅体系

除旗舰模型外，谷歌还推出了主打速度与低成本的Gemini 3.5 Flash模型。该模型定位于低延迟、高响应速度和更低推理成本，重点面向开发者、移动端及实时交互场景。谷歌宣布，Gemini 3.5 Flash将成为Gemini App及谷歌搜索“AI模式”的全球默认模型。功能更强大的Gemini 3.5 Pro预计将于6月发布。

谷歌同时重构了其AI订阅体系。公司宣布面向开发者推出新的每月100美元的订阅计划，并提供更高的API调用额度和高级工具访问权限。此外，谷歌将其旗舰订阅计划AI Ultra的月费从250美元下调至200美元，分析认为这预示着大模型竞争正从“技术战”进入“价格战”阶段。

联手三星推出AI眼镜，卡位下一代硬件入口

硬件方面，谷歌宣布与三星以及眼镜制造商Gentle Monster和Warby Parker合作，推出内置Gemini助手的智能眼镜。该产品预计于今年秋季上市，兼容Android和iOS设备。Android XR产品与平台负责人沙赫拉姆·伊扎迪介绍，这款眼镜旨在通过“私密地向用户耳边播报，而非通过屏幕显示”的方式提供信息，具备实时翻译、环境识别、导航及语音交互等功能。

业内观察指出，本届I/O大会被外界视为谷歌对OpenAI、微软等竞争对手的一次全面反击。面对生成式AI对传统搜索和内容消费习惯的冲击，谷歌正清晰展现出其最新战略：利用其全球最大的互联网流量入口，将AI“原生化”地植入整个谷歌生态，并提前布局以智能体和增强现实为核心的下一代计算平台。