美东时间5月19日,Alphabet旗下谷歌在年度开发者大会Google I/O 2024上发布了密集的人工智能更新。从推出全新的Gemini Omni与Gemini 3.5 Flash模型,到发布能够持续执行任务的Gemini Spark智能体,再到宣布与三星合作推出新一代AI眼镜,谷歌正全方位推进其AI战略,试图将人工智能深度整合至其整个产品生态中。
Alphabet兼谷歌CEO桑达尔·皮查伊在主题演讲中透露,Gemini应用程序的月活跃用户数已在一年内翻倍,超过9亿;谷歌搜索中的“AI概览”功能月活用户已突破25亿;而使用各类“AI模式”的用户总数已超过10亿。皮查伊强调,人工智能已不再仅仅是聊天机器人,而是“下一代计算平台”,并表示“AI正在点亮公司的每一个部分”。
搜索框迎25年来最大变革:从信息检索转向AI任务入口
本次大会最核心的变化之一,是对谷歌搜索业务的彻底AI化改造。谷歌正在重新设计其标志性的搜索框,以更好地处理用户向AI提出的更复杂、更自然的提问。新版搜索框将支持更自然的语言输入、方便上传图片和文件,并能自动辅助用户完善搜索意图。谷歌知识与信息平台主管尼克·福克斯表示:“用户应该能够把脑海中的任何问题直接输入搜索框。”
此外,谷歌计划在搜索中加入智能体功能,帮助用户跟踪关注话题、预订服务、管理健康信息及创建个性化任务面板。业内分析认为,这意味着谷歌搜索正从传统的“链接分发器”转向一个主动的、能够执行复杂任务的AI入口。
发布最强多模态模型Gemini Omni,押注“智能体时代”
大会发布了全新的Gemini Omni模型,该模型被定位为谷歌目前最先进的多模态AI系统,能够同时处理文本、图像、视频、语音及实时交互任务。与以往模型相比,Omni更强调实时交互与跨应用、跨设备的连续任务执行能力,旨在直接对标OpenAI的GPT智能体体系及微软的Copilot生态。
更受市场关注的是Gemini Spark的发布。谷歌将其定义为一种“持续运行的AI智能体”,可以长期在后台执行任务,例如自动整理邮件、监控日程、跟踪网页信息、管理文档乃至完成跨应用工作流。谷歌副总裁乔什·伍德沃德表示:“Spark代表Gemini的一次重大转变。”这标志着谷歌的AI战略正从“聊天助手”转向“任务执行平台”。
推出轻量级模型Gemini 3.5 Flash,调整AI订阅体系
除旗舰模型外,谷歌还推出了主打速度与低成本的Gemini 3.5 Flash模型。该模型定位于低延迟、高响应速度和更低推理成本,重点面向开发者、移动端及实时交互场景。谷歌宣布,Gemini 3.5 Flash将成为Gemini App及谷歌搜索“AI模式”的全球默认模型。功能更强大的Gemini 3.5 Pro预计将于6月发布。
谷歌同时重构了其AI订阅体系。公司宣布面向开发者推出新的每月100美元的订阅计划,并提供更高的API调用额度和高级工具访问权限。此外,谷歌将其旗舰订阅计划AI Ultra的月费从250美元下调至200美元,分析认为这预示着大模型竞争正从“技术战”进入“价格战”阶段。
联手三星推出AI眼镜,卡位下一代硬件入口
硬件方面,谷歌宣布与三星以及眼镜制造商Gentle Monster和Warby Parker合作,推出内置Gemini助手的智能眼镜。该产品预计于今年秋季上市,兼容Android和iOS设备。Android XR产品与平台负责人沙赫拉姆·伊扎迪介绍,这款眼镜旨在通过“私密地向用户耳边播报,而非通过屏幕显示”的方式提供信息,具备实时翻译、环境识别、导航及语音交互等功能。
业内观察指出,本届I/O大会被外界视为谷歌对OpenAI、微软等竞争对手的一次全面反击。面对生成式AI对传统搜索和内容消费习惯的冲击,谷歌正清晰展现出其最新战略:利用其全球最大的互联网流量入口,将AI“原生化”地植入整个谷歌生态,并提前布局以智能体和增强现实为核心的下一代计算平台。
