导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

微软表示最新的人工智能模型击败了克劳德、谷歌的 Nano Banana

在周二年度 Microsoft Build 活动的第一天,这家 Windows 开发者推出了 7 个新的 AI 模型,声称它们在盲测和图像编辑基准测试中优于 Anthropic 的 Claude Sonnet 4.6 和 Google 的 Nano Banana 2。

提出这一说法之际,微软正试图将自己打造成前沿人工智能开发商,而不仅仅是 OpenAI 最大的支持者和基础设施提供商。

“今天非常高兴地宣布七种新的世界级 MAI 模型,”Microsoft AI 首席执行官 Mustafa Suleyman 在 X 上写道。“它们代表了我们认为的 AI 新时代,旨在让您保持掌控并处于前沿。”

该版本的核心是 MAI-Thinking-1,这是一种推理模型,微软将其描述为其旗舰文本基础模型。

根据 Suleyman 的说法,在独立评估者进行的盲测中,MAI-Thinking-1 优于 Anthropic 的 Claude Sonnet 4.6。他补充说,该模型在 AIME 2025(衡量高级问题解决和推理技能的基准)上得分为 97%。

Suleyman 表示,SWE Bench Pro 结果使该模型“在最严格的编码基准之一上与 Opus 4.6 并驾齐驱。”

该公司还推出了 MAI-Code-1-Flash,这是一种为 GitHub Copilot 和 Visual Studio Code 构建的轻量级编码模型; MAI-Image-2.5 及其 Flash 变体,微软称其在图像编辑任务上优于 Google 的 Nano Banana Pro; MAI Transcribe-1.5,支持43种语言的转录模型; MAI-Voice-2,一种语音生成模型,能够生成 15 种语言的自然声音,并根据短音频样本适应说话者。

“这是技术的非凡时代。用于训练前沿模型的计算量增加了一万亿倍,”Suleyman 在宣布新模型的另一篇博客帖子中表示。 “现在,我们预计未来三年将再增长数千倍,这反过来意味着更先进的功能,以及更有效的人工智能的持续推出。”

这一消息发布之际,领先的人工智能开发者之间的竞争持续加剧。

上周,Anthropic 宣布推出其最新旗舰型号 Opus 4.8,该公司表示该型号在基准测试中速度更快、更智能,并配备了一系列新功能。周二,Anthropic 宣布扩展其 Glasswing 项目,让 150 家公司能够使用其新的专注于网络安全的 Mythos 模型。

同时,在 5 月份的 Google I/O 大会上,Google 推出了 Gemini Omni,这是一种将 Gemini 与该公司的 Veo、Nano Banana 和 Genie 媒体生成模型相结合的多模式 AI 模型,以及 Gemini Spark,这是一种基于云的 AI 代理,旨在跨应用程序和应用程序管理任务代表用户的工作流程。

微软推出的新模型表明,随着微软超越对 OpenAI 技术的长期依赖,微软将在构建专有人工智能系统方面做出更广泛的努力,并表示 MAI“提供了最高的获胜率,在质量上优于 GPT-5.5,同时成本降低了 10 倍。”

“开发人员和企业一直迫切需要人工智能按照他们的条件和意见交付,”苏莱曼写道。 “我们认为这是实现这一目标的重要一步。”