微软表示最新的人工智能模型击败了克劳德、谷歌的 Nano Banana

在周二年度 Microsoft Build 活动的第一天，这家 Windows 开发者推出了 7 个新的 AI 模型，声称它们在盲测和图像编辑基准测试中优于 Anthropic 的 Claude Sonnet 4.6 和 Google 的 Nano Banana 2。

提出这一说法之际，微软正试图将自己打造成前沿人工智能开发商，而不仅仅是 OpenAI 最大的支持者和基础设施提供商。

“今天非常高兴地宣布七种新的世界级 MAI 模型，”Microsoft AI 首席执行官 Mustafa Suleyman 在 X 上写道。“它们代表了我们认为的 AI 新时代，旨在让您保持掌控并处于前沿。”

该版本的核心是 MAI-Thinking-1，这是一种推理模型，微软将其描述为其旗舰文本基础模型。

Seven new models launching at Build: let’s go!
Reasoning. Code. Image. Transcribe. Voice.

Built from scratch on a clean data lineage, designed for efficiency, working seamlessly as a family of models

Thread 🧵 #MSBuild pic.twitter.com/g3WQIcIQ24

— Microsoft AI (@MicrosoftAI) June 2, 2026

根据 Suleyman 的说法，在独立评估者进行的盲测中，MAI-Thinking-1 优于 Anthropic 的 Claude Sonnet 4.6。他补充说，该模型在 AIME 2025（衡量高级问题解决和推理技能的基准）上得分为 97%。

Suleyman 表示，SWE Bench Pro 结果使该模型“在最严格的编码基准之一上与 Opus 4.6 并驾齐驱。”

该公司还推出了 MAI-Code-1-Flash，这是一种为 GitHub Copilot 和 Visual Studio Code 构建的轻量级编码模型； MAI-Image-2.5 及其 Flash 变体，微软称其在图像编辑任务上优于 Google 的 Nano Banana Pro； MAI Transcribe-1.5，支持43种语言的转录模型； MAI-Voice-2，一种语音生成模型，能够生成 15 种语言的自然声音，并根据短音频样本适应说话者。

&amp;amp;lt;span style="显示：内联块；宽度：0px；溢出：隐藏；行高：0；" data-mce-type="bookmark" class="mce_SELRES_start"&amp;amp;gt;&amp;amp;lt;/span&amp;amp;gt;

“这是技术的非凡时代。用于训练前沿模型的计算量增加了一万亿倍，”Suleyman 在宣布新模型的另一篇博客帖子中表示。 “现在，我们预计未来三年将再增长数千倍，这反过来意味着更先进的功能，以及更有效的人工智能的持续推出。”

这一消息发布之际，领先的人工智能开发者之间的竞争持续加剧。

上周，Anthropic 宣布推出其最新旗舰型号 Opus 4.8，该公司表示该型号在基准测试中速度更快、更智能，并配备了一系列新功能。周二，Anthropic 宣布扩展其 Glasswing 项目，让 150 家公司能够使用其新的专注于网络安全的 Mythos 模型。

同时，在 5 月份的 Google I/O 大会上，Google 推出了 Gemini Omni，这是一种将 Gemini 与该公司的 Veo、Nano Banana 和 Genie 媒体生成模型相结合的多模式 AI 模型，以及 Gemini Spark，这是一种基于云的 AI 代理，旨在跨应用程序和应用程序管理任务代表用户的工作流程。

微软推出的新模型表明，随着微软超越对 OpenAI 技术的长期依赖，微软将在构建专有人工智能系统方面做出更广泛的努力，并表示 MAI“提供了最高的获胜率，在质量上优于 GPT-5.5，同时成本降低了 10 倍。”

“开发人员和企业一直迫切需要人工智能按照他们的条件和意见交付，”苏莱曼写道。 “我们认为这是实现这一目标的重要一步。”