Gemini 3 Flash 发布，多、快、好、省，Coding 能力不输大哥Gemini 3 Pro

Google 这次把「性价比」三个字直接写脸上了。

刚刚，Google DeepMind 发布了 Gemini 3 Flash，号称前沿智能，但只要极低极低的成本。

在上个月 Gemini 3 Pro 和 Deep Think 模式发布后，API 日均处理量已经突破 1 万亿 tokens。而现在，Flash 版本的到来，意味着这样的「下一代智能」要飞入寻常百姓家了。

直接上图：

博士级推理，闪电速度

先看几个硬指标：

在 GPQA Diamond（博士级推理测试）上，Gemini 3 Flash 拿到 90.4%；在 Humanity's Last Exam（广泛专家知识测试）上，不使用工具的情况下达到 33.7%，这可是最前沿模型的水平。

而夸张的是 MMMU Pro（多模态理解和推理）：81.2%，甚至反而超过了 Gemini 3 Pro 的81.0%，这有点太不会人情事故，连自家大哥面子都不给了……

也就是说，这样一个「轻量级」模型，在分析视频、图像等多模态内容时，已经用极低成本+闪电速度达到了「重量级」选手的表现。

Gemini 3 Flash 的核心卖点是速度和效率的结合。

根据 Artificial Analysis 的基准测试，它比 2.5 Pro 快 3 倍，同时在处理日常任务时，平均使用的 tokens 比 2.5 Pro 少 30%。

价格呢方面，输入 $0.5 / M tokens，输出 $3 / M tokens（音频输入保持 $1 / M tokens）。

再看下性能-成本散点图：

Gemini 3 Flash 直接把 Pareto 前沿往外推了一大截，同样的钱，买到更强的模型；同样的性能，花更少的钱。

在 SWE-bench Verified（代码 Agent 能力测试）上，Gemini 3 Flash 得分 78%，不仅超过了整个 2.5 系列，甚至再一次超过了自己的亲大哥 Gemini 3 Pro。

有点不讲武德了……

这也让它成为了开发者的理想选择：Pro 级别的代码能力，Flash 级别的响应速度。高频迭代开发、生产级系统、交互式应用，它都能轻松胜任。

比如这个手势追踪的「弹球解谜游戏」，Gemini 3 Flash 能提供近乎实时的 AI 辅助，一边看你玩一边给建议。

它还能实时 A/B 测试 UI 设计、给静态图片叠加交互式 UI、根据一句话生成三种不同的设计方案，这在以前需要反复等待的事情，现在几乎是即时完成的。

JetBrains、Bridgewater Associates、Figma、Cursor、Warp、Harvey、Replit……这些公司已经在用 Gemini 3 Flash 了。

他们的反馈都很一致：推理速度快、效率高、性能堪比大模型。

从今天开始，Gemini 3 Flash 开始向全球用户推送：

开发者可以通过 Google AI Studio、Gemini CLI、Vertex AI 以及新的 Agent 开发平台 Google Antigravity 使用 Gemini API。

普通用户可以在 Gemini App 和 Google Search 的 AI Mode 中直接体验，而且是免费的。Gemini 3 Flash 将取代 2.5 Flash 成为 Gemini App 的默认模型。

因为它强大的多模态推理能力，你可以让它分析视频、理解图片，然后几秒钟内给你一份可操作的计划。比如上传一段高尔夫挥杆视频，它能告诉你怎么改进动作。

关于它的速度的闪电程度，作为参考的是，如果你一边画画，它一边猜你画的是什么，你会发现：你还没画完，它就已经猜出来了。

在 Search 的 AI Mode 中，Gemini 3 Flash 能更好地理解你问题的细微差别，并能把研究和行动结合起来：

你得到的不只是一堆链接，而是经过智能组织的分析和具体建议，并且，速度和普通搜索一样快。

相关链接：