Google 这次把「性价比」三个字直接写脸上了。

刚刚,Google DeepMind 发布了 Gemini 3 Flash,号称前沿智能,但只要极低极低的成本

在上个月 Gemini 3 Pro 和 Deep Think 模式发布后,API 日均处理量已经突破 1 万亿 tokens。而现在,Flash 版本的到来,意味着这样的「下一代智能」要飞入寻常百姓家了。

直接上图:

博士级推理,闪电速度

先看几个硬指标:

在 GPQA Diamond(博士级推理测试)上,Gemini 3 Flash 拿到 90.4%;在 Humanity's Last Exam(广泛专家知识测试)上,不使用工具的情况下达到 33.7%,这可是最前沿模型的水平。

而夸张的是 MMMU Pro(多模态理解和推理):81.2%,甚至反而超过了 Gemini 3 Pro 的81.0%,这有点太不会人情事故,连自家大哥面子都不给了……

也就是说,这样一个「轻量级」模型,在分析视频、图像等多模态内容时,已经用极低成本+闪电速度达到了「重量级」选手的表现。

又快又省

Gemini 3 Flash 的核心卖点是速度效率的结合。

根据 Artificial Analysis 的基准测试,它比 2.5 Pro 快 3 倍,同时在处理日常任务时,平均使用的 tokens 比 2.5 Pro 少 30%

价格呢方面,输入 $0.5 / M tokens,输出 $3 / M tokens(音频输入保持 $1 / M tokens)。

再看下性能-成本散点图:

Gemini 3 Flash 直接把 Pareto 前沿往外推了一大截,同样的钱,买到更强的模型;同样的性能,花更少的钱。

写代码强过 3 Pro

在 SWE-bench Verified(代码 Agent 能力测试)上,Gemini 3 Flash 得分 78%,不仅超过了整个 2.5 系列,甚至再一次超过了自己的亲大哥 Gemini 3 Pro

有点不讲武德了……

这也让它成为了开发者的理想选择:Pro 级别的代码能力,Flash 级别的响应速度。高频迭代开发、生产级系统、交互式应用,它都能轻松胜任。

比如这个手势追踪的「弹球解谜游戏」,Gemini 3 Flash 能提供近乎实时的 AI 辅助,一边看你玩一边给建议。

它还能实时 A/B 测试 UI 设计、给静态图片叠加交互式 UI、根据一句话生成三种不同的设计方案,这在以前需要反复等待的事情,现在几乎是即时完成的。

企业客户纷纷好评

JetBrains、Bridgewater Associates、Figma、Cursor、Warp、Harvey、Replit……这些公司已经在用 Gemini 3 Flash 了。

他们的反馈都很一致:推理速度快、效率高、性能堪比大模型。

全球推送

从今天开始,Gemini 3 Flash 开始向全球用户推送:

开发者可以通过 Google AI Studio、Gemini CLI、Vertex AI 以及新的 Agent 开发平台 Google Antigravity 使用 Gemini API。

普通用户可以在 Gemini App 和 Google Search 的 AI Mode 中直接体验,而且是免费的。Gemini 3 Flash 将取代 2.5 Flash 成为 Gemini App 的默认模型。

因为它强大的多模态推理能力,你可以让它分析视频、理解图片,然后几秒钟内给你一份可操作的计划。比如上传一段高尔夫挥杆视频,它能告诉你怎么改进动作。

关于它的速度的闪电程度,作为参考的是,如果你一边画画,它一边猜你画的是什么,你会发现:你还没画完,它就已经猜出来了

在 Search 的 AI Mode 中,Gemini 3 Flash 能更好地理解你问题的细微差别,并能把研究和行动结合起来:

你得到的不只是一堆链接,而是经过智能组织的分析和具体建议,并且,速度和普通搜索一样快




相关链接:

  • 官方博客:https://blog.google/products/gemini/gemini-3-flash
  • Google AI Studio:https://ai.google.dev/gemini-api/docs/models#gemini-3-flash
  • Vertex AI:https://cloud.google.com/vertex-ai
  • Google Antigravity:https://antigravity.google/

标签: 分类

添加新评论