Gemini 3 Flash 发布,多、快、好、省,Coding 能力不输大哥Gemini 3 Pro
Google 这次把「性价比」三个字直接写脸上了。
刚刚,Google DeepMind 发布了 Gemini 3 Flash,号称前沿智能,但只要极低极低的成本。
在上个月 Gemini 3 Pro 和 Deep Think 模式发布后,API 日均处理量已经突破 1 万亿 tokens。而现在,Flash 版本的到来,意味着这样的「下一代智能」要飞入寻常百姓家了。
直接上图:
博士级推理,闪电速度
先看几个硬指标:
在 GPQA Diamond(博士级推理测试)上,Gemini 3 Flash 拿到 90.4%;在 Humanity's Last Exam(广泛专家知识测试)上,不使用工具的情况下达到 33.7%,这可是最前沿模型的水平。
而夸张的是 MMMU Pro(多模态理解和推理):81.2%,甚至反而超过了 Gemini 3 Pro 的81.0%,这有点太不会人情事故,连自家大哥面子都不给了……
也就是说,这样一个「轻量级」模型,在分析视频、图像等多模态内容时,已经用极低成本+闪电速度达到了「重量级」选手的表现。
又快又省
Gemini 3 Flash 的核心卖点是速度和效率的结合。
根据 Artificial Analysis 的基准测试,它比 2.5 Pro 快 3 倍,同时在处理日常任务时,平均使用的 tokens 比 2.5 Pro 少 30%。
价格呢方面,输入 $0.5 / M tokens,输出 $3 / M tokens(音频输入保持 $1 / M tokens)。
再看下性能-成本散点图:
Gemini 3 Flash 直接把 Pareto 前沿往外推了一大截,同样的钱,买到更强的模型;同样的性能,花更少的钱。
写代码强过 3 Pro
在 SWE-bench Verified(代码 Agent 能力测试)上,Gemini 3 Flash 得分 78%,不仅超过了整个 2.5 系列,甚至再一次超过了自己的亲大哥 Gemini 3 Pro。
有点不讲武德了……
这也让它成为了开发者的理想选择:Pro 级别的代码能力,Flash 级别的响应速度。高频迭代开发、生产级系统、交互式应用,它都能轻松胜任。
比如这个手势追踪的「弹球解谜游戏」,Gemini 3 Flash 能提供近乎实时的 AI 辅助,一边看你玩一边给建议。
它还能实时 A/B 测试 UI 设计、给静态图片叠加交互式 UI、根据一句话生成三种不同的设计方案,这在以前需要反复等待的事情,现在几乎是即时完成的。
企业客户纷纷好评
JetBrains、Bridgewater Associates、Figma、Cursor、Warp、Harvey、Replit……这些公司已经在用 Gemini 3 Flash 了。
他们的反馈都很一致:推理速度快、效率高、性能堪比大模型。
全球推送
从今天开始,Gemini 3 Flash 开始向全球用户推送:
开发者可以通过 Google AI Studio、Gemini CLI、Vertex AI 以及新的 Agent 开发平台 Google Antigravity 使用 Gemini API。
普通用户可以在 Gemini App 和 Google Search 的 AI Mode 中直接体验,而且是免费的。Gemini 3 Flash 将取代 2.5 Flash 成为 Gemini App 的默认模型。
因为它强大的多模态推理能力,你可以让它分析视频、理解图片,然后几秒钟内给你一份可操作的计划。比如上传一段高尔夫挥杆视频,它能告诉你怎么改进动作。
关于它的速度的闪电程度,作为参考的是,如果你一边画画,它一边猜你画的是什么,你会发现:你还没画完,它就已经猜出来了。
在 Search 的 AI Mode 中,Gemini 3 Flash 能更好地理解你问题的细微差别,并能把研究和行动结合起来:
你得到的不只是一堆链接,而是经过智能组织的分析和具体建议,并且,速度和普通搜索一样快。
相关链接:
官方博客:https://blog.google/products/gemini/gemini-3-flash Google AI Studio:https://ai.google.dev/gemini-api/docs/models#gemini-3-flash Vertex AI:https://cloud.google.com/vertex-ai Google Antigravity:https://antigravity.google/