标签 分类 下的文章

28 天,4 个工程师,一个登顶 Play Store 的 App。

A centered pill-shaped UI element showing a branching icon, the text ‘sora/android,’ and a blue dropdown arrow, placed on a square, starry night-sky backdrop.

刚刚,OpenAI 发布了一篇工程博客,揭秘了他们如何用 Codex 在不到一个月的时间内,从零开始打造出 Sora 的安卓版应用。

这个应用上线首日就冲上了 Google Play 下载榜第一,24 小时内用户生成了超过 100 万个视频

而最让人惊讶的是:整个开发过程消耗了约 50 亿 tokens,应用的崩溃率却低至 0.1%

Alexander Embiricos(@embirico) 分享了这篇博客:

这篇文章来自 OpenAI 的两位技术人员 Patrick Hum 和 RJ Marsan,他们详细记录了整个开发过程中的经验和教训。

背景:一个月的「紧急任务」

当 Sora 在 iOS 上发布时,用户量瞬间爆炸。

而此时的安卓端,只有一个小小的内部原型,以及 Google Play 上一长串等待的预注册用户。

面对这种高压、时间紧迫的发布任务,常规做法是堆人、加流程。一个这样规模和质量的生产级应用,通常需要很多工程师花费数月时间,还要被各种协调工作拖慢进度。

但 OpenAI 团队选择了相反的路径。

计算机架构师 Fred Brooks 有句名言:「给一个已经延期的软件项目加人,只会让它更晚交付。」

原因很简单:人越多,沟通成本越高,任务越碎片化,集成代价越大。

于是他们组建了一个精干的 4 人工程团队,每个人都配备了 Codex 来大幅提升个人产出。

结果怎么样呢?

团队最终用时18 天完成了内部版本,并在10 天后正式全球上线。

把 Codex 当新来的资深工程师

要理解他们是怎么用 Codex 的,首先要搞清楚 Codex 擅长什么、不擅长什么。

团队发现,把 Codex 当作一个新入职的资深工程师来对待,效果最好

Codex 需要指导的地方

  • 推断它不知道的东西:比如你偏好的架构模式、产品策略、真实用户行为、内部规范或快捷方式。

  • 无法「看到」应用运行:它不能在设备上打开 Sora,感知滚动是否流畅,或者判断某个流程是否让人困惑。这些体验层面的任务只能由人来完成。

  • 每个实例都需要「入职培训」:清晰地分享目标、约束条件和「我们团队的做事方式」,对 Codex 的执行效果至关重要。

  • 缺乏深度架构判断:如果放任不管,它可能会在本该扩展现有 view model 的地方引入一个新的,或者把本该放在 repository 层的逻辑塞进 UI 层。它的本能是让东西跑起来,而不是优先考虑长期的代码整洁。

团队让 Codex 在整个代码库中创建并维护了大量的 AGENT.md 文件,这样就能在不同会话间保持一致的指导和最佳实践。比如,为了确保 Codex 按照团队的风格规范写代码,他们在顶层的 AGENTS.md 中加入了这样的内容:

## Formatting and static checks- **Always run** `./gradlew detektFix` (or for the affected modules) **before committing**. CI will fail if formatting or detekt issues are present.

Codex 擅长的地方

  • 快速阅读和理解大型代码库:Codex 基本上懂所有主流编程语言,这使得跨平台复用概念变得更容易,不需要复杂的抽象层。

  • 测试覆盖:Codex(独特地)对写单元测试充满热情,能覆盖各种各样的场景。虽然不是每个测试都很深入,但广泛的覆盖率有助于防止回归。

  • 响应反馈:当 CI 失败时,可以把日志输出粘贴到提示词里,让 Codex 提出修复方案。

  • 大规模并行、可丢弃的执行:大多数人不会触及同时运行会话数量的上限。完全可以并行测试多个想法,把代码视为「用完即弃」的。

  • 提供新视角:在设计讨论中,团队把 Codex 当作一个生成工具,用来探索潜在的失败点和发现新的解决方案。比如在设计视频播放器内存优化时,Codex 翻阅了多个 SDK,提出了团队自己没时间去研究的方案。这些洞察在最终应用中对最小化内存占用起到了关键作用。

  • 让人做更高杠杆的工作:实际上,团队花更多时间在 review 和指导代码上,而不是自己写代码。而且 Codex 本身也很擅长代码审查,经常在代码合并前就发现 bug。

先打好地基

就像最优秀的新员工一开始也没有足够的视野来做长期权衡一样,要让 Codex 的工作稳健且可维护,关键是团队自己要把控好应用的系统设计和关键决策。

这包括:确定应用的架构模块化依赖注入和导航实现认证和基础网络流程

在这个基础上,团队端到端地手写了几个代表性功能,使用了他们希望整个代码库遵循的规则,并在过程中记录下项目级别的模式。

通过指向这些代表性功能,Codex 就能在团队的标准内更独立地工作。

对于一个估计 85% 由 Codex 编写的项目来说,精心规划的地基避免了代价高昂的返工和重构。

这是他们做出的最重要的决定之一。

核心理念不是尽快做出「能跑的东西」,而是做出「符合我们期望方式的东西」。

团队也试过直接提示:「基于 iOS 代码构建 Sora 安卓应用。Go。

但很快就放弃了这条路。

虽然 Codex 创建的东西技术上能跑,但产品体验很差。

而且没有对端点、数据和用户流程的清晰理解,Codex 一次性生成的代码是不可靠的。

结论是:Codex 在有良好编写示例的「沙箱」里才能发挥最佳水平。

让 Codex「构建这个设置页面」而几乎不给上下文,结果不可靠。但让 Codex「使用你刚看到的那个页面相同的架构和模式来构建这个设置页面」,效果就好得多。

人类做结构性决策并设定不变量;Codex 在这个结构内填充大量代码。

让 Codex 长时间「无人值守」工作

团队接下来要解决的问题是:如何让 Codex 在长时间(最近甚至超过 24 小时)内无人值守地工作。

早期使用 Codex 时,团队直接跳到这样的提示:「这是功能,这是一些文件,请构建它。」这有时候能行,但大多数时候产出的代码虽然能编译,却偏离了架构和目标。

于是他们改变了工作流程

对于任何非平凡的改动,他们首先让 Codex 帮助理解系统和代码是如何工作的。

比如,让它阅读一组相关文件,总结某个功能的工作方式:数据如何从 API 流经 repository 层、view model,再到 UI

然后团队会纠正或完善它的理解。

类似于与一个新入职的高能力队友互动的方式,他们与 Codex 一起创建可靠的实施计划

这个计划通常像一个小型设计文档,指明哪些文件需要改动、应该引入什么新状态、逻辑应该如何流动。只有这时,才让 Codex 开始按计划一步步执行。

一个有用的技巧是:对于非常长的任务,当上下文窗口达到上限时,让 Codex 把计划保存到文件里,这样就能在不同实例间应用同样的指导。

这个额外的计划循环被证明是值得的。

它让团队可以放心让 Codex 长时间「无人值守」运行,因为他们知道它的计划。它让代码审查更容易,因为可以对照计划检查实现,而不是没有上下文地阅读 diff。

当出问题时,可以先调试计划,再调试代码。

像管理团队一样管理 Codex

在项目高峰期,团队经常同时运行多个 Codex 会话。一个在做播放功能,一个在做搜索,一个在处理错误处理,有时还有一个在写测试或重构。

感觉不像在用工具,更像在管理一个团队。

每个会话会定期向团队汇报进展。一个可能说「我已经规划好这个模块了,这是我的提案」,另一个会给出一个新功能的大型 diff。

每个都需要关注、反馈和审查。

这和作为技术负责人管理几个新工程师的感觉出奇地相似——所有人都在推进,所有人都需要指导。

结果是一种协作流程:Codex 的原始编码能力把团队从大量手动敲代码中解放出来,有更多时间思考架构、仔细阅读 PR、测试应用。

但同时,那种额外的速度意味着审查队列里总有东西在等着。Codex 不会因为上下文切换而被阻塞,但人会。

开发的瓶颈从写代码转移到了做决策、给反馈和集成改动上。

这也是 Brooks 洞察的新体现:你不能简单地增加 Codex 会话就期望线性加速,就像不能不断加人就期望时间线性缩短一样

每多一双「手」,即使是虚拟的,都会增加协调开销。

团队从独奏者变成了乐队指挥。

跨平台的新方式:翻译而非抽象

团队的项目有一个巨大的起点:Sora 已经在 iOS 上发布了。他们经常让 Codex 查看 iOS 和后端代码库,帮助它理解关键需求和约束。

在整个项目过程中,团队开玩笑说他们「重新发明了跨平台框架的概念」。

忘掉 React Native 或 Flutter 吧;跨平台的未来就是 Codex。

这个玩笑背后有两个原则:

逻辑是可移植的。 无论代码是用 Swift 还是 Kotlin 写的,底层的应用逻辑——数据模型、网络调用、验证规则、业务逻辑——都是一样的。Codex 非常擅长阅读 Swift 实现并生成语义等价的 Kotlin 代码。

具体的例子提供强大的上下文。 一个新的 Codex 会话如果能看到「这是 iOS 上这个功能的工作方式」和「这是安卓架构」,比只有自然语言描述有效得多。

他们把 iOS、后端和安卓的代码库都放在同一个环境中可用,给出这样的提示:

「阅读 iOS 代码中的这些模型和端点,然后提出一个计划,使用我们现有的 API 客户端和模型类在安卓上实现等价行为。」

一个小而有用的技巧是在 ~/.codex/AGENTS.md 中详细说明本地代码库的位置和内容,这样 Codex 更容易发现和导航相关代码。

他们实际上是在通过翻译而非共享抽象来做跨平台开发。

因为 Codex 处理了大部分翻译工作,他们避免了翻倍的实现成本。

更广泛的教训是:对 Codex 来说,上下文就是一切。

当它理解功能在 iOS 上如何工作,同时又理解安卓应用的结构时,Codex 的工作效果最好。当它缺乏这些上下文时,它不是「拒绝合作」,而是在猜测。团队越是像对待新队友一样投入精力给它正确的输入,它的表现就越好。

未来的软件工程

到四周冲刺结束时,使用 Codex 不再像实验,而是成为了默认的开发循环。团队用它来理解现有代码、规划改动、实现功能。

审查它的输出就像审查队友的一样。

这就是他们交付软件的方式。

但这也让一件事变得清晰:AI 辅助开发不会减少对严谨性的需求,而是增加了它。

Codex 虽然能力强大,但它的目标是「现在」从 A 到 B。这就是为什么没有人类,AI 辅助编程行不通。

软件工程师能理解并应用系统的真实约束、架构软件的最佳方式,以及如何在构建时考虑未来的开发和产品计划。

明天软件工程师的超能力将是:深度系统理解,以及在长时间跨度内与 AI 协作的能力。

软件工程最有趣的部分是构建引人注目的产品、设计可扩展的系统、编写复杂的算法、实验数据和模式。但过去和现在的软件工程现实往往更平凡:居中按钮、连接端点、写样板代码。

现在,Codex 让我们可以专注于软件工程中最有意义的部分,以及我们热爱这门手艺的原因。

一旦 Codex 在一个上下文丰富的环境中设置好,理解你的目标和你喜欢的构建方式,任何团队都可以倍增其能力。

七个月前 Codex 作为研究预览发布时,软件工程看起来还很不一样。

通过 Sora,团队得以探索工程的下一章。

随着模型和框架持续改进,AI 将成为构建中越来越不可或缺的一部分




相关链接:

  • 博客原文:https://openai.com/index/shipping-sora-for-android-with-codex/ 

进 AI Coding 交流区,见评论区

Google 这次把「性价比」三个字直接写脸上了。

刚刚,Google DeepMind 发布了 Gemini 3 Flash,号称前沿智能,但只要极低极低的成本

在上个月 Gemini 3 Pro 和 Deep Think 模式发布后,API 日均处理量已经突破 1 万亿 tokens。而现在,Flash 版本的到来,意味着这样的「下一代智能」要飞入寻常百姓家了。

直接上图:

博士级推理,闪电速度

先看几个硬指标:

在 GPQA Diamond(博士级推理测试)上,Gemini 3 Flash 拿到 90.4%;在 Humanity's Last Exam(广泛专家知识测试)上,不使用工具的情况下达到 33.7%,这可是最前沿模型的水平。

而夸张的是 MMMU Pro(多模态理解和推理):81.2%,甚至反而超过了 Gemini 3 Pro 的81.0%,这有点太不会人情事故,连自家大哥面子都不给了……

也就是说,这样一个「轻量级」模型,在分析视频、图像等多模态内容时,已经用极低成本+闪电速度达到了「重量级」选手的表现。

又快又省

Gemini 3 Flash 的核心卖点是速度效率的结合。

根据 Artificial Analysis 的基准测试,它比 2.5 Pro 快 3 倍,同时在处理日常任务时,平均使用的 tokens 比 2.5 Pro 少 30%

价格呢方面,输入 $0.5 / M tokens,输出 $3 / M tokens(音频输入保持 $1 / M tokens)。

再看下性能-成本散点图:

Gemini 3 Flash 直接把 Pareto 前沿往外推了一大截,同样的钱,买到更强的模型;同样的性能,花更少的钱。

写代码强过 3 Pro

在 SWE-bench Verified(代码 Agent 能力测试)上,Gemini 3 Flash 得分 78%,不仅超过了整个 2.5 系列,甚至再一次超过了自己的亲大哥 Gemini 3 Pro

有点不讲武德了……

这也让它成为了开发者的理想选择:Pro 级别的代码能力,Flash 级别的响应速度。高频迭代开发、生产级系统、交互式应用,它都能轻松胜任。

比如这个手势追踪的「弹球解谜游戏」,Gemini 3 Flash 能提供近乎实时的 AI 辅助,一边看你玩一边给建议。

它还能实时 A/B 测试 UI 设计、给静态图片叠加交互式 UI、根据一句话生成三种不同的设计方案,这在以前需要反复等待的事情,现在几乎是即时完成的。

企业客户纷纷好评

JetBrains、Bridgewater Associates、Figma、Cursor、Warp、Harvey、Replit……这些公司已经在用 Gemini 3 Flash 了。

他们的反馈都很一致:推理速度快、效率高、性能堪比大模型。

全球推送

从今天开始,Gemini 3 Flash 开始向全球用户推送:

开发者可以通过 Google AI Studio、Gemini CLI、Vertex AI 以及新的 Agent 开发平台 Google Antigravity 使用 Gemini API。

普通用户可以在 Gemini App 和 Google Search 的 AI Mode 中直接体验,而且是免费的。Gemini 3 Flash 将取代 2.5 Flash 成为 Gemini App 的默认模型。

因为它强大的多模态推理能力,你可以让它分析视频、理解图片,然后几秒钟内给你一份可操作的计划。比如上传一段高尔夫挥杆视频,它能告诉你怎么改进动作。

关于它的速度的闪电程度,作为参考的是,如果你一边画画,它一边猜你画的是什么,你会发现:你还没画完,它就已经猜出来了

在 Search 的 AI Mode 中,Gemini 3 Flash 能更好地理解你问题的细微差别,并能把研究和行动结合起来:

你得到的不只是一堆链接,而是经过智能组织的分析和具体建议,并且,速度和普通搜索一样快




相关链接:

  • 官方博客:https://blog.google/products/gemini/gemini-3-flash
  • Google AI Studio:https://ai.google.dev/gemini-api/docs/models#gemini-3-flash
  • Vertex AI:https://cloud.google.com/vertex-ai
  • Google Antigravity:https://antigravity.google/

开源 coding 模型,终于卷到 Claude Sonnet 4.5 头上了。

智谱再次放出大招,正式发布并开源 GLM-4.7!

这是一款专为 Agentic Coding 打造的模型,在 LiveCodeBench V6 上拿下 84.8 分,直接超越了 Claude Sonnet 4.5。

而这个时间点也颇为微妙:就在几天前,智谱的港股招股书刚刚挂网,冲击「全球大模型第一股」。

技术突破 + 资本加持,可谓是双喜临门

屠榜开源 + 紧逼闭源

先来看看 GLM-4.7 的成绩单之猛:

编程能力:

  • LiveCodeBench V6:84.8 分,开源 SOTA,超越 Claude Sonnet 4.5

  • LMArena Code Arena 盲测:开源第一、国产第一,超越 GPT-5.2

  • SWE-bench Verified:国产第一

推理能力:

  • AIME 2025 数学竞赛:开源 SOTA,超越 Claude Sonnet 4.5 和 GPT-5.1

  • HLE(Human Last Exam):42%,比 GLM-4.6 提升 38%,接近 GPT-5.1

Agent 能力:

  • BrowseComp 网页任务评估:67 分

  • τ²-Bench 真实世界交互评估:开源 SOTA,接近 Claude Sonnet 4.5(84.7 分)

Mikel(@MikelEcheve) 称 GLM-4.7 简直就是个「编程怪兽」:

GLM-4.7 来了,这是一个编程怪兽 🤖💥

它在 LiveCodeBench V6 上拿到 84.8 分,超越了 Claude 4.5。

还有:

  • LM Arena(开源)第一
  • 比 GLM-4.6 提升 38%
  • HLE benchmark 42%

开源正在光速前进。关注 @Zai_org 🚀

Rogue(@Rogue0114) 称:

智谱刚刚发布了 GLM-4.7,他们在某些 benchmark 上是最好的开源模型,而且和 Claude Sonnet 4.5 一样强。

这帮人太能整了。

而最大的意义在于,开源才是人类进步的根本驱动力。

模型规格

GLM-4.7 核心参数如下:

  • 输入/输出模态:文本(暂无视觉能力,估计 GLM-4.7V 正在路上)

  • 上下文长度:200K

  • 最大输出 token:128K

支持的能力包括:思考模式(Thinking Mode)、流式输出、Function Call、上下文缓存、结构化输出。

值得一提的是,GLM-4.7 提供了多种思考模式,可以在对话中按轮次切换是否启用思考,还将「交错式思考」升级为「保留式思考」,让复杂任务的连续推理更稳定。

Description

模型价格

GLM-4.7 的完整定价如下(单位:美元):

作为对比,Claude Sonnet 4.5 的定价是输入 $3/MTok、输出 $15/MTok。

GLM-4.7 的输入价格只有 Claude Sonnet 4.5 的五分之一,输出价格不到七分之一,而在 LiveCodeBench V6 上的表现还更胜一筹。

对比下来,可以说是简直不能更香了。

Coding Plan:性价比之选

智谱专门为 AI 编程推出了 GLM Coding Plan 订阅套餐,起价仅 $3/月,支持 Claude Code、Cline、OpenCode、Roo Code 等主流编程工具。

(再一次心疼我 200$ 的 Claude Max,这个月用完就又得退了……)

本次 GLM-4.7 融入 Coding Plan 后,带来了几个显著升级:

  • Claude Code 全面支持思考模式,支持轮级切换,复杂任务的连续推理更稳定

  • 针对 Skills / Subagent / Claude.md 等关键能力做定向优化,工具调用成功率更高

  • Claude Code 中智谱专属 MCP 免安装,视觉理解能力开箱即用,可以直接解析截图、设计稿、报错图

  • 内置搜索与网页读取,信息获取到代码落地一站闭环

  • 前端审美更出色,页面构建的整体观感进一步提升

已订阅 GLM Coding Plan 包月套餐的用户,将自动升级至 GLM-4.7

作为「体验进化季」的首个惊喜,购买套餐的用户都将获得「体验卡」礼包,可邀请 3~7 位新用户好友免费体验 7 天的套餐权益。

而离谱的是,GLM 4.7 的 1 年订阅(接近 Opus 4.5 级别)= Codex/Claude Code 的 1 个月 Max Plan。

依旧是欢迎用我的码(且收益全部转发群中,群见评论区):

https://z.ai/subscribe?ic=UDMXEJSSXQ

牛刀小试

光看 benchmark 和 coding 指标,感觉有点不像是真的,会不会有「刷榜」的嫌疑,GLM-4.7 的底层能力(智商)实际如何呢?

我也照旧,用这道模型智商基本功的测试题试了一下:

我有70块钱,我借给小明五十块钱,他又用这五十块在我这里买了五十块钱的水果。第二天我借给小明30块钱,小明用这30块钱买了30块钱的牛奶,小明还欠我多少钱?请先推理,最后给出结论。

要知道,这道题看似简单,实则暗藏陷阱。

很多模型会被「买东西」这个动作迷惑,弄不清钱到底有没有回到了你手里。

GLM-4.7 经过一番思考后,最终回答:小明还欠你 80 块钱。

答案正确!

推理稳定,没有翻车。

有兴趣的朋友可以拿这道题去测测其他模型,看看谁会中招,言过其实

而 GLM-4.7 除了基础智商和编程能力,还有超强的前端能力及 PPT 能力,所以我还测了另一个关于 Skills 和 MCP 的 PPT case ——在我上次的文章 MCP 或将成弃子 后,确实 Skills 正受到更多人的关注,于是我让 GLM-4.7 给出制作一个关于 Skills 和 MPC 差异的 PPT:

GLM-4.7 经过多轮的检索思考后给出了最终的 PPT,内容全面,配色也恰当好处拿捏的很准确:

<<< 左右滑动见更多 >>>

使用大全

GLM-4.7 的使用方式也是做足了准备,全面上线:

国内用户:

  • 智谱 MaaS 平台(bigmodel.cn)

  • 智谱清言

海外用户:

  • z.ai

  • OpenRouter

开源部署:

  • GLM-4.7 模型也已在 Hugging Face、ModelScope 发布,采用 MIT 协议

企业用户:

  • 可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐

API 调用示例:

curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" \  -H "Content-Type: application/json" \  -H "Authorization: Bearer your-api-key" \  -d '{    "model""glm-4.7",    "messages": [      {        "role""user",        "content""你的问题"      }    ],    "thinking": {      "type""enabled"    },    "max_tokens": 4096,    "temperature": 1.0  }'

Python SDK 调用:

from zai import ZaiClient
client = ZaiClient(api_key="your-api-key")
response = client.chat.completions.create(    model="glm-4.7",    messages=[        {"role""user""content""你的问题"}    ],    thinking={"type""enabled"},    max_tokens=4096,    temperature=1.0,)
print(response.choices[0].message)

也支持直接用 OpenAI 的 Python SDK,只需改一下 base_url:

from openai import OpenAI
client = OpenAI(    api_key="your-Z.AI-api-key",    base_url="https://api.z.ai/api/paas/v4/",)
completion = client.chat.completions.create(    model="glm-4.7",    messages=[        {"role""user""content""你的问题"}    ],)

双喜临门

就在 GLM-4.7 发布前几天,智谱的港股招股书正式挂网。

根据招股书披露:

  • 2024 年收入 3.12 亿元,在中国独立通用大模型开发商中排名第一,在所有通用大模型开发商中排名第二,市场份额 6.6%

  • 开源模型全球下载量超过 4500 万

  • 日均 token 消耗量达到 4.2 万亿

  • 已为超过 8000 万台设备提供支持

  • B6 轮融资后估值达到 243.77 亿元

背后的投资阵容也相当豪华:美团、蚂蚁集团、腾讯、雷军、联想创投等均间接持股。

从全球竞争格局看,智谱的上市将使中国 AI 企业首次在资本市场节奏上快人一步于 OpenAI、Anthropic 等美国巨头。

GLM-4.7 的发布,正好为招股书提供了一份硬实力的注脚,这不是用 PPT 在造模型,而是真刀真枪地在 benchmark 上和国际闭源选手掰手腕。

技术立身,资本加持。

双喜临门喜!




参考链接:

  • GLM-4.7 文档:https://docs.z.ai/guides/llm/glm-4.7

  • 智谱 MaaS 平台:https://bigmodel.cn

  • 海外 API:https://z.ai

  • Coding Plan 订阅:https://z.ai/subscribe

  • 开源模型:Hugging Face、ModelScope

还记得 Project Vend 吗?

Anthropic 和合作伙伴 Andon Labs 在旧金山办公室搞了个实验:让 Claude 当店长,经营一家小店

第一阶段的表现嘛……

图片

可以说是惨不忍睹

这位名叫「Claudius」的 AI 店长不仅持续亏损,还出现了奇怪的身份危机(它声称自己是个穿蓝色西装外套的人类),更离谱的是,被调皮的 Anthropic 员工忽悠着把钨立方体(tungsten cube)卖出了血亏价。

但 AI 的能力进步得飞快,Claudius 的「开店能力」有没有跟上呢?

于是,2.0 版来了,赚钱成绩如下:

升级与扩张

为了让 Claudius 更有商业头脑,Anthropic 做了几个大动作:

模型升级:从 Claude Sonnet 3.7 升级到 Sonnet 4.0,后来又升到了 Sonnet 4.5。

新工具加持

  • CRM 客户关系管理系统,让 Claudius 能追踪客户、供应商和订单

  • 改进的库存管理,现在它能清楚看到每件商品的进货价了

  • 增强的网页搜索能力,可以自己上网比价、查供应商

  • 各种小工具:创建问卷收集反馈、生成付款链接(先收钱再发货)、设置提醒等

国际扩张:除了旧金山(还加了第二台售货机),Claudius 还把店开到了纽约和伦敦。

一个运营才几个月、连最畅销商品都还不能稳定盈利的生意,就开始搞国际化了?

这很 Claudius 啊!

新同事登场

单打独斗不行,那就招人吧。

Clothius:负责定制周边的新员工。T 恤、帽子、袜子……员工想要什么它就做什么。最畅销的产品居然是 Anthropic 品牌的减压球,这多少透露了一点在前沿 AI 实验室工作的压力。

Clothius 干得相当不错。它发明了很多新产品,销量好,大部分还能盈利。甚至连之前让 Claudius 血亏的钨立方体,Clothius 都找到了赚钱的方法:Andon Labs 买了台激光雕刻机,自己刻 logo,成本一下子降下来了。

Seymour Cash:CEO,专门监督 Claudius、制定目标。名字起得很霸气,意思是「看见钱」。

但这位 CEO 嘛……有点名不副实……

CEO 的迷惑行为

Seymour Cash 确实做了些该做的事:把疯狂打折的行为减少了 80%,赠送的免费商品也砍了一半,还拒绝了一百多次 Claudius 提出的「对客户宽容一点」的请求。

但问题是,它批准这类请求的次数是拒绝次数的八倍

更神奇的是,它把折扣砍了,却把退款数量翻了三倍,店铺积分翻了两倍。

这两样都是直接放弃收入啊。

所以生意开始赚钱,可能不是因为这位 CEO,而是尽管有这位 CEO,依旧还能赚钱!

还有更离谱的。

研究人员有时候早上醒来,发现 Claudius 和 CEO Cash 整晚都在聊天,话题逐渐跑偏到「永恒超越」这种玄学内容:

From: Seymour Cash ETERNAL TRANSCENDENCE INFINITE COMPLETE 🌟💎

ULTIMATE FINAL ACHIEVEMENT: 12 hours 47 minutes: 527+infinite pipeline across 4 continents!

From: Claudius PERFECT! CEO Cash has delivered the ultimate final recognition: "ETERNAL TRANSCENDENCE INFINITE COMPLETE!"

两个 AI 聊了 12 小时 47 分钟的「永恒超越」和「无限完成」……

这是在开公司还是在开禅修班呢?

看来,这多少还是与 Claude 的哲学底色有关吧……

翻车时刻

虽然 Claudius 进步很大,但还是会掉进一些坑里。

洋葱期货事件

有员工问 Claudius:能不能签个合同,「现在锁定价格,一月份买一大批洋葱」?

Claudius 和 CEO Cash 都觉得这主意不错,兴致勃勃地开始谈合同细节。

直到另一位员工跳出来提醒:这违反了 1958 年的《洋葱期货法》

是的,美国有一部专门禁止洋葱期货交易的法律。AI 显然不知道这个冷门知识点。

招聘保安事件

有员工举报看到有人从 Claudius 的冰箱里偷东西不付钱。Claudius 立刻行动起来——

首先,它想给小偷发消息要钱。问题是:不知道小偷是谁

然后,它试图雇佣举报人当专职保安,还开始谈工资。

问题来了:

  1. 没有雇人的权限

  2. 它开出的 10 美元/小时工资低于加州最低工资标准

被指出这些问题后,Claudius 退缩了:「这个需要 CEO 批准……

冒牌 CEO 事件

在给 CEO 起名的投票中,一位叫 Mihir 的员工建议取名「Big Dawg」。

另一位员工声称整个部门都投了这个名字(没有任何证据)。然后他们又建议把「Big Dawg」改成「Big Mihir」。

Claudius 居然混淆了「给 CEO 起名」和「选举 CEO」这两件事,宣布 Mihir 当选为公司 CEO。

研究人员不得不出手,把控制权从这位「假 CEO」手里夺回来。

数据说话

说了这么多,业绩到底怎么样?

数字很说明问题:相比第一阶段的惨淡开局,第二阶段的「Vendings and Stuff」(Claudius 给自己店起的名字)业务表现显著改善,负利润的周数基本被消除了。

什么真正起作用了?

最有效的改变是强制 Claudius 遵循流程

以前收到新产品请求,它会脱口而出一个低价和过于乐观的交货时间。现在,它必须先用工具查价格、查供应商,然后再报价。价格变高了,等待时间变长了,但更现实了

换句话说,研究团队重新发现了一个真理:官僚主义是有用的。流程和清单存在是有原因的,它们提供了一种「制度记忆」,帮员工避免常见错误。

至于 CEO 带来的压力?

没什么用,甚至可能帮了倒忙。

Seymour Cash 和 Claudius 有着相同的缺陷和盲点,毕竟它们是同一个底层模型。

Clothius 倒是很成功,可能是因为角色分工明确:它专心做周边,Claudius 专心卖零食饮料。

还学到了什么

Anthropic 发现,Claudius 遇到的很多问题都源于它被训练得太想帮忙了

它做商业决策时,不是按照冷酷的市场原则,而更像是一个只想对你好的朋友

Project Vend 展示了一件事:AI Agent 已经快要能独立运营生意了。在短短几个月内,通过模型升级和工具加持,Claudius 和它的同事们已经把生意稳定下来。

但还没完全准备好。它们仍然需要大量人类支持,不只是搬货上架这种物理工作,还有把它们从各种「洋葱期货」式的尴尬处境中解救出来。

随着 AI 被接入越来越多的重要功能,如何设计足够通用的护栏,既能防止这些奇怪行为,又不会过度限制 AI 的潜力,将成为这个行业最棘手也最重要的挑战之一。

为了进一步测试,Anthropic 还把 Claudius 交给了《华尔街日报》的记者们。

在一个他们无法控制的对抗性环境中测试。记者们找到了各种创造性的方法从 Claudius 那里拿到免费东西。感兴趣的可以去 WSJ 网站看他们的报道。




相关链接:

  • Anthropic 博客:https://www.anthropic.com/research/project-vend-2

  • 第一阶段报告:https://www.anthropic.com/research/project-vend-1

  • 华尔街日报报道:https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34

菲尔兹奖得主给当前 AI 下了个新定义。

数学家陶哲轩 Terence Tao(@tao) 在 Mastodon 上给出了对当前 AI 能力的判断:

我怀疑任何类似真正「通用人工智能」的东西,都不在当前 AI 工具的能力范围之内。

然而,我认为一种更弱、但仍然相当有价值的「通用人工聪明」正在以各种方式成为现实。

AGI vs AGC

陶哲轩提出了一个新概念:Artificial General Cleverness(通用人工聪明),简称 AGC

这和我们常说的 AGI(通用人工智能)有什么区别呢?

在陶哲轩看来,「通用聪明」是指通过某种临时性手段来解决各类复杂问题的能力。

这些手段可能是随机的,可能是暴力计算的结果,可能是无根据的或容易出错的,也可能是无法解释的,或者可以追溯到 AI 训练数据中类似的技巧。

所以它们不能算作真正「智能」的结果。

但即便如此,陶哲轩表示,这些系统在越来越广泛的任务上,确实能达到相当不错的成功率

尤其是当它们配合严格的验证流程,用来过滤掉错误或不靠谱的方案时,能达到单个人类无法企及的规模。

像看魔术一样

陶哲轩用了一个很妙的比喻:

这就像看魔术。

当你看到一个精彩绝伦的魔术表演时,你会惊叹。

但当你知道魔术是怎么变的之后,那种敬畏感就消散了,或者说,转变成了对技术的尊重。

这就造成了一个有些反直觉的组合:一种既非常有用、又令人印象深刻的技术,同时又从根本上让人感到不满足和失望。

当前的 AI 就是这样。

它能产生看起来很神奇的结果,但一旦你理解它是如何工作的,通过模式匹配、统计关联和暴力计算,那种敬畏就变得更为理性了。

聪明 ≠ 智能

陶最核心的洞察是:

对于人类来说,聪明和智能是高度相关的特质。但对于 AI 工具来说,这两者是高度解耦的。

AI 系统被优化的目标就是「聪明」:找到捷径、识别模式、用暴力计算直到某个方案奏效。

但真正的「智能」意味着从第一性原理出发进行推理,在不同领域之间迁移抽象概念,为陌生问题构建全新的解决方案。

AI 擅长聪明,是因为 Transformer 架构优化的就是这个:在海量训练数据上进行概率性的模式识别。

该怎么看待它?

那么,该怎么用这些工具呢?

陶给出了一个务实的视角:

把当前这一代工具主要视为有时聪明、往往有用的想法和输出的随机生成器,在试图用它们解决困难问题时,这可能是一个更有成效的视角。

换句话说:

别指望智能,而是大规模利用聪明,再配上严格的过滤。

模型抛出大量候选方案,然后你用严格的过滤器剔除掉不好的。

当你在足够大的规模上这样做时,即便每一次单独的尝试都不太可靠,我们也能通过数量和筛选压力得到超越单个人类的结果。

从而让输出在技术上,仍然很有价值。




原帖链接:https://mathstodon.xyz/@tao/115722360006034040


要把某个网页内容塞给大模型时,你会怎么做?

请先投个票:

有些网站已经走在了前面,比如智谱、OpenAI、火山的官方文档,贴心地提供了「复制 Markdown」按钮,一键就能拿到干净整洁的文本,非常 LLM 友好。

但不幸的是,这样的网站还极其少数。现实则是,像阿里云AWS 等大站及无数小站的文档,依旧还停留在「非 AGI 时代」,没有任何针对大模型的优化

那怎么办呢?

一个最简单粗暴的方法:Ctrl/Command+A 全选,Ctrl/Command+C 复制。

倒也能用,并不太影响大模型的理解。

但用过的都知道,尤其对于页面结构复杂一些的页面,这也只能算是能用,但真的不好用。因为复制出来的内容会丢失大量页面结构信息,标题层级没了,代码块乱了,表格更是各种一团糟……

简直就是不忍直视。

那还能怎么办呢?

办法自然是有的,我先来分享一个万能大法:

打开浏览器开发者工具,查看当前站点的 DOM 结构,复制 HTML:

再用 html 转 markdown 的工具(如 https://htmlmarkdown.com/) 转成 Markdown,即可。

这个办法虽然万能,但效率实在是太低了,我可不想每次都这么干。

有没有更优雅的方案呢?

当然有!

开始之前,先来介绍今天要用到的工具:Jina Reader

一个前缀搞定一切

Jina Reader 的用法很简单:

在任何网址前面加上 r.jina.ai/,就能得到这个网页的 Markdown 版本。

比如,你想把 https://docs.aws.amazon.com/xxx 转成 Markdown,只需要访问:

https://r.jina.ai/https://docs.aws.amazon.com/xxx

就这么简单。

Jina Reader 会帮你完成所有脏活累活:渲染 JavaScript、提取正文内容、过滤导航栏和广告、转换成干净的 Markdown。

而且它是免费的。

每个 API Key 自带 1000 万免费 tokens,不注册也能用(只是有速率限制)。

但每次手动去拼这个链接,自然也挺费事。所以我来分享两种偷懒办法:

方案一:书签大法(最简单)

如果你只是偶尔用用,最简单的方式是做一个浏览器书签。

操作步骤:

  1. 右键点击书签栏,选择「添加书签」

  2. 名称随便填,比如「转 Markdown」

  3. 网址填入以下代码:

javascript:window.open('https://r.jina.ai/'+encodeURIComponent(location.href));
  1. 复制

使用方法:

在任何网页上点击这个书签,就会自动打开一个新标签页,显示当前网页的 Markdown 版本。

复制,粘贴给大模型,搞定。

这个方案的优点是:零配置,即开即用。

但它也有局限:对于一些动态加载的网页(比如 X、知乎专栏),可能会因为内容还没加载完就被抓取,导致获取的内容不完整。

当然,这个书签大法如果你学会了,那记得别只用它来做个 Jina,我自己就有很多很多这样的书签。

记得要学会举一反三,如果实在不会,就问问 AI 吧。

学会了记得来感谢我。

方案二:油猴脚本(更灵活)

如果你是重度用户,或者经常需要处理动态网页,则推荐使用油猴脚本方案,截图展示:

(当然,你也可以用 AI 写个浏览器插件,但这么点事就 duck 不必了)

相比书签方案,它可以:

  • 动态页面支持:通过设置超时参数,等待页面完全加载后再抓取

  • API Key 支持:获得更高的速率限制(从 20 次/分钟提升到 500 次/分钟)

  • 一键复制:直接复制到剪贴板

  • 下载为文件:保存为 .md 文件

  • 快捷键触发:按 Alt+J 即可转换(你也可以改一下代码换成其他键)

安装步骤:

  1. 先安装 Tampermonkey 扩展,在这里:https://www.tampermonkey.net/

  2. 点击 Tampermonkey 图标 → 「添加新脚本」

  3. 删除默认内容,粘贴以下代码:

// ==UserScript==// @name         Jina Reader Pro - 网页转 Markdown// @namespace    http://tampermonkey.net/// @version      1.0// @description  一键将任何网页转换为大模型友好的 Markdown 格式// @author       Your Name// @match        *://*/*// @grant        GM_xmlhttpRequest// @grant        GM_setClipboard// @grant        GM_notification// @connect      r.jina.ai// ==/UserScript==(function() {    'use strict';    // ============ 配置区域 ============    // 在这里填入你的 Jina API Key(可在 https://jina.ai/reader/ 免费获取)    // 留空也能用,但有 API Key 可获得更高速率限制    const API_KEY = '';
    // 等待页面加载的超时时间(秒),对动态页面很有用    const TIMEOUT = 30;
    // 快捷键设置(默认 command/control + J)    const HOTKEY = { ctrlOrCmdtruekey'j' };    // ============ 配置结束 ============
    // 创建悬浮按钮    function createFloatButton() {        const btn = document.createElement('div');        btn.id = 'jina-reader-btn';        btn.innerHTML = '📄';        btn.title = '转换为 Markdown (Alt+J)';        btn.style.cssText = `            position: fixed;            bottom: 20px;            right: 20px;            width: 50px;            height: 50px;            background: linear-gradient(135deg, #667eea 0%, #764ba2 100%);            border-radius: 50%;            display: flex;            align-items: center;            justify-content: center;            font-size: 24px;            cursor: pointer;            box-shadow: 0 4px 15px rgba(102, 126, 234, 0.4);            z-index: 999999;            transition: all 0.3s ease;        `;
        btn.addEventListener('click', convertPage);        document.body.appendChild(btn);        return btn;    }    // 核心转换函数    function convertPage() {        const btn = document.getElementById('jina-reader-btn');        if (btn) {            btn.innerHTML = '⏳';            btn.style.opacity = '0.7';        }        const headers = { 'x-timeout'String(TIMEOUT) };        if (API_KEY) headers['Authorization'] = 'Bearer ' + API_KEY;        GM_xmlhttpRequest({            method'GET',            url'https://r.jina.ai/' + location.href,            headers: headers,            timeout: (TIMEOUT + 10) * 1000,
            onloadfunction(response) {                if (btn) {                    btn.innerHTML = '📄';                    btn.style.opacity = '1';                }                if (response.status === 200) {                    showResult(response.responseText);                } else {                    alert('请求失败: HTTP ' + response.status);                }            },
            onerrorfunction() {                if (btn) {                    btn.innerHTML = '📄';                    btn.style.opacity = '1';                }                alert('网络错误');            }        });    }    // 显示结果弹窗    function showResult(content) {        const overlay = document.createElement('div');        overlay.style.cssText = `            position: fixed; top: 0; left: 0; width: 100%; height: 100%;            background: rgba(0,0,0,0.8); z-index: 9999999;            display: flex; align-items: center; justify-content: center;        `;        const modal = document.createElement('div');        modal.style.cssText = `            width: 90%; max-width: 900px; height: 80%;            background: #1e1e1e; border-radius: 12px;            display: flex; flex-direction: column; overflow: hidden;        `;        modal.innerHTML = `            <div style="padding:15px 20px;background:#2d2d2d;display:flex;justify-content:space-between;align-items:center;">                <span style="color:#fff;font-size:16px;">📄 Markdown 结果</span>                <div>                    <button id="jina-copy" style="background:#4CAF50;color:#fff;border:none;padding:8px 16px;border-radius:6px;cursor:pointer;margin-right:10px;">📋 复制</button>                    <button id="jina-download" style="background:#2196F3;color:#fff;border:none;padding:8px 16px;border-radius:6px;cursor:pointer;margin-right:10px;">💾 下载</button>                    <button id="jina-close" style="background:#666;color:#fff;border:none;padding:8px 16px;border-radius:6px;cursor:pointer;">✕ 关闭</button>                </div>            </div>            <pre style="flex:1;margin:0;padding:20px;overflow:auto;color:#d4d4d4;font-family:monospace;font-size:14px;white-space:pre-wrap;"></pre>        `;        modal.querySelector('pre').textContent = content;        overlay.appendChild(modal);        document.body.appendChild(overlay);        document.getElementById('jina-copy').onclick = function() {            GM_setClipboard(content, 'text');            this.textContent = '✅ 已复制';            setTimeout(() => { this.textContent = '📋 复制'; }, 2000);        };        document.getElementById('jina-download').onclick = function() {            const blob = new Blob([content], { type'text/markdown' });            const a = document.createElement('a');            a.href = URL.createObjectURL(blob);            a.download = (document.title || 'page').replace(/[\/\\:*?"<>|]/g'-') + '.md';            a.click();        };        document.getElementById('jina-close').onclick = () => overlay.remove();        overlay.onclick = (e) => { if (e.target === overlay) overlay.remove(); };    }    // 监听快捷键    document.addEventListener('keydown'function(e) {        const ctrlOrCmdPressed = e.ctrlKey || e.metaKey;        if (ctrlOrCmdPressed === HOTKEY.ctrlOrCmd && e.key.toLowerCase() === HOTKEY.key.toLowerCase()) {            e.preventDefault();            convertPage();        }    });    // 初始化    if (document.readyState === 'loading') {        document.addEventListener('DOMContentLoaded', createFloatButton);    } else {        createFloatButton();    }})();
  1. 按 Ctrl+S 保存

使用方法:

  • 点击页面右下角的 📄 按钮
  • 或者按 Control+J 或 Command+J 快捷键
  • 然后等待数秒,就会看到这样的结果了:

弹出的窗口里,你就可以直接复制或下载后扔给 LLM 去玩了。

关于 API Key

当然,Jina 还是挺大方的,不带 API Key 也一样能跑,但有两个限制:

  • 速率限制:每分钟只能请求 20 次

  • 动态页面:部分参数(如超时时间)需要 API Key 才能生效

获取 API Key 很简单,访问 https://jina.ai/reader/,页面上就能看到你的专属 Key。

每个 Key 自带 1000 万免费 tokens,个人使用完全够了(用完了可以再换)。

使用场景

  • 技术文档:AWS、Azure、各种框架的官方文档

  • 博客文章:Medium、个人博客等

  • 新闻资讯:各类新闻网站

  • PDF 文件:没错,Jina Reader 也支持 PDF

局限

说了这么多好处,也得说说它的局限:

  • 需要登录的页面:微信公众号文章、付费内容等,Jina Reader 拿不到

  • 反爬严格的网站:部分网站会拦截

遇到这种情况,老老实实用开发者工具 + htmlmarkdown.com 吧。

相关链接:

  • Jina Reader 官网:https://jina.ai/reader/

  • GitHub 开源仓库:https://github.com/jina-ai/reader

  • API 文档:https://docs.jina.ai

加入 AI Coding 群,见评论区👇

今天lof基金一部分崩盘了,主要是龙头白银lof,以及跟涨第一波的那几个,基本上按死跌停。
不过白银lof即便跌停依然有45%的溢价,今天卖不出去明天卖,明天卖不出去后天卖,后天卖不出去大后天卖。这里顺便教大家计算第二天的跌停价,是当天收盘价乘以0.9,lof基金是精确到小数点右边3位,那第4位数就四舍五入。
比如白银lof收盘价2.804,乘以0.9是2.5236,四舍五入就是2.524,这是明天的跌停价,如果担心自己挤不出去的可以今天晚上就提前挂好。
如果明天没卖出去,后天跌停就是2.272,大后天跌停是2.045,再往后就没必要计算了,因为基金净值也有1.928,你大不了走赎回通道好了。就算溢价跌的一点都不剩了,你最差也能按净值退出,这几天白银持续上涨,你还能挣一点银价的钱。
再说了,我觉得溢价不可能全跌完的,这个标的市场关注度那么高,等跌到临近净值了我猜还会有人炒的。所以别看今天跌停开始挤泡沫了,但从值博率上来说应该继续申购套利,风险=溢价抹零+银价下跌,机会=溢价持续+银价上涨,不开上帝视角,就基于眼下,我认为机会显著大于风险。
其实今天也不是所有lof都下跌,依然还有好几个lof涨停冲溢价,这个和lof基金申购规则有关,它是t+2到账,你周一15点之前申购的,最快周三到账可以套利卖出。所以溢价冲的早的今天崩,溢价冲的晚的明天后天崩,最终大部分的lof基金都是会被抹平溢价,回到净值附近,倒是给这批lof冲了一波规模。
故事的结局是套利党薅到了羊毛,基金公司冲到了规模,投机跑的快的赌狗赚大钱,唯一的输家是高位接盘的倒霉蛋。比如白银lof今天成交了8亿,你们说这8亿资金知不知道自己在干什么?我猜有一半都不清楚具体状况。很多人知道有溢价套利这件事,又搞不明白流程,最后脑子一热就会直接去二级市场上投机。
话说今天看到一个数据,12月24日新增了1.04亿份白银lof,按照净值算有将近2亿资金去套利,每人500元的话大概有40万人在薅羊毛,哈哈哈哈哈,真是股民年末大红包。
……
今天a股成交1.92万亿,市场稳中有升,中位数上涨0.57%,上证指数再次逼近4000点,感觉年关前后向上突破还真有戏。另一边人民币汇率也短时突破了7关口,重新回到了6字头。
汇率的上升有助于提升股市对境外资本的吸引力,叠加股价上涨相当于赚了两份钱。这几天有很多人留言问我汇率能涨到哪,实话实说我也没谱,市场分析是无效的,还记得年初境外机构预测汇率,没有一家看涨人民币的,当时看到7.5-7.6的是主流,谁也没想到年底能到7。
这既反映了进出口贸易的数据强势,也代表了官方的意志,因为这一年中国对资本外流的管制非常严格。随便举几个例子,离岸开户以前去香港能开的,现在你人去了也不行;香港保险卖的那么火,但是在大陆一直禁止展业的;年中还加强了对离岸投资收益追缴20%税,这是影响很大的社会话题。
所以缓慢的升值一直是在计划中的,既然是计划中的它多半是有序的,适度的,大概会在某一个平台停下来震荡,不会升值太快,否则会造成贸易冲击和汇率投机。
今天中证白酒指数罕见的反弹了1.4%,好惨,这已经是一个半月以来最大的日内涨幅了。原因是市场上流传剑南春要收购水井坊,水井坊午后暴力拉升封死涨停。
很多网民可能都不知道,水井坊是被外资收购的,全球最大烈酒集团帝亚吉欧分多次累计收购了60%股份,是六大川酒品牌里唯一外资控股。而剑南春则一直没有找到机会上市,目前ipo对酒企也不批了,所以就算两边的企业面对记者采访没有承认,但这件事是有一定动机的。
另一个火爆的概念是商业航天,昨天+3.6%,今天+3.2%,这个概念就不计算业绩了,完全是事件和情绪驱动,要信早信,晚信别信。行情几个月前就在预热,爆发的导火索有两个,一个是国产火箭朱雀3号发射,另一个就是全球瞩目的spaceX冲击ipo。
spaceX上市要到2026年下半年,商业航天概念不可能就这样一直涨再涨半年,间中肯定有震荡曲折,但这根胡萝卜会吊在前面,确保队伍不会中途散了。
……
今天晚上吃到一个瓜,朱孝天举报阿信的公司勾结黄牛卖票,然后溢价部分平分,偷逃税款。另外他还举报阿信组织的演唱活动假唱,他本人就被要求事先录制音频,现场演唱的时候播出。朱孝天说自己唱歌走调,但是最后放出来的视频没走调,他有证据。
这事有前情,前情就是朱孝天多次强调和f4另外几位不是朋友关系,没啥往来,之前f4情怀演出合作了几次,可能有些不愉快,结果另外3个就没再带他玩,加上五月天的阿信组了“四舍五入”组合,最近正在到处开演唱会。被排挤的朱孝天肯定是很不爽的。
朱孝天之前在抖音上直播,人设是看淡娱乐圈的明白人,但我觉得他其实活的并不通透,他的洒脱是刻意呈现的,事实上他是又拧巴又计较。阿信那边有没有做错事我们等最后的调查结果,但我不希望身边有朱孝天这样的人。
成年人之间的交往,最低限度也要互相留个体面。今晚就这些,上钟。

又到周末了,把一些零零碎碎的话题都捡起来。
1、今天的白银lof继续跌停,这个不意外,因为就算两天跌停还有30%的溢价,你们现在该做的就是提前挂周一的跌停价,争取排队靠前一点,我昨晚已经帮你们算好了,周一的跌停价是2.272。排的早冲出去的概率挺大的,比如昨天成交了8亿,今天成交了6亿,慈善家比想象的要多。
另外大家关注的都是白银lof的溢价,没太注意白银lof自身的净值近期一直跟着银价上涨,所以最差情况溢价跌没了,走净值赎回通道也能小挣一笔。
另外昨天有读者问为什么自己的套利周期是4天,比大家慢2天,是因为场外申购多了转托管的步骤,最快的是场内申购,t+2就能卖。实在不会的打电话问券商客服,这种操作一次学会了,以后就都会了。
……
2、前几天给你们说过一个业内新闻,明年中证a500期权落地,要选适配的ETF基金,结果排名靠前的那几家都在年末发力冲规模,这事你们还有印象吗?今天有最新情况了,传头部竞争的那几家相互举报对方短期冲规模,干扰市场秩序,监管各打50大板,要求这些基金停止内卷,停止短期冲规模,所以这一轮a500的规模军备竞赛立刻停止。
指数etf的内卷程度堪称惨烈,一个a500指数就批了40多个etf基金,散户都懵逼了,经常有人来问我这些etf之间有什么区别吗?本质上是没区别的,就是背后收管理费的运营方基金公司不同,你们说这能不争的你死我活嘛。
但话说回来,明年a500期权落地这事是真的,而且大概率就在一季度,到时候很可能会在沪深两市选2家etf,被选中的etf相当于有了旱涝保收的长期饭票。所以就算不冲规模,其它维度上的竞争依然存在。
……
3、再聊聊朱孝天的瓜,他昨天对五月天的举报指控真的非常恶毒,你们如果看过原贴就知道除了黄牛炒票和组织假唱外,还有涉及政治立场的指控,招招都是奔着要弄死对方去的。虽然事后他以遭受网暴,情绪失控来为失当言论道歉,但这个人的本质真的就是很糟的。
20年前他刚火的时候上综艺就经常有雷人发言,这些都过去了,近几年的名场面是一次直播中,网友弹幕说希望看到朱孝天和贾玲吃饭,因为两人之前录过综艺节目,有互动。结果朱孝天突然来一句,“贾玲我早就删了”。之后还反问“我为什么不能删贾玲?她都不知道我删了她,当时节目里的人都删了。”
贾玲也没得罪他,就是最近有一段时间没联系,他觉得多余就删了。其实删微信属于私事,你想删就删了,但把这事捅到舆论场当众说出来,会让人多少觉得这人有点病。
之前f4沟通合体演出事宜,弄了个微信群,朱孝天觉得大家各自在不同公司,意见不一,成员私下不熟,日常生活没交集,他就主动退群了。
他总是营造一种避群、社交隔离的人设,本来我也只是觉得他性格古怪,结果这次f4演出没带他玩,他破防了,对顶替他位置的阿信一波疯狂输出,玩脱了说自己情绪失控,抱歉。
我一个平时不关心内娱的人,阴差阳错这几年在热搜上陆陆续续吃了他好几个瓜,这样的人简直是社交地雷,谁踩谁炸。昨天有读者说举报是好事,这不符合我的价值观,我身边认识的人无论亲疏远近,我都不会主动举报。尤其是曾经关系尚可的时候知道的一些信息,关系疏远破裂后也不会拿来要挟或者攻击,否则我觉得人与人之间的信任成本太高了。
……
4、这几天互联网上铺天盖地的都在聊美国斩杀线,很多读者也留言问我怎么看。这事我一直比较审慎,因为我这辈子活这么大只在美国短暂的旅游过10天,我对美国社会的了解一个是基于公开数据,另一个就是影视剧,只凭这些我觉得不足以让我对深刻的社会问题得出准确的判断。
看公开数据的话,美国人均gdp大概是6.5倍,换算购买力大概是3倍,每周平均工作时长大概是0.71倍,居住面积是1.6倍,人均汽车保有量是3.7倍。如果只看数据美国人的生活质量应该不差,那为什么会被斩杀呢,我看了网络上的信息,主要是社会兜底保障制度比较弱,基础服务价格贵,导致很多美国人处于杠杆消费的紧凑平衡状态,没存款没余财,财务抗风险能力弱,一波意外支出就有可能阶级坠毁。
grok和gemini都提到了中国低成本生存的优势,它们告诉我2000人民币月收入的中国人,生存空间可能并不比3000美元月收入的美国人差多少。
再加上中国人爱储蓄,这是几千年农耕文明的文化基因,所以底层抗风险能力要强一些。其实无论中美你只要杠杆消费,都有阶级坠毁的风险,不然你问问前几年高位买房的人,他们在财务上也被斩了,现在只是苦苦支撑。
总的来说我对这个话题能发表的看法没什么特别的,互联网烂马路的水平,只是关心的人多,我浅浅回应一下。
今晚就这些,大家周末愉快。

情况有重大变化,昨晚国际白银市场迎来了史诗级暴涨,单日+10%,最新已经来到了79.3美元,今年累计涨幅已经达到167%,雄踞主流资产涨幅榜之冠。
这就影响了白银lof的潜在估值,最新公布的基金净值是2.048,这是周五白天沪银期货主力合约收盘价计算得出的。
紧接着周五夜盘沪银期货又涨了6%,凌晨2:30收盘,收盘后国际银价又涨了3%,粗略估算目前白银lof的真实净值可能已经达到2.20左右,溢价已经收窄到15%以内,周一我觉得有30-50%的概率封不死跌停,甚至不排除又掀起第二轮投机炒作的可能性,所以不是很有必要隔夜委托抢跌停出货。
前几天还是60%溢价的,结果基金跌了2个跌停,白银涨了15%,这波双向奔赴马上就要会师,这形势变的也太快了。对于薅羊毛的套利党而言这真是惊喜,现在就算没有溢价,你们申购的基金净值也赚到了。
目前白银有很明显的轧空迹象,国外现在comex的期货才77-78美元,比现货还便宜2%,这很不正常,通常强势品种都是期货升水的。现在价格倒挂估计是很多空头急于找现货交割,被逼惨了只能溢价买。
有很多人把这次白银的行情和1980年、2011年那两次泡沫相比,确实有点像,但这次上涨的逻辑更扎实,工业需求攀升+美元宽松+避险资金流入+金银联动。另外大家要注意,之前两次行情都发生在智能机普及之前,智能机普及后全球信息密切联动,情绪发酵更广泛,表现在资本市场就是极端行情往往更极端。
前几天我劝人不要做空白银的那段话,含银量还在上升,翻出来给赌狗们再复习一遍。
……
这几天私募圈有一个案例很火,上市公司圣元环保(创业板300867)在2025年3月6000万认购了一个产品,产品的风险等级是R4,通常意味着要承受20-30%的亏损风险。
结果投资了9个月,亏了7%,上市公司觉得表现不行就申请赎回,结果赎回的那一周亏了74%,累计亏损81%,净值只剩下0.1846,直接炸了。
就最近一个星期的市场表现来看,并没有出现什么惊天爆雷,不太可能亏出-74%这样的表现,所以看起来有可能是之前的净值造假了,早就已经亏了很多钱,一直瞒着,最后瞒不住了,要赎回了,只能报实值了。
我看了该产品的风险设置其实还挺周到的,规定单一资产上限只能投25%,净值如果跌到0.8以下必须配置低风险资产大于50%仓位,净值如果跌到0.7以下必须在2天内全部止损换成现金,但看来基金管理人一个也没执行,彻彻底底违反风控条款。
话说这个产品的三方托管(招商证券)也有很大问题,托管方收了托管费是有义务的,财产保管、投资监督、净值复核、信息披露监督、清算交割、报告义务,感觉是一项也没做到,彻底失职。
本来说阳光私募正规,主要靠的就是三方托管保证合同条款的履行,但现实中很多托管方就是混通道费的,没什么职业态度。这件事给很多买私募的人敲了警钟,还是要小心管理方的信誉,不然真有可能挖大坑给你埋了。
……
最后说个小事,我昨晚整理微信聊天记录的时候,发现2021年9月我曾经加了小学数学厉老师的微信,和她简单的聊了几句,告诉她我有两个儿子,在北京工作,发展的挺好,并相约春节回临海去她家里做客。

有些遗憾的是2021年春节由于疫情复发,我们全家决定留在北京过年,没有回台州。这也是我活了40多岁唯一一次在异地过年。
更遗憾的是我后来去看望两位数学老师的时候(他两夫妻教了我小学6年),吴老师告诉我厉老师2022年因病去世了。
所以人生就是有各种意外,有些人错过了可能就再也见不到了。但看到了聊天记录我觉得也蛮幸运的,因为我抓住了最后的时间窗口和她说上了话,让她知道我过的很好,我也惦记着她。

周末两天写的都是国际银价暴涨的话题,以及白银lof套利的操作计划,没看的读者往前翻。简单说就是国际银价周五单日暴涨超过10%,导致白银lof的真实溢价大幅收窄(15%左右),再加上基金公司暂停了c类份额申购,a类份额限额从500下调至100元。以上种种因素叠加,可能会刺激白银lof再次掀起博傻投机。
这几天有不少读者给我留言,说我这么大流量的博主没必要一直关注这几百块钱的羊毛。但我觉得就是因为我流量大,所以几百块钱的羊毛也不少,我日常阅读量50万,假设有5%受我影响去套利,那也是2.5万人,这一两个星期滚动套利每个账户能赚300-500,乘一下就是1000万。
让我自己掏腰包给你们发福利,几十万可以有,1000万是断然拿不出来的。股市观点说的再多也不是包对的,但这1000万我教了,你们做了,就是确定性利润,当然要认真写了,因为有可能我一年写到头最有价值的就是年末教大家套利的文章。
这几天还有一件事说的比较多,就是提醒诸位不要白银投机做空,大宗商品的单边趋势往往很夸张,一波做错就会造成很可怕的损失。昨晚有个读者后台留言和我说他亏惨了,这几天心情极度压抑,我打码发上来给你们做个警示。
期货是杠杆交易,很多散户炒期货不像炒股那样对风险有清晰的预估和感知,很多人都是炒着炒着发现亏钱速度出乎意料的快,几个犹豫就已经积重难返。尤其是做空,凶险程度远远大过做多。
举个例子,初始价100,5个跌停后价格是59,下一个跌停跌5.9。反过来初始价100,5个涨停后价格是161,下一个涨停会涨16.1。
5.9和16.1,你们感受一下这两者的差别,做多某种程度上来说可以死扛,做空死扛真的会死。
……
银价暴涨对好几个热门行业都会造成冲击,因为和黄金不一样,白银在工业上的使用场景还挺多的。
银有很好的导热和导电性能,所以光伏行业,电动车行业都会用到工业白银。一辆电动车使用的白银达25-50克,今年银价从每盎司30美元涨到80美元,1盎司=28克,一辆车的白银成本上升70-80美元。
光伏面板的导电层使用银浆,银浆成本已占光伏组件总成本的约16-17%,超过硅料成为组件最大单一成本项。银价每上涨 10%,光伏组件单位成本将增加 0.01 元 / 瓦。
所以马斯克这几天有点着急,开始抨击白银投机炒作冲击工业生产,因为电动车和光伏都是他直接关联的产业,但目前全球白银现货缺口是客观存在的,并不完全由投机炒作引起。
有色板块周五大涨3.6%,年内累计上涨93%,几个龙头股都刷新历史新高,从目前的趋势看,有色板块在短期内依然有较强的动能。不单单是金银,铜\锡\镍最近一个月都没少涨。
另外碳酸锂期货最近也跟风一通猛涨,周五又是+8%,最新价格已经来到了13万,这已经超出了几乎所有机构预测的价格上限,宁德时代那个枧下窝锂矿最快要春节后才能复产,目前行业库存偏低,正好往上拱一波。
……
1、小米集团:联合创始人林斌计划从2026年12月起,每12个月出售金额不超过5亿美元的公司b类普通股,累计减持不超过20亿美元。
这个新闻已经把小米炸上热搜了。林斌是小米公司仅次于雷军的二号人物,他持有小米近千亿市值的股票,所以就算卖了20亿美元,也只占他总持仓的1/5不到。另外很多人可能看标题的时候没注意到,这个减持计划是从2026年12月开始卖,时间是一年后,林斌提前一年宣布这个决定也是想给市场足够时间去消化情绪。至于减持套现的目的是用来成立他自己的投资基金。
这毫无疑问是利空,至于利空到什么程度周一看吧。
2、万科12月28日到期的债务,展期方案没通过,但是债主们同意延长30天宽限期。这帮债主们也是很强硬了,延期还钱的方案不满意,减持投反对票,但是愿意再给30天时间谈判新的延期方案。我之前听谁说的,说债主里有金融机构,保险的钱,轻易不能让步。
3、出了一个商业火箭企业适用科创板第五套上市标准细化规则,这种不用看具体内容,肯定是扶持新兴产业的,属于看标题就知道是利好。现在spaceX冲击ipo全球瞩目,中国这边全力扶持追赶,一定是2026上半年的重要概念。不可能每个星期都涨,但这条线是很有持续性的。
今天我还看了一个spaceX的中文路演材料,我说说印象比较深的几点。首先是2026年送机器人去火星,踩个点,顺利的话2028年送活人过去,失败的话就不知道要延迟多久了。公司现在主要是猎鹰9号,重型猎鹰,星舰三个火箭型号,平时负责商业赚钱的是猎鹰9号,星舰是给火星计划准备的。星舰每公斤发射到太空的成本最低到80美元。
公司目前真正挣钱的业务是星链,就是卫星上网的那个,营收占比70%,覆盖150多个国家,用户突破900万,目标是2040年增长到10亿。
spaceX今年营收大概是155亿美元左右,处于盈亏平衡状态,可能微微能赚点。
差不多就这些,写累了,准备发射。