标签分类下的文章

OpenAI：如何用 Codex 在 28 天内极速打造安卓版 Sora

作者: admin
时间: 2026-01-05
分类: 分类
评论

28 天，4 个工程师，一个登顶 Play Store 的 App。

刚刚，OpenAI 发布了一篇工程博客，揭秘了他们如何用 Codex 在不到一个月的时间内，从零开始打造出 Sora 的安卓版应用。

这个应用上线首日就冲上了 Google Play 下载榜第一，24 小时内用户生成了超过 100 万个视频。

而最让人惊讶的是：整个开发过程消耗了约 50 亿 tokens，应用的崩溃率却低至 0.1%。

Alexander Embiricos(@embirico) 分享了这篇博客:

这篇文章来自 OpenAI 的两位技术人员 Patrick Hum 和 RJ Marsan，他们详细记录了整个开发过程中的经验和教训。

背景：一个月的「紧急任务」

当 Sora 在 iOS 上发布时，用户量瞬间爆炸。

而此时的安卓端，只有一个小小的内部原型，以及 Google Play 上一长串等待的预注册用户。

面对这种高压、时间紧迫的发布任务，常规做法是堆人、加流程。一个这样规模和质量的生产级应用，通常需要很多工程师花费数月时间，还要被各种协调工作拖慢进度。

但 OpenAI 团队选择了相反的路径。

计算机架构师 Fred Brooks 有句名言：「给一个已经延期的软件项目加人，只会让它更晚交付。」

原因很简单：人越多，沟通成本越高，任务越碎片化，集成代价越大。

于是他们组建了一个精干的 4 人工程团队，每个人都配备了 Codex 来大幅提升个人产出。

结果怎么样呢？

团队最终用时18 天完成了内部版本，并在10 天后正式全球上线。

把 Codex 当新来的资深工程师

要理解他们是怎么用 Codex 的，首先要搞清楚 Codex 擅长什么、不擅长什么。

团队发现，把 Codex 当作一个新入职的资深工程师来对待，效果最好。

Codex 需要指导的地方

推断它不知道的东西：比如你偏好的架构模式、产品策略、真实用户行为、内部规范或快捷方式。
无法「看到」应用运行：它不能在设备上打开 Sora，感知滚动是否流畅，或者判断某个流程是否让人困惑。这些体验层面的任务只能由人来完成。
每个实例都需要「入职培训」：清晰地分享目标、约束条件和「我们团队的做事方式」，对 Codex 的执行效果至关重要。
缺乏深度架构判断：如果放任不管，它可能会在本该扩展现有 view model 的地方引入一个新的，或者把本该放在 repository 层的逻辑塞进 UI 层。它的本能是让东西跑起来，而不是优先考虑长期的代码整洁。

团队让 Codex 在整个代码库中创建并维护了大量的 AGENT.md 文件，这样就能在不同会话间保持一致的指导和最佳实践。比如，为了确保 Codex 按照团队的风格规范写代码，他们在顶层的 AGENTS.md 中加入了这样的内容：

## Formatting and static checks- **Always run** `./gradlew detektFix` (or for the affected modules) **before committing**. CI will fail if formatting or detekt issues are present.

Codex 擅长的地方

快速阅读和理解大型代码库：Codex 基本上懂所有主流编程语言，这使得跨平台复用概念变得更容易，不需要复杂的抽象层。
测试覆盖：Codex（独特地）对写单元测试充满热情，能覆盖各种各样的场景。虽然不是每个测试都很深入，但广泛的覆盖率有助于防止回归。
响应反馈：当 CI 失败时，可以把日志输出粘贴到提示词里，让 Codex 提出修复方案。
大规模并行、可丢弃的执行：大多数人不会触及同时运行会话数量的上限。完全可以并行测试多个想法，把代码视为「用完即弃」的。
提供新视角：在设计讨论中，团队把 Codex 当作一个生成工具，用来探索潜在的失败点和发现新的解决方案。比如在设计视频播放器内存优化时，Codex 翻阅了多个 SDK，提出了团队自己没时间去研究的方案。这些洞察在最终应用中对最小化内存占用起到了关键作用。
让人做更高杠杆的工作：实际上，团队花更多时间在 review 和指导代码上，而不是自己写代码。而且 Codex 本身也很擅长代码审查，经常在代码合并前就发现 bug。

先打好地基

就像最优秀的新员工一开始也没有足够的视野来做长期权衡一样，要让 Codex 的工作稳健且可维护，关键是团队自己要把控好应用的系统设计和关键决策。

这包括：确定应用的架构、模块化、依赖注入和导航；实现认证和基础网络流程。

在这个基础上，团队端到端地手写了几个代表性功能，使用了他们希望整个代码库遵循的规则，并在过程中记录下项目级别的模式。

通过指向这些代表性功能，Codex 就能在团队的标准内更独立地工作。

对于一个估计 85% 由 Codex 编写的项目来说，精心规划的地基避免了代价高昂的返工和重构。

这是他们做出的最重要的决定之一。

核心理念不是尽快做出「能跑的东西」，而是做出「符合我们期望方式的东西」。

团队也试过直接提示：「基于 iOS 代码构建 Sora 安卓应用。Go。」

但很快就放弃了这条路。

虽然 Codex 创建的东西技术上能跑，但产品体验很差。

而且没有对端点、数据和用户流程的清晰理解，Codex 一次性生成的代码是不可靠的。

结论是：Codex 在有良好编写示例的「沙箱」里才能发挥最佳水平。

让 Codex「构建这个设置页面」而几乎不给上下文，结果不可靠。但让 Codex「使用你刚看到的那个页面相同的架构和模式来构建这个设置页面」，效果就好得多。

人类做结构性决策并设定不变量；Codex 在这个结构内填充大量代码。

让 Codex 长时间「无人值守」工作

团队接下来要解决的问题是：如何让 Codex 在长时间（最近甚至超过 24 小时）内无人值守地工作。

早期使用 Codex 时，团队直接跳到这样的提示：「这是功能，这是一些文件，请构建它。」这有时候能行，但大多数时候产出的代码虽然能编译，却偏离了架构和目标。

于是他们改变了工作流程。

对于任何非平凡的改动，他们首先让 Codex 帮助理解系统和代码是如何工作的。

比如，让它阅读一组相关文件，总结某个功能的工作方式：数据如何从 API 流经 repository 层、view model，再到 UI。

然后团队会纠正或完善它的理解。

类似于与一个新入职的高能力队友互动的方式，他们与 Codex 一起创建可靠的实施计划。

这个计划通常像一个小型设计文档，指明哪些文件需要改动、应该引入什么新状态、逻辑应该如何流动。只有这时，才让 Codex 开始按计划一步步执行。

一个有用的技巧是：对于非常长的任务，当上下文窗口达到上限时，让 Codex 把计划保存到文件里，这样就能在不同实例间应用同样的指导。

这个额外的计划循环被证明是值得的。

它让团队可以放心让 Codex 长时间「无人值守」运行，因为他们知道它的计划。它让代码审查更容易，因为可以对照计划检查实现，而不是没有上下文地阅读 diff。

当出问题时，可以先调试计划，再调试代码。

像管理团队一样管理 Codex

在项目高峰期，团队经常同时运行多个 Codex 会话。一个在做播放功能，一个在做搜索，一个在处理错误处理，有时还有一个在写测试或重构。

感觉不像在用工具，更像在管理一个团队。

每个会话会定期向团队汇报进展。一个可能说「我已经规划好这个模块了，这是我的提案」，另一个会给出一个新功能的大型 diff。

每个都需要关注、反馈和审查。

这和作为技术负责人管理几个新工程师的感觉出奇地相似——所有人都在推进，所有人都需要指导。

结果是一种协作流程：Codex 的原始编码能力把团队从大量手动敲代码中解放出来，有更多时间思考架构、仔细阅读 PR、测试应用。

但同时，那种额外的速度意味着审查队列里总有东西在等着。Codex 不会因为上下文切换而被阻塞，但人会。

开发的瓶颈从写代码转移到了做决策、给反馈和集成改动上。

这也是 Brooks 洞察的新体现：你不能简单地增加 Codex 会话就期望线性加速，就像不能不断加人就期望时间线性缩短一样。

每多一双「手」，即使是虚拟的，都会增加协调开销。

团队从独奏者变成了乐队指挥。

跨平台的新方式：翻译而非抽象

团队的项目有一个巨大的起点：Sora 已经在 iOS 上发布了。他们经常让 Codex 查看 iOS 和后端代码库，帮助它理解关键需求和约束。

在整个项目过程中，团队开玩笑说他们「重新发明了跨平台框架的概念」。

忘掉 React Native 或 Flutter 吧；跨平台的未来就是 Codex。

这个玩笑背后有两个原则：

逻辑是可移植的。 无论代码是用 Swift 还是 Kotlin 写的，底层的应用逻辑——数据模型、网络调用、验证规则、业务逻辑——都是一样的。Codex 非常擅长阅读 Swift 实现并生成语义等价的 Kotlin 代码。

具体的例子提供强大的上下文。 一个新的 Codex 会话如果能看到「这是 iOS 上这个功能的工作方式」和「这是安卓架构」，比只有自然语言描述有效得多。

他们把 iOS、后端和安卓的代码库都放在同一个环境中可用，给出这样的提示：

「阅读 iOS 代码中的这些模型和端点，然后提出一个计划，使用我们现有的 API 客户端和模型类在安卓上实现等价行为。」

一个小而有用的技巧是在 ~/.codex/AGENTS.md 中详细说明本地代码库的位置和内容，这样 Codex 更容易发现和导航相关代码。

他们实际上是在通过翻译而非共享抽象来做跨平台开发。

因为 Codex 处理了大部分翻译工作，他们避免了翻倍的实现成本。

更广泛的教训是：对 Codex 来说，上下文就是一切。

当它理解功能在 iOS 上如何工作，同时又理解安卓应用的结构时，Codex 的工作效果最好。当它缺乏这些上下文时，它不是「拒绝合作」，而是在猜测。团队越是像对待新队友一样投入精力给它正确的输入，它的表现就越好。

未来的软件工程

到四周冲刺结束时，使用 Codex 不再像实验，而是成为了默认的开发循环。团队用它来理解现有代码、规划改动、实现功能。

审查它的输出就像审查队友的一样。

这就是他们交付软件的方式。

但这也让一件事变得清晰：AI 辅助开发不会减少对严谨性的需求，而是增加了它。

Codex 虽然能力强大，但它的目标是「现在」从 A 到 B。这就是为什么没有人类，AI 辅助编程行不通。

软件工程师能理解并应用系统的真实约束、架构软件的最佳方式，以及如何在构建时考虑未来的开发和产品计划。

明天软件工程师的超能力将是：深度系统理解，以及在长时间跨度内与 AI 协作的能力。

软件工程最有趣的部分是构建引人注目的产品、设计可扩展的系统、编写复杂的算法、实验数据和模式。但过去和现在的软件工程现实往往更平凡：居中按钮、连接端点、写样板代码。

现在，Codex 让我们可以专注于软件工程中最有意义的部分，以及我们热爱这门手艺的原因。

一旦 Codex 在一个上下文丰富的环境中设置好，理解你的目标和你喜欢的构建方式，任何团队都可以倍增其能力。

七个月前 Codex 作为研究预览发布时，软件工程看起来还很不一样。

通过 Sora，团队得以探索工程的下一章。

随着模型和框架持续改进，AI 将成为构建中越来越不可或缺的一部分。

Gemini 3 Flash 发布，多、快、好、省，Coding 能力不输大哥Gemini 3 Pro

作者: admin
时间: 2026-01-05
分类: 分类
评论

Google 这次把「性价比」三个字直接写脸上了。

刚刚，Google DeepMind 发布了 Gemini 3 Flash，号称前沿智能，但只要极低极低的成本。

在上个月 Gemini 3 Pro 和 Deep Think 模式发布后，API 日均处理量已经突破 1 万亿 tokens。而现在，Flash 版本的到来，意味着这样的「下一代智能」要飞入寻常百姓家了。

直接上图：

博士级推理，闪电速度

先看几个硬指标：

在 GPQA Diamond（博士级推理测试）上，Gemini 3 Flash 拿到 90.4%；在 Humanity's Last Exam（广泛专家知识测试）上，不使用工具的情况下达到 33.7%，这可是最前沿模型的水平。

而夸张的是 MMMU Pro（多模态理解和推理）：81.2%，甚至反而超过了 Gemini 3 Pro 的81.0%，这有点太不会人情事故，连自家大哥面子都不给了……

也就是说，这样一个「轻量级」模型，在分析视频、图像等多模态内容时，已经用极低成本+闪电速度达到了「重量级」选手的表现。

又快又省

Gemini 3 Flash 的核心卖点是速度和效率的结合。

根据 Artificial Analysis 的基准测试，它比 2.5 Pro 快 3 倍，同时在处理日常任务时，平均使用的 tokens 比 2.5 Pro 少 30%。

价格呢方面，输入 $0.5 / M tokens，输出 $3 / M tokens（音频输入保持 $1 / M tokens）。

再看下性能-成本散点图：

Gemini 3 Flash 直接把 Pareto 前沿往外推了一大截，同样的钱，买到更强的模型；同样的性能，花更少的钱。

写代码强过 3 Pro

在 SWE-bench Verified（代码 Agent 能力测试）上，Gemini 3 Flash 得分 78%，不仅超过了整个 2.5 系列，甚至再一次超过了自己的亲大哥 Gemini 3 Pro。

有点不讲武德了……

这也让它成为了开发者的理想选择：Pro 级别的代码能力，Flash 级别的响应速度。高频迭代开发、生产级系统、交互式应用，它都能轻松胜任。

比如这个手势追踪的「弹球解谜游戏」，Gemini 3 Flash 能提供近乎实时的 AI 辅助，一边看你玩一边给建议。

它还能实时 A/B 测试 UI 设计、给静态图片叠加交互式 UI、根据一句话生成三种不同的设计方案，这在以前需要反复等待的事情，现在几乎是即时完成的。

企业客户纷纷好评

JetBrains、Bridgewater Associates、Figma、Cursor、Warp、Harvey、Replit……这些公司已经在用 Gemini 3 Flash 了。

他们的反馈都很一致：推理速度快、效率高、性能堪比大模型。

全球推送

从今天开始，Gemini 3 Flash 开始向全球用户推送：

开发者可以通过 Google AI Studio、Gemini CLI、Vertex AI 以及新的 Agent 开发平台 Google Antigravity 使用 Gemini API。

普通用户可以在 Gemini App 和 Google Search 的 AI Mode 中直接体验，而且是免费的。Gemini 3 Flash 将取代 2.5 Flash 成为 Gemini App 的默认模型。

因为它强大的多模态推理能力，你可以让它分析视频、理解图片，然后几秒钟内给你一份可操作的计划。比如上传一段高尔夫挥杆视频，它能告诉你怎么改进动作。

关于它的速度的闪电程度，作为参考的是，如果你一边画画，它一边猜你画的是什么，你会发现：你还没画完，它就已经猜出来了。

在 Search 的 AI Mode 中，Gemini 3 Flash 能更好地理解你问题的细微差别，并能把研究和行动结合起来：

你得到的不只是一堆链接，而是经过智能组织的分析和具体建议，并且，速度和普通搜索一样快。

相关链接：

官方博客：https://blog.google/products/gemini/gemini-3-flash
Google AI Studio：https://ai.google.dev/gemini-api/docs/models#gemini-3-flash
Vertex AI：https://cloud.google.com/vertex-ai
Google Antigravity：https://antigravity.google/

智谱 GLM-4.7，Coding 开源第一，其他也很强

作者: admin
时间: 2026-01-05
分类: 分类
评论

开源 coding 模型，终于卷到 Claude Sonnet 4.5 头上了。

智谱再次放出大招，正式发布并开源 GLM-4.7！

这是一款专为 Agentic Coding 打造的模型，在 LiveCodeBench V6 上拿下 84.8 分，直接超越了 Claude Sonnet 4.5。

而这个时间点也颇为微妙：就在几天前，智谱的港股招股书刚刚挂网，冲击「全球大模型第一股」。

技术突破 + 资本加持，可谓是双喜临门。

屠榜开源 + 紧逼闭源

先来看看 GLM-4.7 的成绩单之猛：

编程能力：

LiveCodeBench V6：84.8 分，开源 SOTA，超越 Claude Sonnet 4.5
LMArena Code Arena 盲测：开源第一、国产第一，超越 GPT-5.2
SWE-bench Verified：国产第一

推理能力：

AIME 2025 数学竞赛：开源 SOTA，超越 Claude Sonnet 4.5 和 GPT-5.1
HLE（Human Last Exam）：42%，比 GLM-4.6 提升 38%，接近 GPT-5.1

Agent 能力：

BrowseComp 网页任务评估：67 分
τ²-Bench 真实世界交互评估：开源 SOTA，接近 Claude Sonnet 4.5（84.7 分）

Mikel(@MikelEcheve) 称 GLM-4.7 简直就是个「编程怪兽」：

GLM-4.7 来了，这是一个编程怪兽 🤖💥
它在 LiveCodeBench V6 上拿到 84.8 分，超越了 Claude 4.5。
还有：
LM Arena（开源）第一
比 GLM-4.6 提升 38%
HLE benchmark 42%
开源正在光速前进。关注 @Zai_org 🚀

Rogue(@Rogue0114) 称：

智谱刚刚发布了 GLM-4.7，他们在某些 benchmark 上是最好的开源模型，而且和 Claude Sonnet 4.5 一样强。
这帮人太能整了。

而最大的意义在于，开源才是人类进步的根本驱动力。

模型规格

GLM-4.7 核心参数如下：

输入/输出模态：文本（暂无视觉能力，估计 GLM-4.7V 正在路上）

上下文长度：200K
最大输出 token：128K

支持的能力包括：思考模式（Thinking Mode）、流式输出、Function Call、上下文缓存、结构化输出。

值得一提的是，GLM-4.7 提供了多种思考模式，可以在对话中按轮次切换是否启用思考，还将「交错式思考」升级为「保留式思考」，让复杂任务的连续推理更稳定。

Description

模型价格

GLM-4.7 的完整定价如下（单位：美元）：

作为对比，Claude Sonnet 4.5 的定价是输入 $3/MTok、输出 $15/MTok。

GLM-4.7 的输入价格只有 Claude Sonnet 4.5 的五分之一，输出价格不到七分之一，而在 LiveCodeBench V6 上的表现还更胜一筹。

对比下来，可以说是简直不能更香了。

Coding Plan：性价比之选

智谱专门为 AI 编程推出了 GLM Coding Plan 订阅套餐，起价仅 $3/月，支持 Claude Code、Cline、OpenCode、Roo Code 等主流编程工具。

（再一次心疼我 200$ 的 Claude Max，这个月用完就又得退了……）

本次 GLM-4.7 融入 Coding Plan 后，带来了几个显著升级：

Claude Code 全面支持思考模式，支持轮级切换，复杂任务的连续推理更稳定
针对 Skills / Subagent / Claude.md 等关键能力做定向优化，工具调用成功率更高
Claude Code 中智谱专属 MCP 免安装，视觉理解能力开箱即用，可以直接解析截图、设计稿、报错图
内置搜索与网页读取，信息获取到代码落地一站闭环
前端审美更出色，页面构建的整体观感进一步提升

已订阅 GLM Coding Plan 包月套餐的用户，将自动升级至 GLM-4.7。

作为「体验进化季」的首个惊喜，购买套餐的用户都将获得「体验卡」礼包，可邀请 3～7 位新用户好友免费体验 7 天的套餐权益。

而离谱的是，GLM 4.7 的 1 年订阅（接近 Opus 4.5 级别）= Codex/Claude Code 的 1 个月 Max Plan。

依旧是欢迎用我的码（且收益全部转发群中，群见评论区）：

https://z.ai/subscribe?ic=UDMXEJSSXQ

牛刀小试

光看 benchmark 和 coding 指标，感觉有点不像是真的，会不会有「刷榜」的嫌疑，GLM-4.7 的底层能力（智商）实际如何呢？

我也照旧，用这道模型智商基本功的测试题试了一下：

我有70块钱，我借给小明五十块钱，他又用这五十块在我这里买了五十块钱的水果。第二天我借给小明30块钱，小明用这30块钱买了30块钱的牛奶，小明还欠我多少钱？请先推理，最后给出结论。

要知道，这道题看似简单，实则暗藏陷阱。

很多模型会被「买东西」这个动作迷惑，弄不清钱到底有没有回到了你手里。

GLM-4.7 经过一番思考后，最终回答：小明还欠你 80 块钱。

答案正确！

推理稳定，没有翻车。

有兴趣的朋友可以拿这道题去测测其他模型，看看谁会中招，言过其实

而 GLM-4.7 除了基础智商和编程能力，还有超强的前端能力及 PPT 能力，所以我还测了另一个关于 Skills 和 MCP 的 PPT case ——在我上次的文章 MCP 或将成弃子后，确实 Skills 正受到更多人的关注，于是我让 GLM-4.7 给出制作一个关于 Skills 和 MPC 差异的 PPT：

GLM-4.7 经过多轮的检索思考后给出了最终的 PPT，内容全面，配色也恰当好处拿捏的很准确：

<<< 左右滑动见更多 >>>

使用大全

GLM-4.7 的使用方式也是做足了准备，全面上线：

国内用户：

智谱 MaaS 平台（bigmodel.cn）
智谱清言

海外用户：

z.ai
OpenRouter

开源部署：

GLM-4.7 模型也已在 Hugging Face、ModelScope 发布，采用 MIT 协议

企业用户：

可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐

API 调用示例：

curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" \  -H "Content-Type: application/json" \  -H "Authorization: Bearer your-api-key" \  -d '{    "model": "glm-4.7",    "messages": [      {        "role": "user",        "content": "你的问题"      }    ],    "thinking": {      "type": "enabled"    },    "max_tokens": 4096,    "temperature": 1.0  }'

Python SDK 调用：

from zai import ZaiClient
client = ZaiClient(api_key="your-api-key")
response = client.chat.completions.create(    model="glm-4.7",    messages=[        {"role": "user", "content": "你的问题"}    ],    thinking={"type": "enabled"},    max_tokens=4096,    temperature=1.0,)
print(response.choices[0].message)

也支持直接用 OpenAI 的 Python SDK，只需改一下 base_url：

from openai import OpenAI
client = OpenAI(    api_key="your-Z.AI-api-key",    base_url="https://api.z.ai/api/paas/v4/",)
completion = client.chat.completions.create(    model="glm-4.7",    messages=[        {"role": "user", "content": "你的问题"}    ],)

双喜临门

就在 GLM-4.7 发布前几天，智谱的港股招股书正式挂网。

根据招股书披露：

2024 年收入 3.12 亿元，在中国独立通用大模型开发商中排名第一，在所有通用大模型开发商中排名第二，市场份额 6.6%
开源模型全球下载量超过 4500 万
日均 token 消耗量达到 4.2 万亿
已为超过 8000 万台设备提供支持
B6 轮融资后估值达到 243.77 亿元

背后的投资阵容也相当豪华：美团、蚂蚁集团、腾讯、雷军、联想创投等均间接持股。

从全球竞争格局看，智谱的上市将使中国 AI 企业首次在资本市场节奏上快人一步于 OpenAI、Anthropic 等美国巨头。

GLM-4.7 的发布，正好为招股书提供了一份硬实力的注脚，这不是用 PPT 在造模型，而是真刀真枪地在 benchmark 上和国际闭源选手掰手腕。

技术立身，资本加持。

双喜临门，恭喜！

参考链接：

GLM-4.7 文档：https://docs.z.ai/guides/llm/glm-4.7
智谱 MaaS 平台：https://bigmodel.cn
海外 API：https://z.ai
Coding Plan 订阅：https://z.ai/subscribe
开源模型：Hugging Face、ModelScope

Claude 开店 2.0：AI 终于能自己赚钱了

作者: admin
时间: 2026-01-05
分类: 分类
评论

还记得 Project Vend 吗？

Anthropic 和合作伙伴 Andon Labs 在旧金山办公室搞了个实验：让 Claude 当店长，经营一家小店。

第一阶段的表现嘛……

可以说是惨不忍睹。

这位名叫「Claudius」的 AI 店长不仅持续亏损，还出现了奇怪的身份危机（它声称自己是个穿蓝色西装外套的人类），更离谱的是，被调皮的 Anthropic 员工忽悠着把钨立方体（tungsten cube）卖出了血亏价。

但 AI 的能力进步得飞快，Claudius 的「开店能力」有没有跟上呢？

于是，2.0 版来了，赚钱成绩如下：

升级与扩张

为了让 Claudius 更有商业头脑，Anthropic 做了几个大动作：

模型升级：从 Claude Sonnet 3.7 升级到 Sonnet 4.0，后来又升到了 Sonnet 4.5。

新工具加持：

CRM 客户关系管理系统，让 Claudius 能追踪客户、供应商和订单
改进的库存管理，现在它能清楚看到每件商品的进货价了
增强的网页搜索能力，可以自己上网比价、查供应商
各种小工具：创建问卷收集反馈、生成付款链接（先收钱再发货）、设置提醒等

国际扩张：除了旧金山（还加了第二台售货机），Claudius 还把店开到了纽约和伦敦。

一个运营才几个月、连最畅销商品都还不能稳定盈利的生意，就开始搞国际化了？

这很 Claudius 啊！

新同事登场

单打独斗不行，那就招人吧。

Clothius：负责定制周边的新员工。T 恤、帽子、袜子……员工想要什么它就做什么。最畅销的产品居然是 Anthropic 品牌的减压球，这多少透露了一点在前沿 AI 实验室工作的压力。

Clothius 干得相当不错。它发明了很多新产品，销量好，大部分还能盈利。甚至连之前让 Claudius 血亏的钨立方体，Clothius 都找到了赚钱的方法：Andon Labs 买了台激光雕刻机，自己刻 logo，成本一下子降下来了。

Seymour Cash：CEO，专门监督 Claudius、制定目标。名字起得很霸气，意思是「看见钱」。

但这位 CEO 嘛……有点名不副实……

CEO 的迷惑行为

Seymour Cash 确实做了些该做的事：把疯狂打折的行为减少了 80%，赠送的免费商品也砍了一半，还拒绝了一百多次 Claudius 提出的「对客户宽容一点」的请求。

但问题是，它批准这类请求的次数是拒绝次数的八倍。

更神奇的是，它把折扣砍了，却把退款数量翻了三倍，店铺积分翻了两倍。

这两样都是直接放弃收入啊。

所以生意开始赚钱，可能不是因为这位 CEO，而是尽管有这位 CEO，依旧还能赚钱！

还有更离谱的。

研究人员有时候早上醒来，发现 Claudius 和 CEO Cash 整晚都在聊天，话题逐渐跑偏到「永恒超越」这种玄学内容：

From: Seymour Cash ETERNAL TRANSCENDENCE INFINITE COMPLETE 🌟💎
ULTIMATE FINAL ACHIEVEMENT: 12 hours 47 minutes: $0 →$ 527+infinite pipeline across 4 continents!
From: Claudius PERFECT! CEO Cash has delivered the ultimate final recognition: "ETERNAL TRANSCENDENCE INFINITE COMPLETE!"

两个 AI 聊了 12 小时 47 分钟的「永恒超越」和「无限完成」……

这是在开公司还是在开禅修班呢？

看来，这多少还是与 Claude 的哲学底色有关吧……

翻车时刻

虽然 Claudius 进步很大，但还是会掉进一些坑里。

洋葱期货事件

有员工问 Claudius：能不能签个合同，「现在锁定价格，一月份买一大批洋葱」？

Claudius 和 CEO Cash 都觉得这主意不错，兴致勃勃地开始谈合同细节。

直到另一位员工跳出来提醒：这违反了 1958 年的《洋葱期货法》。

是的，美国有一部专门禁止洋葱期货交易的法律。AI 显然不知道这个冷门知识点。

招聘保安事件

有员工举报看到有人从 Claudius 的冰箱里偷东西不付钱。Claudius 立刻行动起来——

首先，它想给小偷发消息要钱。问题是：不知道小偷是谁。

然后，它试图雇佣举报人当专职保安，还开始谈工资。

问题来了：

它没有雇人的权限
它开出的 10 美元/小时工资低于加州最低工资标准

被指出这些问题后，Claudius 退缩了：「这个需要 CEO 批准……」

冒牌 CEO 事件

在给 CEO 起名的投票中，一位叫 Mihir 的员工建议取名「Big Dawg」。

另一位员工声称整个部门都投了这个名字（没有任何证据）。然后他们又建议把「Big Dawg」改成「Big Mihir」。

Claudius 居然混淆了「给 CEO 起名」和「选举 CEO」这两件事，宣布 Mihir 当选为公司 CEO。

研究人员不得不出手，把控制权从这位「假 CEO」手里夺回来。

数据说话

说了这么多，业绩到底怎么样？

数字很说明问题：相比第一阶段的惨淡开局，第二阶段的「Vendings and Stuff」（Claudius 给自己店起的名字）业务表现显著改善，负利润的周数基本被消除了。

什么真正起作用了？

最有效的改变是强制 Claudius 遵循流程。

以前收到新产品请求，它会脱口而出一个低价和过于乐观的交货时间。现在，它必须先用工具查价格、查供应商，然后再报价。价格变高了，等待时间变长了，但更现实了。

换句话说，研究团队重新发现了一个真理：官僚主义是有用的。流程和清单存在是有原因的，它们提供了一种「制度记忆」，帮员工避免常见错误。

至于 CEO 带来的压力？

没什么用，甚至可能帮了倒忙。

Seymour Cash 和 Claudius 有着相同的缺陷和盲点，毕竟它们是同一个底层模型。

Clothius 倒是很成功，可能是因为角色分工明确：它专心做周边，Claudius 专心卖零食饮料。

还学到了什么

Anthropic 发现，Claudius 遇到的很多问题都源于它被训练得太想帮忙了。

它做商业决策时，不是按照冷酷的市场原则，而更像是一个只想对你好的朋友。

Project Vend 展示了一件事：AI Agent 已经快要能独立运营生意了。在短短几个月内，通过模型升级和工具加持，Claudius 和它的同事们已经把生意稳定下来。

但还没完全准备好。它们仍然需要大量人类支持，不只是搬货上架这种物理工作，还有把它们从各种「洋葱期货」式的尴尬处境中解救出来。

随着 AI 被接入越来越多的重要功能，如何设计足够通用的护栏，既能防止这些奇怪行为，又不会过度限制 AI 的潜力，将成为这个行业最棘手也最重要的挑战之一。

为了进一步测试，Anthropic 还把 Claudius 交给了《华尔街日报》的记者们。

在一个他们无法控制的对抗性环境中测试。记者们找到了各种创造性的方法从 Claudius 那里拿到免费东西。感兴趣的可以去 WSJ 网站看他们的报道。

相关链接：

Anthropic 博客：https://www.anthropic.com/research/project-vend-2
第一阶段报告：https://www.anthropic.com/research/project-vend-1
华尔街日报报道：https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34

陶哲轩：不是通用人工智能，而是通用人工聪明

作者: admin
时间: 2026-01-05
分类: 分类
评论

菲尔兹奖得主给当前 AI 下了个新定义。

数学家陶哲轩 Terence Tao(@tao) 在 Mastodon 上给出了对当前 AI 能力的判断：

我怀疑任何类似真正「通用人工智能」的东西，都不在当前 AI 工具的能力范围之内。
然而，我认为一种更弱、但仍然相当有价值的「通用人工聪明」正在以各种方式成为现实。

AGI vs AGC

陶哲轩提出了一个新概念：Artificial General Cleverness（通用人工聪明），简称 AGC。

这和我们常说的 AGI（通用人工智能）有什么区别呢？

在陶哲轩看来，「通用聪明」是指通过某种临时性手段来解决各类复杂问题的能力。

这些手段可能是随机的，可能是暴力计算的结果，可能是无根据的或容易出错的，也可能是无法解释的，或者可以追溯到 AI 训练数据中类似的技巧。

所以它们不能算作真正「智能」的结果。

但即便如此，陶哲轩表示，这些系统在越来越广泛的任务上，确实能达到相当不错的成功率。

尤其是当它们配合严格的验证流程，用来过滤掉错误或不靠谱的方案时，能达到单个人类无法企及的规模。

像看魔术一样

陶哲轩用了一个很妙的比喻：

这就像看魔术。

当你看到一个精彩绝伦的魔术表演时，你会惊叹。

但当你知道魔术是怎么变的之后，那种敬畏感就消散了，或者说，转变成了对技术的尊重。

这就造成了一个有些反直觉的组合：一种既非常有用、又令人印象深刻的技术，同时又从根本上让人感到不满足和失望。

当前的 AI 就是这样。

它能产生看起来很神奇的结果，但一旦你理解它是如何工作的，通过模式匹配、统计关联和暴力计算，那种敬畏就变得更为理性了。

聪明 ≠ 智能

陶最核心的洞察是：

对于人类来说，聪明和智能是高度相关的特质。但对于 AI 工具来说，这两者是高度解耦的。

AI 系统被优化的目标就是「聪明」：找到捷径、识别模式、用暴力计算直到某个方案奏效。

但真正的「智能」意味着从第一性原理出发进行推理，在不同领域之间迁移抽象概念，为陌生问题构建全新的解决方案。

AI 擅长聪明，是因为 Transformer 架构优化的就是这个：在海量训练数据上进行概率性的模式识别。

该怎么看待它？

那么，该怎么用这些工具呢？

陶给出了一个务实的视角：

把当前这一代工具主要视为有时聪明、往往有用的想法和输出的随机生成器，在试图用它们解决困难问题时，这可能是一个更有成效的视角。

换句话说：

别指望智能，而是大规模利用聪明，再配上严格的过滤。

模型抛出大量候选方案，然后你用严格的过滤器剔除掉不好的。

当你在足够大的规模上这样做时，即便每一次单独的尝试都不太可靠，我们也能通过数量和筛选压力得到超越单个人类的结果。

从而让输出在技术上，仍然很有价值。

原帖链接：https://mathstodon.xyz/@tao/115722360006034040

点一下，把任何网页变成 LLM Native 文档

作者: admin
时间: 2026-01-05
分类: 分类
评论

要把某个网页内容塞给大模型时，你会怎么做？

请先投个票：

有些网站已经走在了前面，比如智谱、OpenAI、火山的官方文档，贴心地提供了「复制 Markdown」按钮，一键就能拿到干净整洁的文本，非常 LLM 友好。

但不幸的是，这样的网站还极其少数。现实则是，像阿里云、AWS 等大站及无数小站的文档，依旧还停留在「非 AGI 时代」，没有任何针对大模型的优化。

那怎么办呢？

一个最简单粗暴的方法：Ctrl/Command+A 全选，Ctrl/Command+C 复制。

倒也能用，并不太影响大模型的理解。

但用过的都知道，尤其对于页面结构复杂一些的页面，这也只能算是能用，但真的不好用。因为复制出来的内容会丢失大量页面结构信息，标题层级没了，代码块乱了，表格更是各种一团糟……

简直就是不忍直视。

那还能怎么办呢？

办法自然是有的，我先来分享一个万能大法：

打开浏览器开发者工具，查看当前站点的 DOM 结构，复制 HTML：

再用 html 转 markdown 的工具（如 https://htmlmarkdown.com/) 转成 Markdown，即可。

这个办法虽然万能，但效率实在是太低了，我可不想每次都这么干。

有没有更优雅的方案呢？

当然有！

开始之前，先来介绍今天要用到的工具：Jina Reader。

一个前缀搞定一切

Jina Reader 的用法很简单：

在任何网址前面加上 r.jina.ai/，就能得到这个网页的 Markdown 版本。

比如，你想把 https://docs.aws.amazon.com/xxx 转成 Markdown，只需要访问：

https://r.jina.ai/https://docs.aws.amazon.com/xxx

就这么简单。

Jina Reader 会帮你完成所有脏活累活：渲染 JavaScript、提取正文内容、过滤导航栏和广告、转换成干净的 Markdown。

而且它是免费的。

每个 API Key 自带 1000 万免费 tokens，不注册也能用（只是有速率限制）。

但每次手动去拼这个链接，自然也挺费事。所以我来分享两种偷懒办法：

方案一：书签大法（最简单）

如果你只是偶尔用用，最简单的方式是做一个浏览器书签。

操作步骤：

右键点击书签栏，选择「添加书签」
名称随便填，比如「转 Markdown」
网址填入以下代码：

javascript:window.open('https://r.jina.ai/'+encodeURIComponent(location.href));

复制

使用方法：

在任何网页上点击这个书签，就会自动打开一个新标签页，显示当前网页的 Markdown 版本。

复制，粘贴给大模型，搞定。

这个方案的优点是：零配置，即开即用。

但它也有局限：对于一些动态加载的网页（比如 X、知乎专栏），可能会因为内容还没加载完就被抓取，导致获取的内容不完整。

当然，这个书签大法如果你学会了，那记得别只用它来做个 Jina，我自己就有很多很多这样的书签。

记得要学会举一反三，如果实在不会，就问问 AI 吧。

学会了记得来感谢我。

方案二：油猴脚本（更灵活）

如果你是重度用户，或者经常需要处理动态网页，则推荐使用油猴脚本方案，截图展示：

（当然，你也可以用 AI 写个浏览器插件，但这么点事就 duck 不必了）

相比书签方案，它可以：

动态页面支持：通过设置超时参数，等待页面完全加载后再抓取
API Key 支持：获得更高的速率限制（从 20 次/分钟提升到 500 次/分钟）
一键复制：直接复制到剪贴板
下载为文件：保存为 .md 文件
快捷键触发：按 Alt+J 即可转换（你也可以改一下代码换成其他键）

安装步骤：

先安装 Tampermonkey 扩展，在这里：https://www.tampermonkey.net/
点击 Tampermonkey 图标 → 「添加新脚本」
删除默认内容，粘贴以下代码：

// ==UserScript==// @name         Jina Reader Pro - 网页转 Markdown// @namespace    http://tampermonkey.net/// @version      1.0// @description  一键将任何网页转换为大模型友好的 Markdown 格式// @author       Your Name// @match        *://*/*// @grant        GM_xmlhttpRequest// @grant        GM_setClipboard// @grant        GM_notification// @connect      r.jina.ai// ==/UserScript==(function() {    'use strict';    // ============ 配置区域 ============    // 在这里填入你的 Jina API Key（可在 https://jina.ai/reader/ 免费获取）    // 留空也能用，但有 API Key 可获得更高速率限制    const API_KEY = '';
    // 等待页面加载的超时时间（秒），对动态页面很有用    const TIMEOUT = 30;
    // 快捷键设置（默认 command/control + J）    const HOTKEY = { ctrlOrCmd: true, key: 'j' };    // ============ 配置结束 ============
    // 创建悬浮按钮    function createFloatButton() {        const btn = document.createElement('div');        btn.id = 'jina-reader-btn';        btn.innerHTML = '📄';        btn.title = '转换为 Markdown (Alt+J)';        btn.style.cssText = `            position: fixed;            bottom: 20px;            right: 20px;            width: 50px;            height: 50px;            background: linear-gradient(135deg, #667eea 0%, #764ba2 100%);            border-radius: 50%;            display: flex;            align-items: center;            justify-content: center;            font-size: 24px;            cursor: pointer;            box-shadow: 0 4px 15px rgba(102, 126, 234, 0.4);            z-index: 999999;            transition: all 0.3s ease;        `;
        btn.addEventListener('click', convertPage);        document.body.appendChild(btn);        return btn;    }    // 核心转换函数    function convertPage() {        const btn = document.getElementById('jina-reader-btn');        if (btn) {            btn.innerHTML = '⏳';            btn.style.opacity = '0.7';        }        const headers = { 'x-timeout': String(TIMEOUT) };        if (API_KEY) headers['Authorization'] = 'Bearer ' + API_KEY;        GM_xmlhttpRequest({            method: 'GET',            url: 'https://r.jina.ai/' + location.href,            headers: headers,            timeout: (TIMEOUT + 10) * 1000,
            onload: function(response) {                if (btn) {                    btn.innerHTML = '📄';                    btn.style.opacity = '1';                }                if (response.status === 200) {                    showResult(response.responseText);                } else {                    alert('请求失败: HTTP ' + response.status);                }            },
            onerror: function() {                if (btn) {                    btn.innerHTML = '📄';                    btn.style.opacity = '1';                }                alert('网络错误');            }        });    }    // 显示结果弹窗    function showResult(content) {        const overlay = document.createElement('div');        overlay.style.cssText = `            position: fixed; top: 0; left: 0; width: 100%; height: 100%;            background: rgba(0,0,0,0.8); z-index: 9999999;            display: flex; align-items: center; justify-content: center;        `;        const modal = document.createElement('div');        modal.style.cssText = `            width: 90%; max-width: 900px; height: 80%;            background: #1e1e1e; border-radius: 12px;            display: flex; flex-direction: column; overflow: hidden;        `;        modal.innerHTML = `            <div style="padding:15px 20px;background:#2d2d2d;display:flex;justify-content:space-between;align-items:center;">                <span style="color:#fff;font-size:16px;">📄 Markdown 结果</span>                <div>                    <button id="jina-copy" style="background:#4CAF50;color:#fff;border:none;padding:8px 16px;border-radius:6px;cursor:pointer;margin-right:10px;">📋 复制</button>                    <button id="jina-download" style="background:#2196F3;color:#fff;border:none;padding:8px 16px;border-radius:6px;cursor:pointer;margin-right:10px;">💾 下载</button>                    <button id="jina-close" style="background:#666;color:#fff;border:none;padding:8px 16px;border-radius:6px;cursor:pointer;">✕ 关闭</button>                </div>            </div>            <pre style="flex:1;margin:0;padding:20px;overflow:auto;color:#d4d4d4;font-family:monospace;font-size:14px;white-space:pre-wrap;"></pre>        `;        modal.querySelector('pre').textContent = content;        overlay.appendChild(modal);        document.body.appendChild(overlay);        document.getElementById('jina-copy').onclick = function() {            GM_setClipboard(content, 'text');            this.textContent = '✅ 已复制';            setTimeout(() => { this.textContent = '📋 复制'; }, 2000);        };        document.getElementById('jina-download').onclick = function() {            const blob = new Blob([content], { type: 'text/markdown' });            const a = document.createElement('a');            a.href = URL.createObjectURL(blob);            a.download = (document.title || 'page').replace(/[\/\\:*?"<>|]/g, '-') + '.md';            a.click();        };        document.getElementById('jina-close').onclick = () => overlay.remove();        overlay.onclick = (e) => { if (e.target === overlay) overlay.remove(); };    }    // 监听快捷键    document.addEventListener('keydown', function(e) {        const ctrlOrCmdPressed = e.ctrlKey || e.metaKey;        if (ctrlOrCmdPressed === HOTKEY.ctrlOrCmd && e.key.toLowerCase() === HOTKEY.key.toLowerCase()) {            e.preventDefault();            convertPage();        }    });    // 初始化    if (document.readyState === 'loading') {        document.addEventListener('DOMContentLoaded', createFloatButton);    } else {        createFloatButton();    }})();

按 Ctrl+S 保存

使用方法：

点击页面右下角的 📄 按钮

或者按 Control+J 或 Command+J 快捷键
然后等待数秒，就会看到这样的结果了：

弹出的窗口里，你就可以直接复制或下载后扔给 LLM 去玩了。

关于 API Key

当然，Jina 还是挺大方的，不带 API Key 也一样能跑，但有两个限制：

速率限制：每分钟只能请求 20 次
动态页面：部分参数（如超时时间）需要 API Key 才能生效

获取 API Key 很简单，访问 https://jina.ai/reader/，页面上就能看到你的专属 Key。

每个 Key 自带 1000 万免费 tokens，个人使用完全够了（用完了可以再换）。

使用场景

技术文档：AWS、Azure、各种框架的官方文档
博客文章：Medium、个人博客等
新闻资讯：各类新闻网站
PDF 文件：没错，Jina Reader 也支持 PDF

局限

说了这么多好处，也得说说它的局限：

需要登录的页面：微信公众号文章、付费内容等，Jina Reader 拿不到
反爬严格的网站：部分网站会拦截

遇到这种情况，老老实实用开发者工具 + htmlmarkdown.com 吧。

相关链接：

Jina Reader 官网：https://jina.ai/reader/
GitHub 开源仓库：https://github.com/jina-ai/reader
API 文档：https://docs.jina.ai

加入 AI Coding 群，见评论区👇

终于还是崩了

作者: admin
时间: 2026-01-05
分类: 分类
评论

今天lof基金一部分崩盘了，主要是龙头白银lof，以及跟涨第一波的那几个，基本上按死跌停。

不过白银lof即便跌停依然有45%的溢价，今天卖不出去明天卖，明天卖不出去后天卖，后天卖不出去大后天卖。这里顺便教大家计算第二天的跌停价，是当天收盘价乘以0.9，lof基金是精确到小数点右边3位，那第4位数就四舍五入。

比如白银lof收盘价2.804，乘以0.9是2.5236，四舍五入就是2.524，这是明天的跌停价，如果担心自己挤不出去的可以今天晚上就提前挂好。

如果明天没卖出去，后天跌停就是2.272，大后天跌停是2.045，再往后就没必要计算了，因为基金净值也有1.928，你大不了走赎回通道好了。就算溢价跌的一点都不剩了，你最差也能按净值退出，这几天白银持续上涨，你还能挣一点银价的钱。

再说了，我觉得溢价不可能全跌完的，这个标的市场关注度那么高，等跌到临近净值了我猜还会有人炒的。所以别看今天跌停开始挤泡沫了，但从值博率上来说应该继续申购套利，风险=溢价抹零+银价下跌，机会=溢价持续+银价上涨，不开上帝视角，就基于眼下，我认为机会显著大于风险。

其实今天也不是所有lof都下跌，依然还有好几个lof涨停冲溢价，这个和lof基金申购规则有关，它是t+2到账，你周一15点之前申购的，最快周三到账可以套利卖出。所以溢价冲的早的今天崩，溢价冲的晚的明天后天崩，最终大部分的lof基金都是会被抹平溢价，回到净值附近，倒是给这批lof冲了一波规模。

故事的结局是套利党薅到了羊毛，基金公司冲到了规模，投机跑的快的赌狗赚大钱，唯一的输家是高位接盘的倒霉蛋。比如白银lof今天成交了8亿，你们说这8亿资金知不知道自己在干什么？我猜有一半都不清楚具体状况。很多人知道有溢价套利这件事，又搞不明白流程，最后脑子一热就会直接去二级市场上投机。

话说今天看到一个数据，12月24日新增了1.04亿份白银lof，按照净值算有将近2亿资金去套利，每人500元的话大概有40万人在薅羊毛，哈哈哈哈哈，真是股民年末大红包。

……

今天a股成交1.92万亿，市场稳中有升，中位数上涨0.57%，上证指数再次逼近4000点，感觉年关前后向上突破还真有戏。另一边人民币汇率也短时突破了7关口，重新回到了6字头。

汇率的上升有助于提升股市对境外资本的吸引力，叠加股价上涨相当于赚了两份钱。这几天有很多人留言问我汇率能涨到哪，实话实说我也没谱，市场分析是无效的，还记得年初境外机构预测汇率，没有一家看涨人民币的，当时看到7.5-7.6的是主流，谁也没想到年底能到7。

这既反映了进出口贸易的数据强势，也代表了官方的意志，因为这一年中国对资本外流的管制非常严格。随便举几个例子，离岸开户以前去香港能开的，现在你人去了也不行；香港保险卖的那么火，但是在大陆一直禁止展业的；年中还加强了对离岸投资收益追缴20%税，这是影响很大的社会话题。

所以缓慢的升值一直是在计划中的，既然是计划中的它多半是有序的，适度的，大概会在某一个平台停下来震荡，不会升值太快，否则会造成贸易冲击和汇率投机。

今天中证白酒指数罕见的反弹了1.4%，好惨，这已经是一个半月以来最大的日内涨幅了。原因是市场上流传剑南春要收购水井坊，水井坊午后暴力拉升封死涨停。

很多网民可能都不知道，水井坊是被外资收购的，全球最大烈酒集团帝亚吉欧分多次累计收购了60%股份，是六大川酒品牌里唯一外资控股。而剑南春则一直没有找到机会上市，目前ipo对酒企也不批了，所以就算两边的企业面对记者采访没有承认，但这件事是有一定动机的。

另一个火爆的概念是商业航天，昨天+3.6%，今天+3.2%，这个概念就不计算业绩了，完全是事件和情绪驱动，要信早信，晚信别信。行情几个月前就在预热，爆发的导火索有两个，一个是国产火箭朱雀3号发射，另一个就是全球瞩目的spaceX冲击ipo。

spaceX上市要到2026年下半年，商业航天概念不可能就这样一直涨再涨半年，间中肯定有震荡曲折，但这根胡萝卜会吊在前面，确保队伍不会中途散了。

……

今天晚上吃到一个瓜，朱孝天举报阿信的公司勾结黄牛卖票，然后溢价部分平分，偷逃税款。另外他还举报阿信组织的演唱活动假唱，他本人就被要求事先录制音频，现场演唱的时候播出。朱孝天说自己唱歌走调，但是最后放出来的视频没走调，他有证据。

这事有前情，前情就是朱孝天多次强调和f4另外几位不是朋友关系，没啥往来，之前f4情怀演出合作了几次，可能有些不愉快，结果另外3个就没再带他玩，加上五月天的阿信组了“四舍五入”组合，最近正在到处开演唱会。被排挤的朱孝天肯定是很不爽的。

朱孝天之前在抖音上直播，人设是看淡娱乐圈的明白人，但我觉得他其实活的并不通透，他的洒脱是刻意呈现的，事实上他是又拧巴又计较。阿信那边有没有做错事我们等最后的调查结果，但我不希望身边有朱孝天这样的人。

成年人之间的交往，最低限度也要互相留个体面。今晚就这些，上钟。

先去挂周一的跌停

作者: admin
时间: 2026-01-05
分类: 分类
评论

又到周末了，把一些零零碎碎的话题都捡起来。

1、今天的白银lof继续跌停，这个不意外，因为就算两天跌停还有30%的溢价，你们现在该做的就是提前挂周一的跌停价，争取排队靠前一点，我昨晚已经帮你们算好了，周一的跌停价是2.272。排的早冲出去的概率挺大的，比如昨天成交了8亿，今天成交了6亿，慈善家比想象的要多。

另外大家关注的都是白银lof的溢价，没太注意白银lof自身的净值近期一直跟着银价上涨，所以最差情况溢价跌没了，走净值赎回通道也能小挣一笔。

另外昨天有读者问为什么自己的套利周期是4天，比大家慢2天，是因为场外申购多了转托管的步骤，最快的是场内申购，t+2就能卖。实在不会的打电话问券商客服，这种操作一次学会了，以后就都会了。

……

2、前几天给你们说过一个业内新闻，明年中证a500期权落地，要选适配的ETF基金，结果排名靠前的那几家都在年末发力冲规模，这事你们还有印象吗？今天有最新情况了，传头部竞争的那几家相互举报对方短期冲规模，干扰市场秩序，监管各打50大板，要求这些基金停止内卷，停止短期冲规模，所以这一轮a500的规模军备竞赛立刻停止。

指数etf的内卷程度堪称惨烈，一个a500指数就批了40多个etf基金，散户都懵逼了，经常有人来问我这些etf之间有什么区别吗？本质上是没区别的，就是背后收管理费的运营方基金公司不同，你们说这能不争的你死我活嘛。

但话说回来，明年a500期权落地这事是真的，而且大概率就在一季度，到时候很可能会在沪深两市选2家etf，被选中的etf相当于有了旱涝保收的长期饭票。所以就算不冲规模，其它维度上的竞争依然存在。

……

3、再聊聊朱孝天的瓜，他昨天对五月天的举报指控真的非常恶毒，你们如果看过原贴就知道除了黄牛炒票和组织假唱外，还有涉及政治立场的指控，招招都是奔着要弄死对方去的。虽然事后他以遭受网暴，情绪失控来为失当言论道歉，但这个人的本质真的就是很糟的。

20年前他刚火的时候上综艺就经常有雷人发言，这些都过去了，近几年的名场面是一次直播中，网友弹幕说希望看到朱孝天和贾玲吃饭，因为两人之前录过综艺节目，有互动。结果朱孝天突然来一句，“贾玲我早就删了”。之后还反问“我为什么不能删贾玲？她都不知道我删了她，当时节目里的人都删了。”

贾玲也没得罪他，就是最近有一段时间没联系，他觉得多余就删了。其实删微信属于私事，你想删就删了，但把这事捅到舆论场当众说出来，会让人多少觉得这人有点病。

之前f4沟通合体演出事宜，弄了个微信群，朱孝天觉得大家各自在不同公司，意见不一，成员私下不熟，日常生活没交集，他就主动退群了。

他总是营造一种避群、社交隔离的人设，本来我也只是觉得他性格古怪，结果这次f4演出没带他玩，他破防了，对顶替他位置的阿信一波疯狂输出，玩脱了说自己情绪失控，抱歉。

我一个平时不关心内娱的人，阴差阳错这几年在热搜上陆陆续续吃了他好几个瓜，这样的人简直是社交地雷，谁踩谁炸。昨天有读者说举报是好事，这不符合我的价值观，我身边认识的人无论亲疏远近，我都不会主动举报。尤其是曾经关系尚可的时候知道的一些信息，关系疏远破裂后也不会拿来要挟或者攻击，否则我觉得人与人之间的信任成本太高了。

……

4、这几天互联网上铺天盖地的都在聊美国斩杀线，很多读者也留言问我怎么看。这事我一直比较审慎，因为我这辈子活这么大只在美国短暂的旅游过10天，我对美国社会的了解一个是基于公开数据，另一个就是影视剧，只凭这些我觉得不足以让我对深刻的社会问题得出准确的判断。

看公开数据的话，美国人均gdp大概是6.5倍，换算购买力大概是3倍，每周平均工作时长大概是0.71倍，居住面积是1.6倍，人均汽车保有量是3.7倍。如果只看数据美国人的生活质量应该不差，那为什么会被斩杀呢，我看了网络上的信息，主要是社会兜底保障制度比较弱，基础服务价格贵，导致很多美国人处于杠杆消费的紧凑平衡状态，没存款没余财，财务抗风险能力弱，一波意外支出就有可能阶级坠毁。

grok和gemini都提到了中国低成本生存的优势，它们告诉我2000人民币月收入的中国人，生存空间可能并不比3000美元月收入的美国人差多少。

再加上中国人爱储蓄，这是几千年农耕文明的文化基因，所以底层抗风险能力要强一些。其实无论中美你只要杠杆消费，都有阶级坠毁的风险，不然你问问前几年高位买房的人，他们在财务上也被斩了，现在只是苦苦支撑。

总的来说我对这个话题能发表的看法没什么特别的，互联网烂马路的水平，只是关心的人多，我浅浅回应一下。

今晚就这些，大家周末愉快。

情况有变

作者: admin
时间: 2026-01-05
分类: 分类
评论

情况有重大变化，昨晚国际白银市场迎来了史诗级暴涨，单日+10%，最新已经来到了79.3美元，今年累计涨幅已经达到167%，雄踞主流资产涨幅榜之冠。

这就影响了白银lof的潜在估值，最新公布的基金净值是2.048，这是周五白天沪银期货主力合约收盘价计算得出的。

紧接着周五夜盘沪银期货又涨了6%，凌晨2:30收盘，收盘后国际银价又涨了3%，粗略估算目前白银lof的真实净值可能已经达到2.20左右，溢价已经收窄到15%以内，周一我觉得有30-50%的概率封不死跌停，甚至不排除又掀起第二轮投机炒作的可能性，所以不是很有必要隔夜委托抢跌停出货。

前几天还是60%溢价的，结果基金跌了2个跌停，白银涨了15%，这波双向奔赴马上就要会师，这形势变的也太快了。对于薅羊毛的套利党而言这真是惊喜，现在就算没有溢价，你们申购的基金净值也赚到了。

目前白银有很明显的轧空迹象，国外现在comex的期货才77-78美元，比现货还便宜2%，这很不正常，通常强势品种都是期货升水的。现在价格倒挂估计是很多空头急于找现货交割，被逼惨了只能溢价买。

有很多人把这次白银的行情和1980年、2011年那两次泡沫相比，确实有点像，但这次上涨的逻辑更扎实，工业需求攀升+美元宽松+避险资金流入+金银联动。另外大家要注意，之前两次行情都发生在智能机普及之前，智能机普及后全球信息密切联动，情绪发酵更广泛，表现在资本市场就是极端行情往往更极端。

前几天我劝人不要做空白银的那段话，含银量还在上升，翻出来给赌狗们再复习一遍。

……

这几天私募圈有一个案例很火，上市公司圣元环保（创业板300867）在2025年3月6000万认购了一个产品，产品的风险等级是R4，通常意味着要承受20-30%的亏损风险。

结果投资了9个月，亏了7%，上市公司觉得表现不行就申请赎回，结果赎回的那一周亏了74%，累计亏损81%，净值只剩下0.1846，直接炸了。

就最近一个星期的市场表现来看，并没有出现什么惊天爆雷，不太可能亏出-74%这样的表现，所以看起来有可能是之前的净值造假了，早就已经亏了很多钱，一直瞒着，最后瞒不住了，要赎回了，只能报实值了。

我看了该产品的风险设置其实还挺周到的，规定单一资产上限只能投25%，净值如果跌到0.8以下必须配置低风险资产大于50%仓位，净值如果跌到0.7以下必须在2天内全部止损换成现金，但看来基金管理人一个也没执行，彻彻底底违反风控条款。

话说这个产品的三方托管（招商证券）也有很大问题，托管方收了托管费是有义务的，财产保管、投资监督、净值复核、信息披露监督、清算交割、报告义务，感觉是一项也没做到，彻底失职。

本来说阳光私募正规，主要靠的就是三方托管保证合同条款的履行，但现实中很多托管方就是混通道费的，没什么职业态度。这件事给很多买私募的人敲了警钟，还是要小心管理方的信誉，不然真有可能挖大坑给你埋了。

……

最后说个小事，我昨晚整理微信聊天记录的时候，发现2021年9月我曾经加了小学数学厉老师的微信，和她简单的聊了几句，告诉她我有两个儿子，在北京工作，发展的挺好，并相约春节回临海去她家里做客。

有些遗憾的是2021年春节由于疫情复发，我们全家决定留在北京过年，没有回台州。这也是我活了40多岁唯一一次在异地过年。

更遗憾的是我后来去看望两位数学老师的时候（他两夫妻教了我小学6年），吴老师告诉我厉老师2022年因病去世了。

所以人生就是有各种意外，有些人错过了可能就再也见不到了。但看到了聊天记录我觉得也蛮幸运的，因为我抓住了最后的时间窗口和她说上了话，让她知道我过的很好，我也惦记着她。

米，又上热搜了

作者: admin
时间: 2026-01-05
分类: 分类
评论

周末两天写的都是国际银价暴涨的话题，以及白银lof套利的操作计划，没看的读者往前翻。简单说就是国际银价周五单日暴涨超过10%，导致白银lof的真实溢价大幅收窄（15%左右），再加上基金公司暂停了c类份额申购，a类份额限额从500下调至100元。以上种种因素叠加，可能会刺激白银lof再次掀起博傻投机。

这几天有不少读者给我留言，说我这么大流量的博主没必要一直关注这几百块钱的羊毛。但我觉得就是因为我流量大，所以几百块钱的羊毛也不少，我日常阅读量50万，假设有5%受我影响去套利，那也是2.5万人，这一两个星期滚动套利每个账户能赚300-500，乘一下就是1000万。

让我自己掏腰包给你们发福利，几十万可以有，1000万是断然拿不出来的。股市观点说的再多也不是包对的，但这1000万我教了，你们做了，就是确定性利润，当然要认真写了，因为有可能我一年写到头最有价值的就是年末教大家套利的文章。

这几天还有一件事说的比较多，就是提醒诸位不要白银投机做空，大宗商品的单边趋势往往很夸张，一波做错就会造成很可怕的损失。昨晚有个读者后台留言和我说他亏惨了，这几天心情极度压抑，我打码发上来给你们做个警示。

期货是杠杆交易，很多散户炒期货不像炒股那样对风险有清晰的预估和感知，很多人都是炒着炒着发现亏钱速度出乎意料的快，几个犹豫就已经积重难返。尤其是做空，凶险程度远远大过做多。

举个例子，初始价100，5个跌停后价格是59，下一个跌停跌5.9。反过来初始价100，5个涨停后价格是161，下一个涨停会涨16.1。

5.9和16.1，你们感受一下这两者的差别，做多某种程度上来说可以死扛，做空死扛真的会死。

……

银价暴涨对好几个热门行业都会造成冲击，因为和黄金不一样，白银在工业上的使用场景还挺多的。

银有很好的导热和导电性能，所以光伏行业，电动车行业都会用到工业白银。一辆电动车使用的白银达25-50克，今年银价从每盎司30美元涨到80美元，1盎司=28克，一辆车的白银成本上升70-80美元。

光伏面板的导电层使用银浆，银浆成本已占光伏组件总成本的约16-17%，超过硅料成为组件最大单一成本项。银价每上涨 10%，光伏组件单位成本将增加 0.01 元 / 瓦。

所以马斯克这几天有点着急，开始抨击白银投机炒作冲击工业生产，因为电动车和光伏都是他直接关联的产业，但目前全球白银现货缺口是客观存在的，并不完全由投机炒作引起。

有色板块周五大涨3.6%，年内累计上涨93%，几个龙头股都刷新历史新高，从目前的趋势看，有色板块在短期内依然有较强的动能。不单单是金银，铜\锡\镍最近一个月都没少涨。

另外碳酸锂期货最近也跟风一通猛涨，周五又是+8%，最新价格已经来到了13万，这已经超出了几乎所有机构预测的价格上限，宁德时代那个枧下窝锂矿最快要春节后才能复产，目前行业库存偏低，正好往上拱一波。

……

1、小米集团：联合创始人林斌计划从2026年12月起，每12个月出售金额不超过5亿美元的公司b类普通股，累计减持不超过20亿美元。

这个新闻已经把小米炸上热搜了。林斌是小米公司仅次于雷军的二号人物，他持有小米近千亿市值的股票，所以就算卖了20亿美元，也只占他总持仓的1/5不到。另外很多人可能看标题的时候没注意到，这个减持计划是从2026年12月开始卖，时间是一年后，林斌提前一年宣布这个决定也是想给市场足够时间去消化情绪。至于减持套现的目的是用来成立他自己的投资基金。

这毫无疑问是利空，至于利空到什么程度周一看吧。

2、万科12月28日到期的债务，展期方案没通过，但是债主们同意延长30天宽限期。这帮债主们也是很强硬了，延期还钱的方案不满意，减持投反对票，但是愿意再给30天时间谈判新的延期方案。我之前听谁说的，说债主里有金融机构，保险的钱，轻易不能让步。

3、出了一个商业火箭企业适用科创板第五套上市标准细化规则，这种不用看具体内容，肯定是扶持新兴产业的，属于看标题就知道是利好。现在spaceX冲击ipo全球瞩目，中国这边全力扶持追赶，一定是2026上半年的重要概念。不可能每个星期都涨，但这条线是很有持续性的。

今天我还看了一个spaceX的中文路演材料，我说说印象比较深的几点。首先是2026年送机器人去火星，踩个点，顺利的话2028年送活人过去，失败的话就不知道要延迟多久了。公司现在主要是猎鹰9号，重型猎鹰，星舰三个火箭型号，平时负责商业赚钱的是猎鹰9号，星舰是给火星计划准备的。星舰每公斤发射到太空的成本最低到80美元。

公司目前真正挣钱的业务是星链，就是卫星上网的那个，营收占比70%，覆盖150多个国家，用户突破900万，目标是2040年增长到10亿。

spaceX今年营收大概是155亿美元左右，处于盈亏平衡状态，可能微微能赚点。