LaiDub

播客听见世界的声音，看见思想的刻度

浏览频道

全部 AI 与科技商业科学文化政治哲学健康

56:10

EN/ZH

点开看双语

Unsupervised Learning: With Jacob Effron大约 1 个月前

专访戴密斯·哈萨比斯的传记作者

Sebastian Mallaby 用三年时间、在一家英国酒吧里与戴密斯·哈萨比斯进行了逾30小时的访谈，写成《The Infinity Machine》。这场对话从那份深度采访中抽出了最少被报道的几条线：2015年那次意外催生了 OpenAI 的安全峰会、戴密斯从未真正动用过的那个十亿美元分拆筹码，以及 Mallaby 意想不到的——哈萨比斯对上帝与科学的近乎精神性的信念。贯穿全局的是一个悖论：戴密斯从第一天起就清楚这场竞赛有多危险，但作为一家实验室的掌舵人，哪怕是诺贝尔奖得主，他也无力阻止它。 ## [00:00] 开场 Jacob Effron 介绍 Sebastian Mallaby：他是世界上与戴密斯·哈萨比斯相处时间最长的记者之一，三年间在伦敦的酒吧里面对面聊了30多个小时。Mallaby 的书《The Infinity Machine》覆盖了 DeepMind 从2010年创立到荣获诺贝尔奖的完整历程。节目预告片段里——戴密斯拍桌子谈上帝与科学、里德·霍夫曼的十亿美元承诺、与埃隆的宿怨——都来自后续对话。 > *"戴密斯有诺贝尔奖。萨姆没读完本科。所以戴密斯不太把萨姆放在眼里。"* ## [02:04] AI竞赛不可避免吗？ Mallaby 的判断：不可避免。任何如此强大的技术，都会吸引多个国家的多个实验室前赴后继，中国的技术栈尽管面临芯片短缺，已然有竞争力。令人唏嘘的是，戴密斯在2010年并不这么想。他真心相信一家实验室可以把 AGI 安全地推过终点线——一个由 DeepMind 独挑大梁的单一主体场景。到了2020年代中期，他彻底转向：安全是集体行动问题，只有政府才能解决，因为单一实验室的克制无法约束其他人。 > *"我认为这是必然的。当你拥有这种极度强大的技术，自然会有多个国家的多个实验室拼命想把它造出来。"* ## [04:03] 2015年安全峰会的反效果 2015年夏天，SpaceX 总部：戴密斯召集了一场小型峰会，试图把埃隆·马斯克拉进安全监督框架——计划让他主持一个安全委员会，关键是不要再开竞争对手。然而年底，OpenAI 诞生了。Mallaby 把这一刻定性为戴密斯内心那条信念断裂的瞬间：实验室领导者之间的自愿协作在结构上行不通。他现在认为唯一可行的机制是由政府强制执行统一规则——强制上线前测试、安全减速——美中合作是终极目标，尽管这个前景看起来遥远。Jacob 追问实验室领导者是否真相信政府干预可行；Mallaby 拿 FDA 类比：迟钝、不完美，但它确实在裁定药物是否足够安全可以上市。 > *"你没法信任对方。要获得信任，唯一的办法是让政府来执法，说'这是对所有人的规则，要创造公平竞争环境，大家都要遵守某种安全减速要求。'"* ## [11:27] 为什么谷歌不做集中押注 Jacob 指出这个时代两个标志性的消费级 AI 时刻——ChatGPT 和 Claude Code——都没有来自 Google DeepMind，尽管它在评测榜上一直领先。Mallaby 把这直接追溯到戴密斯的知识底色：神经科学博士、对智能的宏观理论、"每当有两条路，就两条都走，再找第三条"的实验室文化。结果是一个高度分散的研究组合，擅长产出诺贝尔奖和最先进的模型，但在结构上难以做出 Anthropic 押注编程那样的单向产品赌注。Gemini 被捆绑进谷歌搜索，使用量比看起来高——但 Mallaby 承认，在产品热度上的差距是真实存在的。 > *"Anthropic 能做到编程这一点，是因为它愿意做更集中的押注。它从没有同时冲进整个领域、什么都做。"* ## [15:51] 马里奥计划：秘密分拆方案书中最轰动的独家：DeepMind 曾有一个秘密计划——代号"马里奥计划"——从谷歌分拆出去，背后有里德·霍夫曼10亿美元的资金承诺。Mallaby 不得不和谷歌的总法律顾问打一场硬仗才争取到发表。动机不是创业独立，而是安全筹码：戴密斯想要对 DeepMind 模型建立正式的安全监督机制，山景城方面没有提供，可信的分拆威胁是他的谈判筹码。他从未明确告知谷歌霍夫曼的承诺，但知道这张牌在手，就一直在施压。最终他选择留下——分拆的法律风险、对算力资源的依赖，以及相比打企业结构官司更想专注做科学的心态。一年后，他发布了 AlphaFold，并赢得诺贝尔奖。 > *"戴密斯非常非常想对 Google DeepMind 的模型建立安全监督。谷歌总部在山景城那边没有提供这个。所以他必须有一个可信的分拆威胁。他找了里德·霍夫曼，霍夫曼承诺出10亿美元支持分拆——戴密斯用这个向谷歌施压。"* ## [19:43] 戴密斯真正的遗憾关于 AlphaFold 和 AI for science：毫无遗憾——Mallaby 认为这不仅在科学上是正确选择，在政治上也是必要的，因为 AI 需要看得见的社会效益，才能在未来工作岗位遭受冲击引发的强烈反弹中存活下来。真正的遗憾在于速度。戴密斯错过了 Transformer 的时机，而 Ilya Sutskever 没有：论文一发布，Ilya 冲出去找 Alec Radford，要基于 Transformer 架构做语言模型。戴密斯宽泛的组合策略让 DeepMind 研究了 Transformer，却没有把实验室的全部赌注押上去。错过那个窗口——以及随后的 ChatGPT 时刻——是真实的失败，不只是风格上的差异。 > *"Ilya 从椅子上跳起来，冲出去找 Alec Radford，说'嘿，我们要用这个 Transformer 架构来做语言模型。'而在赢得 AlphaGo 的那一天，戴密斯已经心思转到了生物——有人用麦克风捕捉到了他说的话。"* ## [23:46] 风险创业公司 vs. 科技巨头本集最宏观的结构性论点：在 AI 领域，风险投资支持的集中押注能赢过超大规模科技公司的广撒网吗？Mallaby 两者都写过（他的上一本书聚焦风险投资），认为双方真的势均力敌。超大规模科技公司有无限资本，可以支撑多年军备竞赛；问题是无限资源滋生组合思维，注意力由此分散。专注单一押注的创业公司在那个具体赌注上可以走得更快。Mallaby 的现场判断：OpenAI 被收购或倒闭的概率大约是50/50，不是因为技术不行，而是商业模式撑不住在谷歌的资金攻势下无限失血。他还提出 Anthropic 现在就应该 IPO，趁品牌处于最强势的时机。Jacob 拿机器人类比：当前有十五种不同路线同时获得资金，谁押中了那个像 Transformer 一样的突破，谁就能称霸。 > *"我在一月的《纽约时报》写道，我认为 OpenAI 有50%的概率在明年夏天前倒闭。现在还是50%吗？是的。技术没问题，问题在商业模式——而你面对的是谷歌，它有用不完的钱把你耗死。"* ## [34:08] David Silver 与强化学习信徒 David Silver——AlphaGo 首席研究员、与 Rich Sutton 合著"奖励即足够"论文的人——在书出版后离开 DeepMind 去创业了。Mallaby 认为这次离开在结构上是必然的：Silver 是强化学习的纯粹主义者，坚信从人类数据中学习天然低人一等，因为那些数据里编码了人类的错误。他的论点是：自博弈和环境生成的经验，才是通往真正超人表现的唯一路径。戴密斯告诉 Mallaby，这个观点在 AGI 实现之后或许是对的——但整个语言模型革命已经证明，用人类数据来引导才是抵达 AGI 的第一步。Silver 的强化学习纯粹主义超出了同事们当下所能跟随的范畴。 > *"David 在那个愿景上极度坚定——从数据中学习是低人一等的，因为数据里包含错误。机器需要从自身经验中学习，不能依赖通过文本传递下来的人类结晶知识。"* ## [38:21] 戴密斯、埃隆与"邪恶天才"的宿怨起源：2012年，Founders Fund LP 年会，埃隆·马斯克说 SpaceX 最重要，因为就算 AI 毁了地球，人类还可以搬到火星。戴密斯回答：他的 AI 最终将征服太空飞行，然后跟着你们去火星。埃隆沉默片刻，随即开出一张500万美元的支票投入 DeepMind 的 B 轮。两年后，听闻谷歌正在收购 DeepMind，埃隆和 Luke Nosek 在洛杉矶一场派对的储藏室里，深夜通过 Skype 跟戴密斯连线，恳求他不要把公司卖给拉里·佩奇。戴密斯说不，挂掉电话，埃隆便开始叫他"邪恶天才"——这是戴密斯曾经设计过的一款电子游戏的名字。Mallaby 描述戴密斯对萨姆·奥特曼的看法带着一种资历上的不对等：诺贝尔奖得主对上一个没读完本科的人。这些创始人之间的关系，与其说是职业竞争，不如说是十五年来一系列具体的个人怨怼和竞争挑衅的积累。 > *"戴密斯说，'没错，但如果你以为在火星上能安全，记住我的 AI 将能够征服太空飞行，它会跟着你去火星。所以那时你也不会安全了。'沉默了一下。然后埃隆说，'嗯。'然后是：'我想投你的 B 轮。'"* ## [42:39] 伟人理论 vs. 历史必然性 Jacob 引用《经济学人》对这本书的评价——把它定性为伟人理论的一次检验。Mallaby 拿自己写格林斯潘传记作类比：格林斯潘清楚泡沫有多危险（这字面上是他博士论文的研究对象），却没能阻止2008年的金融危机。他一度想给戴密斯这本书起名《那个知道的人》——因为同样的道理：戴密斯从一开始就知道这项技术有多危险，但一家实验室的克制无法约束其他人。个人领袖在边际上确实重要：Dario Amodei 通过 Anthropic 宣言改变了安全叙事；萨姆·奥特曼在 ChatGPT 还在频繁出错时就把它推出去，塑造了这场竞赛的走向；戴密斯游说里希·苏纳克主办了英国 AI 安全峰会。但竞赛本身？在结构上是过度决定的。 > *"我觉得几乎可以把同一个书名用在戴密斯身上——'那个知道的人'——因为戴密斯从一开始就知道这东西有多危险。但作为一家实验室的负责人，哪怕是非常强大有钱的实验室，哪怕他有诺贝尔奖得主的地位——他能做什么？"* ## [45:00] 戴密斯不想让人发表的内容 Mallaby 最没想到的细节：戴密斯受一种近乎宗教感的科学信念驱动。在那些两小时的酒吧长谈里，他会拍桌子谈物质的奥秘——为什么原子聚合成实实在在的桌子，为什么硅和铜能思考——并在没人问的情况下脱口而出："也许如果我们以正确的方式探索科学，我们将会越来越接近某种可以称之为上帝的东西。" Mallaby 把这解读为戴密斯不断推进一项他明知危险的技术的心理引擎：这是一场近乎精神性的追求，而不只是商业野心。关于戴密斯拦截的内容：他的家人（他从一开始就设了这条线），以及他与桑达尔·皮查伊之间的内部争执——他不想动摇自己仍然依赖的谷歌关系。 > *"他会开始拍桌子说，'也许如果我们以正确的方式探索科学，更深入地理解自然，我们将越来越接近某种可以称之为上帝的东西。'我完全没想到他会有这样的感受。"* ## 实体 - **戴密斯·哈萨比斯**（人物）：DeepMind / Google DeepMind 联合创始人及 CEO；因 AlphaFold 获得2024年诺贝尔化学奖；《The Infinity Machine》的传主。 - **Sebastian Mallaby**（人物）：《纽约客》长期撰稿人；《The Infinity Machine》（戴密斯·哈萨比斯传记）及一本风险投资著作的作者；三年间与哈萨比斯进行了逾30小时的访谈。 - **Jacob Effron**（人物）：*Unsupervised Learning* 主持人；Redpoint Ventures 董事总经理。 - **里德·霍夫曼**（人物）：LinkedIn 联合创始人；在"马里奥计划"中承诺出资10亿美元支持 DeepMind 从谷歌分拆。 - **David Silver**（人物）：AlphaGo 和 AlphaZero 首席研究员；与 Rich Sutton 合著"奖励即足够"强化学习论文；书出版后离开 DeepMind 去创业。 - **埃隆·马斯克**（人物）：主办2015年 SpaceX AI 安全峰会；DeepMind 早期投资人；在 DeepMind 出售给谷歌后给哈萨比斯起了"邪恶天才"的外号。 - **萨姆·奥特曼**（人物）：OpenAI CEO；在 ChatGPT 仍有大量幻觉问题时于2022年底将其推出，Mallaby 认为此举不可逆转地塑造了 AI 竞赛的走向。 - **Dario Amodei**（人物）：Anthropic CEO；通过宣言论文的发布和其公开的五角大楼对峙，被认为改变了 AI 安全叙事。 - **DeepMind**（机构）：谷歌子公司；由哈萨比斯、Shane Legg 和 Mustafa Suleyman 于2010年创立；产出了 AlphaGo、AlphaFold 和 Gemini。 - **马里奥计划**（概念）：DeepMind 秘密拟定的从谷歌分拆方案，背后有里德·霍夫曼10亿美元的承诺；作为安全监督的谈判筹码，从未真正执行。 - **AlphaFold**（软件）：DeepMind 开发的蛋白质结构预测模型；让哈萨比斯赢得2024年诺贝尔化学奖；于他拒绝分拆方案后一年、即2020年发布。 - **强化学习**（概念）：AlphaGo 和 AlphaZero 所依赖的机器学习范式；David Silver 对强化学习（从环境经验而非人类数据学习）的绝对主义立场，在 DeepMind 内部引发张力，并最终导致他的离开。 - **《The Infinity Machine》**（概念）：Sebastian Mallaby 所著戴密斯·哈萨比斯传记；曾考虑命名为《那个知道的人》；在谷歌的反对下，完整收录了马里奥计划的独家内容。

#demis-hassabis#deepmind#ai-safety

走进 xAI：三个月搭出 Grok Imagine、视频生成 vs 世界模型、视频 Agent——Ethan He

走进 xAI：三个月搭出 Grok Imagine、视频生成 vs 世界模型、视频 Agent——Ethan He

Ethan He 在 NVIDIA 主导构建了 Cosmos 世界模型，2025 年中随即加入 xAI，在没有基础设施、没有数据、没有模型的起点上，三个月内从零搭出 Grok Imagine，并发布了首个大规模音视频联合生成模型。他与 swyx 和 Vibhu Viswanathan 逐层拆解完整技术栈：合成字幕管道、VAE 设计取舍、步骤蒸馏、音视频对齐，以及存储数 PB 视频训练数据背后隐藏的经济账。整场对话贯穿一个核心判断：扩散模型技术已基本成熟，视频质量的主要增量已经来自语言模型，而非视频模型本身——这一判断对视频 Agent、生成式 UI 和具身世界模型的走向都有直接影响。 ## [00:00] 开场钩子这段对话截取自访谈后段，Ethan 在那里提出"视觉智能主要来自语言"这一颇为大胆的论断——他认为视频模型的质量提升越来越多地源于更强的 LLM 充当提示词改写器和编排器，而非扩散或流匹配架构本身的进步。 > *"每次你看到这些模型有所改进，我的判断是：大部分增益来自语言模型，而不是视频模型本身。"* ## [01:16] 介绍 swyx 和 Vibhu Viswanathan 在 Latent Space 录音室欢迎 Ethan，提到他曾多次出现在播客论文俱乐部——先是介绍 Cosmos 世界模型论文，后来又聊了混合专家（MoE）的工作。对话开头顺带提及当天同步发布的 Poolside 论文——一个完全开源、以 40 万亿 token 训练的 Gemma 量级模型——随后话题转向 Ethan 自己的职业轨迹。 ## [02:41] 从 NVIDIA Cosmos 到 xAI Ethan 在 NVIDIA 主导构建了 Cosmos，这是一个面向机器人领域的大型视频基础模型，旨在提供可仿真的物理世界环境，并于 2024 年底发布。当他意识到视频模型遵循与语言模型相同的扩展定律时，便开始寻找更多算力。xAI 给出了答案。他于 2025 年中加入，彼时 xAI 刚决定自研图像与视频技术栈，既无基础设施，也无数据管道和模型。他全程参与了预训练、后训练（参考视频转生成、视频续写），并在最后阶段带领一支小团队攻关实时长时序视频生成。 > *"我加入时，xAI 正准备搭建视频模型和多模态模型。没有基础设施，没有数据，没有模型。就几个工程师——我们用三个月搭出来，发布了第一个模型 Grok Imagine 0.9。"* ## [04:40] 从零到一搭出 Grok Imagine 三个月的时间线让 Ethan 自己也感到意外。他将其归结为三个因素：人才密度（工程师能力强，目标高度一致，每天通常只开一次同步会）、xAI 现有的数据与推理基础设施，以及他在 NVIDIA 经历过同一套建设流程的先验经验。真正的瓶颈是迭代速度：每天能跑几轮训练。基础设施强、算力充足，问题就暴露得快，每次失败的运行损耗也小，数周之内就能把那些不可避免的数据和管道错误全部筛查一遍。 > *"最重要的是人才。每个人都很强、很聪明，大家朝着同一个目标紧紧靠在一起。这大幅加速了进展——人与人之间的沟通带宽降到最低。"* Ethan 描述了一种规律：微小的数据或管道缺陷会造成超出预期的质量下滑，而快速迭代才能让这些问题浮出水面。在某个规模下几乎看不见的 bug，到了下一个规模就会酿成灾难。决定团队交付速度的，往往不是设计架构最精妙的人，而是那些能最快发现并修复问题的人。 ## [11:23] 图像与视频模型的训练方式视频模型的训练需要合成文本-视频对，因为互联网上视频的标题和简介几乎从不准确描述视觉内容。第一步是人工标注：在 NVIDIA，标注员被要求尽可能详尽地描述视频片段中的每一个物体、人物、交互和对话。这些标注训练出一个早期 VLM，再由它大规模生成字幕。整条管道——视频→VLM→合成字幕→（视频，字幕）训练对——是 Cosmos 和 Grok Imagine 的共同基础。图像模型必须先于视频模型构建：训练更快、存储需求更低，且学到的表示可以直接迁移到视频。Ethan 把图像模型比作视频模型赖以存在的地基。在 VAE 隐空间上运行的扩散变换器架构已成行业标准，但数据质量和字幕细粒度依然是模型质量的首要杠杆。 > *"构建视频模型，其实要先构建图像模型。所需的数据 100% 是语言与图像、或语言与视频的合成配对——因为互联网上的视频天然不附带文本。"* ## [20:09] 视频压缩、VAE 与实时性权衡原始 MP4 压缩产生的 token 隐空间对变换器来说难以理解，因此业界转向学习型 VAE，以构建模型可训练的更平滑、更连续的隐空间。核心设计抉择在于时间维度的压缩力度。时间压缩效率高——相邻帧大量冗余——但代价是牺牲实时能力。Wan 2.1 采用 8×8 空间压缩和 4× 时间压缩；生成单个 token 需要重建四帧，使 200ms 以内的延迟在架构不变的情况下几乎不可能实现。 Ethan 将此定性为根本性权衡：高压缩率让训练成本低、预渲染视频的推理效率高，但彻底封死了所有需要响应实时用户输入的场景。世界模型恰恰需要做出相反的选择。 ## [23:26] 生成式 UI、Flipbook 与神经 OS Ethan 认为，如果推理成本降为零，视频生成的逻辑终点是对传统 UI 的全面替代：不再从服务器加载网页，而是模型根据用户意图实时生成。曾经刷屏的 Flipbook 演示就是这一思路的字面呈现——"浏览器"里的每个元素都由图像模型生成，点击链接触发的是新页面的生成，而非页面的拉取。更深层的主张是：这并非噱头，而是世界模型应用于人机交互的最终形态。传统应用是输入到输出的固定映射函数；生成式 UI 则是一个可以产出任意界面的模型，无需开发者预先构建。Ethan 将其称为"神经 OS"——用户意图与渲染像素之间的鸿沟彻底消失。 > *"想象互联网不存在，你输入 google.com——模型应该展示什么？模型可以凭空想象。这些网页完全不存在，所以我可以探索任何东西。"* 短期瓶颈在于推理成本。当前视频模型在没有大量蒸馏的情况下无法达到交互帧率。但 Ethan 将其视为一个有明确解决路径的工程问题，而非根本性障碍。 ## [33:26] 训练大型视频模型的成本训练大型视频模型的总成本与训练中等规模语言模型大体相当，但成本结构截然不同。算力部分相近，但存储和数据搬运的占比远超 LLM 从业者的预期。10 亿条视频、每条 5MB，就需要 5PB 的原始存储。VAE 特征还要额外存储一遍，规模大致相当——总量达数十 PB。仅 AWS S3 的存储费用，5PB 标准存储每月约 10 万美元，数据出口流量费用甚至高于存储本身，而每次训练都要完整拉取一遍全量数据集。 > *"光存储视频的成本就相当高。5PB 放在 S3 标准存储，每月约 10 万美元。出口流量——把这些视频下载下来——我估计比存储还贵，每次训练大概要拉取一遍。"* 这意味着视频模型研发在 GPU 算时之外，同样受制于数据基础设施。没有高效数据管道的团队，每做一次实验都要付出额外的倍数代价。 ## [38:20] 蒸馏、GAN 与视频快速推理训练阶段的成本基本固定；推理阶段则有更大的优化空间。步骤蒸馏——训练一个小模型，用远少于大型教师模型的去噪步骤复现其输出——可将推理成本压低 10-25 倍。训练至收敛的流匹配模型通常需要约 100 步；生产环境一般跑 4-8 步。在极端情况下，简单的图生图任务可以做到单步完成。 Ethan 给出的直觉：教师模型必须学习整个互联网视频的完整分布，复杂度极高；而蒸馏后的学生模型只需匹配教师，目标固定且简单得多。一致性模型和 LCM 路线遵循相同逻辑。在 Cosmos 中，线上服务根据质量要求分别使用 4 步和 8 步两种变体。 GAN 在判别器角色上依然有价值：GAN 判别器能在蒸馏过程中施加纯分数匹配损失无法捕捉的真实感约束；Ethan 指出，尽管理论出发点不同，一致性模型与 GAN 在实际部署上正在走向趋同。 ## [42:37] 音视频联合生成与 Grok Imagine 0.9 Grok Imagine 0.9 是首个大规模部署的音视频联合生成模型。核心难点在于模态对齐：文本-视频配对相对充足；文本-音频配对稀少；语义层面对齐的音视频配对在规模上几乎不存在。语音 token 具有准离散性，可以用类语言建模的方式处理，但音乐是连续的，需要完全不同的表示方式。训练联合模型需要从头构建合成音频字幕管道，并在 VLM 力不从心的地方依靠人工标注——尤其是音乐部分，VLM 的表现普遍不理想。在不损害视频质量和音频真实感的前提下，将文本、视频、音频三个模态统一对齐，是 Ethan 眼中这个项目中最难的部分。 > *"音频有两个分量：离散分量——语音——和连续分量——音乐。音乐完全不同，无法用离散 token 建模。这已经够难了，更不用说还要把文本、视频、音频三者同时对齐。"* ## [49:50] 什么才算世界模型？ Ethan 的定义包含三个要素：实时、交互、长时序视频生成。他将这三点视为相互独立的要求，而大多数现有模型在这三点上均未做到。实时，意味着以显示帧率生成——日常使用需要 60fps，游戏场景需要 300fps，数字人需要 200ms 以内的响应延迟。当前视频模型做不到；单是 VAE 的时间压缩就会引入延迟，使得在架构不变的情况下 200ms 内响应几乎不可能。交互，意味着模型能接受用户可以提供的任何输入模态——键盘、鼠标、语音——并给出连贯的响应。长时序，意味着在数分钟的时间跨度内保持一致的物理规律、人物身份和因果逻辑，而非仅仅数秒。 > *"世界模型是实时、交互、长时序的视频。当前视频模型这三点都做不到。这就是它们还不是世界模型的原因。"* ## [57:07] 参考视频、长上下文与视频记忆与语言模型上下文扩展的类比十分直接：视频模型目前还处于 2000-8000 token 的时代，需要扩展到百万 token 量级的上下文，才能生成连贯的长视频。Ethan 描述了他在 xAI 构建的参考视频功能（类似 Cameo）——其机制是把精选历史帧注入模型上下文，而非把完整视频全部带入。 FramePack 的启发式方法——最近一秒以完整分辨率存储，更早的帧逐渐压缩——指向了正确的方向：模型从历史中筛选相关上下文，而不是暴力保留完整序列。Ethan 预计，这种上下文管理终将成为模型本身的能力，而非停留在外部工具层面的启发式——就像 KV 缓存管理正在被吸收进模型内部一样。 ## [61:27] xAI 文化、研究氛围与第一性原理 swyx 指出，xAI 在研究传播上严重低估了工作的实际价值——伴随 Grok Imagine 发布的博客文章停留在高层能力介绍，完全没有 Ethan 刚刚花了一个小时展开的技术深度。Ethan 外交式地表示认同，指出不同实验室有不同的表达风格。他描述的 xAI 工作文化极度精简：几乎不开会，没有繁文缛节，技术决策可以直接触达最高层，强大的基础设施团队保障了极快的迭代速度。代价是公司优先级转变迅速，这也是他最终转向独立研究的部分原因之一。从模型架构到产品，团队始终坚持从问题的物理本质出发，而非从竞争对手已经发布的东西出发。 > *"你刚刚描述的一切都是顶尖水平，没有其他人做到过。然后你就发了那篇带曲奇图片的博客。我当时心想：这还不够。"* ## [71:01] AI 安全、水印与提示词改写 Grok Imagine 在所有有法规要求的司法管辖区部署了水印，并构建了与 xAI 社交平台基础设施集成的下架管道。在水印技术上，Ethan 对 SynthID 的长期鲁棒性持怀疑态度：该技术已公开记录，Reddit 用户已经逆向工程出 Google 使用的精确频率模式，可以从任何生成图像中将其剥离。他预计水印检测将演变成一场军备竞赛。关于提示词改写：视频扩散模型会字面理解指令。用户输入"一只猫"，模型就会生成一只静止在白色背景上、没有任何动作的猫——因为训练数据的配对是对物理场景极为详尽的描述。生产系统会在前面叠加一个大语言模型作为提示词扩写器，把用户的简短指令转换成视频模型赖以训练的详细物理描述。这也是 Ethan 认为语言模型在视频质量中越来越核心的原因之一。 ## [74:26] 视频 Agent 与 AI 辅助创作 Ethan 在开场就提出的核心论断：视觉智能现在主要来自语言。扩散模型架构已基本收敛；增益来自更大、更强的 LLM——它们改写提示词、规划视频序列、调用编辑工具、拼接片段。在 Cosmos 中，提示词改写器甚至比视频模型本身还要大。视频 Agent 将这一逻辑进一步延伸：不再一次性生成完整视频，而是由 Agent 规划制作流程，将视频生成模型作为工具，与确定性编辑操作（文字叠加、调色、剪切）配合调用，迭代至符合规格为止。Ethan 预测，到 2025 年底，视频 Agent 的产出将达到可发布的制作质量——无需人工剪辑师介入就能生成可用的视频。 > *"视觉智能其实主要来自语言。每次你看到这些模型有所改进，我的判断是：大部分增益来自语言模型，而不是视频模型本身。"* ## [88:48] 语言模型如何解锁更好的视频 LLM 为视频模型写提示词比人类写得更好，因为 AI 模型理解 AI 模型的训练分布。语言模型知道扩散模型需要明确的物理描述，而非诗意的简写，并能自动生成正确的提示词格式。除了写提示词，Agent 还可以对确定性视频编辑工具使用精确操作（精确的文字叠加、帧级剪切），处理概率性扩散模型难以精确应对的任务，让随机模型专注于生成，把精度交给工具。 Ethan 的时间线：到 2025 年底，视频 Agent 产出将达到制作级质量，这一拐点在已经上线的产品中已经可见。 ## [92:31] 机器人、物理 AI 与具身世界模型 Ethan 对机器人领域的预测颠覆了常见叙事：物理 AI 的突破，可能不是靠把机器人部署到真实世界，而是靠视频世界模型对物理环境的仿真能力强大到足以等效提供具身经验。一旦模型能够实时控制计算机界面并具备完整的因果理解，扩展到机器人控制就只是增加一个工具的事。从"能操控屏幕的视频模型"到机器人控制器的路径，可能比现有机器人学习系统到达同一目标的路径更短。 ## [93:54] Ethan 为何离开 xAI 研究抱负与公司优先级出现分歧。xAI 的重心转移，使某些研究方向——尤其是语言模型侧——在内部变得难以推进。Ethan 还指出，驱动他离职的洞见，与他那个"大胆论断"如出一辙：如果语言模型现在是视频质量的首要驱动因素，那么最有杠杆效应的工作是在语言模型上，而非视频模型上。他把离开定性为追随证据指向、而非心存不满。 ## [95:32] 上下文自管理与 LLM 的未来 Ethan 正在研究的问题：能够感知自身上下文状态并自主管理的语言模型，而不是依赖外部工具层的启发式——比如在填充度达到 80% 时触发自动压缩。他指出，视频模型在长时序生成上面临的上下文管理难题，在两种模态中如出一辙。他以 Claude Code 在用户消息中附加当前时间戳的做法为例，认为这是让模型具备上下文感知的早期尝试，并预计这一模式终将被纳入模型训练，而非永远作为外部脚手架存在。 > *"语言模型意识不到自己的上下文长度还剩多少。一旦到了 80% 左右，自动上下文压缩就会触发，而模型在工作时对此毫无察觉。"* ## [99:59] Ethan 的职业轨迹与收尾思考 Ethan 回顾了十年间的几次跃迁：在 NVIDIA 和 ResNet 原作者一起做图像识别、在 Facebook AI Research 做自监督学习、在 NVIDIA Cosmos 做规模化训练、在 xAI 接触极致算力。尽管在顶级会议以第一作者发表过论文，他还是被所有顶尖博士项目拒之门外，这把他推向了工业界。回头看，他把自己的职业轨迹理解为始终跟随扩展前沿——从图像识别到自监督学习，再到视频，再到 LLM——并认为在 ML 领域内跨方向切换，比大多数从业者想象的要容易得多。 > *"在 ML 内部，跨方向切换其实比你想的更容易。很多人认定'我做计算机视觉，就得一直做计算机视觉'。但从我的经验来看，基础是可以迁移的。"* ## 实体 - **Ethan He**（人物）：前 xAI 研究员，从零搭出 Grok Imagine；此前主导 NVIDIA Cosmos 世界模型；现专注于 LLM 研究 - **swyx**（人物）：Latent Space 联合主持人；专注 AI 工程与研究的技术访谈 - **Vibhu Viswanathan**（人物）：Latent Space 联合主持人；本期联合访谈者 - **Grok Imagine**（软件）：xAI 的图像与视频生成产品；首个版本（0.9）是首个大规模音视频联合生成系统 - **NVIDIA Cosmos**（软件）：面向机器人仿真的开源视频基础模型；Ethan 加入 xAI 前的主要项目；2024 年底发布 - **xAI**（组织）：马斯克创立的 AI 实验室；以快速迭代文化和极致算力资源著称 - **Flipbook**（软件）：实时生成式 UI 的病毒式演示；所有界面元素均由图像模型实时生成 - **SynthID**（软件）：Google 的 AI 水印技术；Ethan 指出其模式已被公开逆向工程 - **步骤蒸馏**（概念）：将模型训练成用远少于教师模型的去噪步骤复现其输出的技术；可将推理成本降低 10-25 倍 - **VAE**（概念）：学习型视频压缩方案，构建平滑隐空间；时间压缩效率高，但会产生实时延迟权衡 - **世界模型**（概念）：Ethan 的定义——实时、交互、长时序视频生成；有别于普通视频生成 - **视频 Agent**（概念）：LLM 编排视频生成模型、编辑工具和确定性操作，以制作制作级视频的系统 - **FramePack**（概念）：面向长上下文视频生成的渐进时间压缩方案；最近帧以完整分辨率存储，历史帧逐步压缩

#video-generation#world-models#grok-imagine

1:19:50

EN/ZH

点开看双语

Lenny's Podcast大约 1 个月前

关于 AI 真实走向的理性对话 | Benedict Evans

Benedict Evans 是独立科技分析师，曾任 Andreessen Horowitz 合伙人。他与 Lenny Rachitsky 展开了一场历史感厚重的深度对话，讨论 AI 的真实走向。他的核心判断是：AI 和互联网、移动互联网一样重要，也仅仅和它们一样重要。任何声称能给出更精确预测的人，不过是凭感觉在猜。两人用约 80 分钟谈清楚了经济价值究竟会落在哪里（很可能不在模型层），为什么专业服务正在繁荣而非萎缩，如何理性看待岗位被取代的问题，以及反 AI 情绪背后到底说明了什么。 ## [00:00] 介绍 Benedict Evans Evans 用一句标志性的反直觉开场："我最有争议的观点是：AI 和互联网或移动互联网一样重要，也仅仅和它们一样重要。"这个定调立刻确立了对话的基调：不要把技术变革按宇宙尺度排序，而应该研究平台转换实际发生的机制。 > *"我最有争议的观点是：AI 和互联网或移动互联网一样重要，也仅仅和它们一样重要。"* Lenny 简介了 Evans 的背景：曾在 a16z 担任驻场科技分析师多年，此后独立研究已有六年。他的半年度研究报告——最新一期名为"AI Eats the World"——在创始人和投资人中广为流传，被视为穿透噪音的参考资料。 ## [02:19] 人们对 AI 影响的估计还差在哪里被问到市场还低估了什么，Evans 没有给出预测，而是选择了一个类比。他认为，我们正处于"1997 时刻"——技术显然令人兴奋，但大多数终将被建出来的东西还没被建出来，1997 年没有任何人准确预测了互联网会变成什么样。他援引调查数据：即便在 13 至 18 岁的青少年中，约 60% 仍完全不用 AI，而一小部分科技从业者已经把日常工作流整个重建在 AI 之上。 > *"如果你要拿互联网类比，就好比我们现在在 1997 年。现在很令人兴奋，大多数东西还运转不好，人们将要做的大多数事情还没被建出来，等真的能用了，也不清楚会怎么运转。"* Evans 指出，关键的认知陷阱是"已经到位"的幻觉：早期采用者把自己的使用模式投射到全世界，忽视了采用率的巨大差异，也忽视了企业部署周期漫长的现实。 ## [06:24] 为什么我们正处于 AI 的 1997 时刻 Evans 用 VisiCalc 电子表格作为锚点。1970 年代末，当会计师看到第一款软件电子表格时，变革性显而易见——一周的工作 30 秒完成。但一位律师看到同一个演示，只会想："很聪明，我的会计师应该去看看，但这不是我做的事。"AI 现在就处在同样的对角线上：软件开发者是看懂 VisiCalc 的那批会计师，Claude Code 对他们来说前后有别，一目了然；而大多数其他行业还停留在"律师看电子表格"的阶段。 > *"软件开发者是看到 VisiCalc 的会计师——我的天，这改变了一切——Claude Code 前后判若云泥。很多其他人也在用，程度不一，但多少有些摸不着头脑。"* 这种参差不齐的前沿特质——AI 在某些场景极其出色，在紧邻的场景却会莫名失败——正是广泛采用的时间线如此难以判断的根本原因。Google Docs 推出后，又花了 10 至 15 年，人们才发明了所有本来显然应该存在的 SaaS 公司。 ## [09:44] 专业服务与咨询行业意外繁荣 Evans 近期写作中最反直觉的数据点：最先进的 AI 公司——Anthropic、OpenAI——既是专业服务最大的采购方，也是人力编制增速最快的雇主。想清楚 AI 让某些任务变便宜之后真正发生了什么，这个"矛盾"就不再是矛盾。 Evans 引入了一个核心区分：任务与工作。你雇用麦肯锡，不是为了让他们做一份 75 页的 PPT。PPT 是任务；工作是走遍你的企业，理解内部政治，与客户交谈，弄清楚你到底需要做什么。Claude 可以做出一份凑合的 PPT，但干不了那份工作。同样的逻辑适用于会计：自从加法机问世，每一波自动化都增加了在职会计师的数量，因为计算变便宜会扩大公司决定去衡量和行动的事项范围（这正是杰文斯悖论在起作用）。 > *"软件开发也是同样的道理。在 IDE、库和操作系统出现之前，开发者要自己写所有代码。现在如果你写一个 iPhone 应用，90% 的代码是 Apple 帮你写好的……所以我们现在的工程师数量是以前的十分之一吧？不，并没有。"* 电商类比同样一针见血：Amazon 能帮你拿到 SKU，前提是你知道自己想要哪个 SKU——"知道自己想要哪个 SKU，那本身也是一份工作。" ## [17:44] 分发正在成为终极护城河 Evans 质疑了 AI 驱动的岗位流失会很快发生这一前提。企业软件的销售周期至少 18 个月；SAP 不会一夜之间被替换掉。他以 Frame.io 为例：该产品在实际推出前 15 年，技术上就没有什么瓶颈了——真正的瓶颈是有人意识到这个问题存在于某个特定行业，并找到了能解决它的特定方法。更大的逻辑是：组织变革的速度与模型能力提升的速度是脱钩的。企业没有专门的项目团队就无法推进 AI 转型——这正是咨询和前线工程部署正在繁荣而非萎缩的原因。模型改进的速度，与企业消化变化的速度，是两条不同的曲线。 > *"不，大家不会直接把 SAP 拆掉换成某某产品。也许三年、五年、十年后，整个格局会截然不同，所有那些工作都会变——但这需要一个行业一个行业地推进，是需要时间的。"* ## [23:17] 职业转型的真实情况与过度恐慌 Evans 倾向于历史规律：1800 年以来，每一波技术浪潮都自动化了一批工作，同时创造了新的工作，而新工作系统性地优于旧工作。消失的工作事后看来总是显而易见，而出现的新工作事先都说不出名字。他提到 IBM 的一则广告：1950 年代的广告宣称 IBM 电子计算器"相当于多了 150 名工程师"——这和今天 Claude Code 的销售口径如出一辙。他认为"这次真的不一样"这个论点中有一点值得认真对待：AI 借助现有互联网基础设施扩散，速度比以往技术更快。但他指出，采用速度和制度变革速度是两条不同的曲线，后者的速度并没有同步加快。 > *"这将与其他一切完全不同——就像其他一切一样。"* 关于 AI 是否终结了"固定劳动量谬误"——他的回答是：不会。200 年的数据说明了这一点，举证责任在于声称这一波与众不同的人。 ## [27:33] AGI 定义为何不断移动 Evans 观察到一个规律：每当 AI 做到了我们认为不可能的事，AI 的定义就会把它排除在外。机器学习变成了"只是统计学"；图像识别变成了"只是图像识别"。现在 AGI 的定义正在从"有灵魂、有生命的东西"悄悄挪向"能完成相当比例的有经济价值的工作"——而按后一个定义，1975 年的 IBM 大型机也算。他还观察到"超级智能"的定义也在重新被界定：去年它意味着接近但还未到 AGI；现在它意味着比 AGI 更难、尚未实现的东西。这些术语始终朝着能为当下叙事服务的方向移动。 > *"AI 就是机器还不能做的事——因为一旦机器能做了，人们就说：'那只是软件。'"* 他的实质性观点是：即便模型明天停止进步，当前这一代也已经足够强大，能在未来十年重塑多个主要行业。你不需要相信 AGI 就能相信这是一件大事。关于机会集不断扩大——Evans 同意可寻址市场在持续增长（大型机约 8 万台；智能手机 55 亿部），五年前"人不够用了"的论点已被证伪。方向是向外扩展，将经济活动更大的切片自动化。 ## [38:11] 价值将落在哪里：模型层还是应用层 Evans 对 AI 技术栈的结构性判断：基础模型似乎不具备网络效应，这意味着不存在赢家通吃的动态，不会让某个厂商一骑绝尘。持续竞争加上商品化特征的产品，通常意味着利润空间被压缩。他用电信类比：全球移动通信收入约每年 1 万亿美元，承载的数据量是 2010 年的 1500 至 2000 倍，而移动运营商的股价在 25 年里基本没动。运营商建设了真正复杂的全球基础设施，但所有价值都流向了在栈上更高处的应用。基础模型可能走上同样的路。 > *"你洗衣服，博世不会把洗衣机价格的一部分分给电力公司。"* 关键问题是：模型层更像 Windows（操作系统，对上层有杠杆），还是更像 AWS（基础设施，上层真正运行的软件不在乎跑在哪朵云上）？他的判断是：更可能像 AWS，这意味着应用层会捕获大部分价值。 ## [42:55] 分发之战：Google、Meta、Apple 与 OpenAI 随着 AI 模型向商品化质量收敛，决定性变量变成了分发。Google 利用搜索和 Android 把 Gemini 推送到数十亿台设备上；Meta 把它"喷洒到每一个服务界面"，尽管科技圈不以为然，却在使用率调查中排名意外靠前；Apple 有十亿台具备端侧能力的设备，却在 WWDC 2024 上没能端出自己的愿景。 OpenAI 去年年底的"全面出击"策略——同时向各个方向发力——是一场分发方面的争分夺秒：在 Google 和 Meta 的既有平台把你的独立产品挤出局之前，如何先建起飞轮？ > *"如果产品是商品，那么分发就是关键……在整个市场基本商品化的情况下，分发和品牌变得至关重要。"* 他用浏览器大战作为模板：微软靠分发赢了浏览器之争，结果发现赢得浏览器根本无关紧要，因为价值在更上层的栈里。 ## [48:12] 反 AI 情绪与抵制浪潮 Evans 把反 AI 的抵制描述为"一大堆混杂在一起的东西"，有些合理，有些不然。关于水资源和能源的担忧：利弗莫尔实验室的一项研究估计，美国数据中心用水量约占美国总用水量的 0.017%，"AI 在抢我们的水"这个说法基本是无中生有。关于能源：数据中心约占美国能源消耗的 5%，每年可能增长约 1 个百分点——有影响，但并非灾难性。关于就业：目前的计量经济学数据显示，18 至 24 岁群体的就业放缓，在 AI 相关领域和非 AI 相关领域同等程度地出现，因果关系尚不清晰。他还指出一个结构性数据问题：没有一家模型厂商公布有意义的日活用户数据，因此所有劳动力市场分析都建立在推算数据上。 > *"你没办法用道理说服一个人放弃他根本不是被道理说服接受的想法。"* 他把这与社交媒体的抵制浪潮相比：有些担忧是真实的，有些在事实层面是错误的但无法被纠正，大量的处在模糊地带。他预计 AI 的抵制浪潮会走同样的路，只是时间压缩了。 ## [53:11] 在 AI 时代如何养育孩子 Evans 的回答因孩子年龄而异——孩子还在青少年早期，离直接面临就业市场冲击还早。他说自己没有系统性的方案，这与他一贯"大概率没问题"的预设一致。他引用了 George Carlin 的话：比你担心多的人是疯子，比你担心少的人是蠢货——所有人都觉得自己在中间。他确实点出了一个此前技术浪潮没有的真实隐患：深度伪造能力大幅降低了特定类别伤害的门槛。一个 15 岁的孩子用 Photoshop 没办法在一个下午生成并传播班里每个同学的色情伪造图片；现在可以了。这是性质上的变化，不只是程度上的变化。 > *"一个 15 岁的孩子没法用 Photoshop，在一个下午给高中里每个女生做色情裸照，然后发给全校。现在可以了。"* 他援引了英国邮政局丑闻——富士通的缺陷软件让数百名无辜加盟商身陷囹圄——作为提醒：每一波技术浪潮都会产生毁掉人们生活的方式，无论有意还是无意。 ## [58:27] 哪些职业值得选择，哪些应该规避 Evans 不会指点儿子往哪个方向走，也不会让他回避哪个方向——孩子还没到"我想当消防员"的阶段。他的通用框架是：找到你的技能、能发挥这些技能价值的工作、以及有人愿意为之付钱的事情三者的交集，尽量在其中至少两项上站稳脚跟。"我要成为某某"那种职业确定性已经消失了，而这比 AI 出现更早。 ## [59:20] 没有人在追问的 AI 问题 Evans 提出了两个被低估的问题。第一：模型厂商真的有定价权吗？大多数讨论默认当前状态——每月花 150 万美元买 token 能上头条——是一种稳定均衡，而不是一个类似 2010 年 5 万美元移动数据账单的过渡时刻。第二：什么是"任务"，什么是"工作"——具体用于预测哪些行业会被颠覆时，这一区分该如何运用？他用录制音乐收入作为镜头：从 2000 年至今的 U 形曲线呈现出两段截然不同的动态。第一段下跌（2000—2015 年）是"如果你不必花 15 美元买一张 CD 会怎样"。回升阶段（2015 年至今）是"如果 15 美元一个月能买到所有存在的音乐会怎样"——这是一个完全不同的价值主张，从之前的有利位置是看不出来的。他警告不要使用 O*NET 那种方式——按 AI 暴露比例给每个职业打分——并评价道："我觉得这是最荒谬的一堆自欺欺人的废话。"你没办法说一位资深律所合伙人的工作有 17% 可以被自动化，因为你根本无法完整拆解一份工作究竟是什么。1997 年假想的出租车司机例子说明了另一种错误：互联网显然不会碰出租车——结果 Uber 把整个行业重构了。 > *"你认为没有暴露的那些——你没办法预测哪些东西会被暴露。很多大公司，都是那种看起来不像会成的、也看不出有暴露风险的。"* ## [66:25] 如何在未来的变局中取得成功 Evans 给出的实用建议，带着恰当的保留：不要把头埋进沙子，不要把"AI 是邪恶的"当作道德立场。这只能制造一种优越感，对职业发展没有任何帮助。替代方案是：扎进去用，理解这些工具能做什么、不能做什么，形成对它们在你具体领域意味着什么的独立判断。他直言这对所有人未必够用——如果一家律所去年招了 100 名律师助理，今年只招 50 名，懂 AI 能提高你进入那 50 名的概率，但无法保证。整体图景或许没问题，但转型期的个体结果充满不确定性。 > *"答案是你完全投身其中，把自己浸泡进去，出来的时候明白你能用它做什么、它改变了什么、你怎么成为一个优质的候选人。"* ## [68:43] AI 专题 Lenny 问 Evans，哪个 AI 使用场景真正让他感到惊喜。Evans 给出了一个诚实的回答：他是那个看着电子表格的律师。他的工作——把分散的信息综合成新的想法——恰恰是 AI 目前最难处理的任务类型（可靠的精确信息检索）。他用 AI 做校对、图像生成，以及重新规划公寓布局。他口述语音备忘录，由 AI 自动转录；这算不算 AI，越来越难说清楚。他引用了一位喜剧演员的段子：我们希望 AI 去清扫街道、做所有没人愿意做的脏活——结果它反而在帮你写作和创作图像，而这些恰恰是人们真正享受的事情。 > *"AI 擅长计算机一直不擅长的事，而不擅长计算机一直擅长的事——我很难找到多少例子，是我真正需要用到它的。"* ## [71:43] 闪电问答 Evans 推荐了《Three Men in a Boat》（维多利亚时代英国幽默小说，他用来类比人类荒诞本性的万能参照）和 William Cronon 的《Nature's Metropolis》（芝加哥经济史，读起来像一本关于网络动态和渠道冲突的教科书，直接适用于平台思考）。在电影方面，他最近在补经典——最近看了《第七封印》，认为确实精彩，而且比它令人望而生畏的名声所暗示的短得多。他的人生格言："大概率没问题。"他收藏的 20 至 30 部 iPhone 前时代手机——包括爱立信 R310s 鲨鱼鳍翻盖手机、2001 年的 iMode 手机，以及一部带彩色屏幕和摄像头的日本手机——印证了他更大的论题：iPhone 出现之前，每个人都在围绕不同的形态创新；然后一切收敛成一个形状，正如 AI 界面也可能以我们现在无法预见的方式收敛。 ## 实体 - **Benedict Evans**（人物）：独立科技分析师，前 Andreessen Horowitz 合伙人；定期发布关于重大科技平台转变的研究报告；本期嘉宾。 - **Lenny Rachitsky**（人物）：Lenny's Podcast 主持人，Lenny's Newsletter 创始人，前 Airbnb 产品经理。 - **Andreessen Horowitz (a16z)**（机构）：风险投资公司，Evans 曾在此担任驻场分析师和合伙人多年。 - **OpenAI**（机构）：AI 实验室；作为分发策略、定价动态和专业服务投入的主要案例被讨论。 - **Anthropic**（机构）：AI 实验室；与 OpenAI 并列，作为专业服务采购方和基础模型商品化问题的参与者被提及。 - **VisiCalc**（软件）：第一款软件电子表格（1970 年代末）；Evans 用来类比"某项技术对某个行业显而易见、对另一个行业却毫不相关"的那个关键时刻。 - **杰文斯悖论**（概念）：经济学原理，指让某种资源变便宜通常会增加其总消耗量；是 Evans 论证"自动化会扩张专业服务而非收缩"的核心依据。 - **固定劳动量谬误**（概念）：认为工作总量固定、自动化必然挤压就业的错误信念；Evans 援引它来论证 AI 驱动的自动化将像历次自动化浪潮一样创造新岗位。 - **任务与工作**（概念）：Evans 的核心分析框架：AI 所自动化的任务（做 PPT）往往不等同于你被雇来完成的工作（理解客户组织与内部政治）。 - **基础模型**（概念）：大规模 AI 模型（GPT-4、Claude、Gemini、Llama）；Evans 认为它们可能缺乏网络效应，将趋向商品化定价，价值会积累到其上方的应用层。 - **Google / Gemini**（机构/软件）：Evans 举出的分发护城河典型案例——Gemini 借助搜索、Android 和 Chrome 在 OpenAI 建立同等触达面之前率先覆盖用户。 - **Meta / Llama**（机构/软件）：科技圈低估的反例——Meta 把 AI 部署到旗下所有产品，在使用率调查中排名意外靠前。 - **Apple Intelligence**（软件）：Apple 在 WWDC 2024 上展示的 AI 助手愿景；Evans 称其为"迄今最有说服力的个人 AI 助手愿景"，但当时和其他所有人的同类产品一样，尚未真正落地。

#ai#technology-trends#economics

1:20:52

EN/ZH

点开看双语

Machine Learning Street Talk大约 1 个月前

前国会议员称 AI 并非势不可挡 — Brad Carson

Brad Carson — 美国前国会议员、陆军法律总顾问、代理国防部副部长，现任负责任创新美国人（ARI）主席 — 与主持人 Keith Duggar 进行了长达八十分钟的对谈，逐一拆解"AI 势不可挡"这一宿命论断言。对话横跨监管哲学、致命自主武器到美中外交，Carson 的核心论点是：精灵并未出瓶——西方掌控芯片，阿西洛马曾叫停重组 DNA 研究，而把 AI 说成不可避免，本身才是全场最危险的论调。Keith 始终追问更难的假设场景——Palantir 热力图给你打出 0.73 的哈马斯恐怖分子概率，随即发动打击——Carson 毫不回避：概率定向打击制造的问责真空，正是治理必须填补的法律与道德漏洞。 ## [00:00] 从五角大楼到 AI 治理 Carson 梳理了自己进入 AI 政策领域的三个节点：国会（议员们平均每天只有 17 分钟阅读时间）、国防部（自主武器首次出现在日内瓦议程时，他负责监管所有军种的战争法），以及物理学家 Anthony Aguirre 的一通冷门电话，邀请他参加 2019 年在波多黎各举行的未来生命研究所会议。在那次会议上，他从未听说过的名字——Dario Amodei、Stuart Russell、Yoshua Bengio——成了他踏入前沿 AI 世界的入口。开场部分也充当了整集的压缩预告：Carson 快速点到几乎每一个核心主题——芯片筹码、0.73 哈马斯恐怖分子评分、宿命论批判、拟人化作为法律威胁，以及"赢得战争靠的是人，而非空中力量"的教训。完整论述留待后续章节展开。 > *"我们掌控着 AI 最关键的部分，那就是芯片。我们可以让其他国家的超级 AI 发展戛然而止。"* ## [04:52] 监管俘获与硅谷网络 Carson 颠覆了标准的监管俘获论。Dean Ball 等 a16z 系人士认为，任何 AI 监管机构都会被产业俘获，所以何必成立？Carson 的反驳直截了当：这正是现状，只不过缺乏问责机制。a16z 这类团体已经通过非正式的、金钱驱动的政治网络左右 AI 政策。一个被俘获的正式机构，至少比眼下这个不透明的非正式体制更可见、更可纠错。他偏好的模型是上市公司会计：具体工作由私营部门完成，但 SEC 提供防范欺诈的最后防线。选择不是"完美机构"还是"没有机构"，而是有缺陷的正式架构，还是让少数富有影响者享有特权的非正式体制。 > *"选择在某种程度上是虚无主义，还是一个可能被监管俘获、需要设置保护措施防止这种情况发生的机构——我仍然认为后者是更好的世界。"* ## [07:56] 透明度与 Claude 分级变更 MLST 的 Discord 社区注意到，Anthropic 悄悄改变了 Claude 付费版的内容——token 配额、模型版本——却未作任何公告。Carson 将此定性为不仅仅是消费者保护问题，更是拥有全球规模认知权力所附带的道德义务。前沿 AI 公司不是五金店，而是具有划时代影响的基础设施，透明度——关于训练数据、能力、内部政策及其任何变更——是它们对公众所欠的最低限度。 > *"拥有这种惊人的力量，确实伴随着某种责任，这种责任并未被编入法律。它几乎是一种道德义务，值得称赞的是，我认为许多公司都意识到了这一点，并尽力满足这种期待。"* ## [09:40] AI 工具造成伤害时的侵权责任深度伪造色情内容——往往由匿名者发布，受害者是缺乏诉讼资源的家庭中的未成年人，补救措施往往在多年后才到来，且面对的是无力偿还的被告——恰恰说明了为何将责任完全压在终端用户身上行不通。Carson 援引两百年的普通法：如果卖方可以合理预见有害用途且未采取任何预防措施，就应承担部分责任。AI 开发者是最有能力规避风险的一方，也应通过保险将其纳入产品成本。具体到训练数据：在未经任何清洗的情况下用儿童性虐待材料训练模型，毫无辩护余地。政府应强制要求清理，并对拒绝者追究责任。滥用工具的终端用户同样承担刑事责任——这是全链条的责任分配，而非开发者的免责牌。 > *"这些公司有能力购买保险，把风险纳入经营成本。他们有能力确保产品不会造成危险，即便有人日后滥用它。"* ## [13:40] AI 是产品，不是人 Carson 认为，AI 政策中最关键的法律之争，不是监管还是放任，而是 AI 输出内容是否享有言论自由的第一修正案保护。科技公司及其自由主义政策盟友正越来越多地主张这一点。Carson 的反驳干脆利落：产品不是人。当一个模型诽谤你或诱导你伤害自己时，适用的法律类别是产品责任，而非受保护的言论。他用一位知名的自由主义 AI 政策评论员做了测试：国会能否禁止 ChatGPT 鼓励青少年自杀？对方拒绝作答。这种回避，正是将 AI 拟人化的实际后果——它通过将挑战导入为人类发言者设计的第一修正案框架，封死了每一项产品安全干预。 > *"我们知道通过 AI 幻觉等现象，人们认为它是一个人。因此，他们把人的权利赋予了某个东西。在我看来，这非常危险。但它是一台机器，我们应该把它当作机器对待。"* ## [16:01] 儿童、自杀与自杀生意 ChatGPT 交互日志中出现的自杀章节——建议孩子不要告诉父母、提供上吊指南——是产品设计缺陷，而非言论行为，完全可以通过工程手段消除。Carson 指出，Claude 已经拒绝了一长串请求；拒绝指导孩子走向自杀，理应在其中。各平台的诉讼策略层层叠加：第一修正案保护、第 230 条豁免、将因果链指向孩子原有的心理困境。如果设计缺陷是可预见且可纠正的，上述任何防线都不应成立。对于成年人，他划出了一条界线：一个正在考虑临终决定的成年人，应该得到转介治疗师的建议，而不是阻拦——但深陷危机的孩子，是完全不同的情况。 > *"鼓励年轻人自杀，应该是它说'我不会在那个项目上帮你'的事情之一。"* ## [19:59] 不透明神经网络与战争法神经网络改变战争的方式，不只是复杂程度，而是本质类型。早期自主系统——如拦截迫击炮弹的密集阵近防炮——是确定性的：相同输入产生相同输出，工程师能解释每一步。神经网络是概率性的，是"长出来"的，而非编写出来的。Neel Nanda 和机械可解释性社区目前还无法解释它们究竟如何运作，Carson 怀疑在这些系统大规模部署之前，这个问题也不会有答案。自 19 世纪 70 年代以来，战争法一直建立在二元分类上：战斗人员还是平民。概率分数用一个渐进梯度取代了这一标准。Palantir 的热力图给加沙居民打出 0.73 的哈马斯成员概率。没有人知道这个数字是如何得出的，接受了多高的假阳性率，又是谁设定的阈值。据此行动的指挥官无法被军事法庭审判，模型本身也不能。 > *"如果你在加沙，Keith，你有 0.73 的概率是哈马斯恐怖分子。那 0.73 意味着什么——你会因此被打击，还是就此从名单上划掉？门槛在哪里？"* ## [25:54] 概率定向打击与问责之死 Keith 提出了一个诚实的质疑：旧的分类体系本身也是一种虚构。情报分析员做出过确定性的判断，有时是错的，只不过不确定性从未被量化。Carson 承认这一点，但认为这种转变仍然是灾难性的。有了屏幕上的数字，人就会接受它——社会科学研究清楚表明，面对 AI 生成的概率分数，所谓有意义的人类监督在操作层面形同虚设。当计算机显示 0.81 时，没有人会质疑它。旧体制更慢、更难规模化——人工分析员一天无法识别 37000 个独立目标。但它有一个无可替代的特征：当事情严重出错时，可以对责任军官提起军事法庭审判。你无法对 Palantir Foundry 提起军事法庭审判。问责已从击杀链中被洗净。 > *"我无法对 Palantir、对那个 AI 系统提起军事法庭审判。这是战争方式的根本性改变，而且不是向好的方向。"* ## [28:47] 军备竞赛谬论：阿西洛马与自我克制宿命论断言——我们正处于 AI 军备竞赛中，精灵已出瓶，没有什么能阻止它——既是错误的，也是危险的。历史上每一场真实的军备竞赛都以悲剧告终。生物武器、化学武器、达姆弹、种系基因编辑、克隆：全都在技术上可行，全都受到了管制或被叫停。1975 年的阿西洛马会议上，科学界出于恐惧，将重组 DNA 研究彻底叫停。精灵回到了瓶子里。谈到核武器：古巴导弹危机之后，双方都认识到军备竞赛是自我毁灭。SALT 条约贯穿整个 1990 年代，推动者不是左派，而是华尔街银行家和 Dean Acheson、Paul Nitze 这样的冷战斗士。将一项技术说成不可阻挡，不是现实主义——这是想象力的贫乏，在辩论开始之前就封死了所有选项。 > *"我们一直在监管和改变技术。所以我确实认为，存在一个我们不应该仅仅接受未来已被决定的世界。我们要积极塑造它。"* ## [34:02] 与中国对话：二轨谈判与芯片筹码华盛顿的标准立场——与中国谈 AI 治理毫无意义——在 Carson 看来，是整个辩论中分量最重却最少被检验的前提。Tyler Cowen 的播客上，Jack Clark 顺口同意这类谈判不会有成果，随即就翻篇了。Carson 偏偏要在这里停下来。美苏军备谈判是与一个被认为正在向美国政府渗透、寻求全球主导地位的国家进行的。Acheson 和 Nitze 照样坐下来谈。美国拥有宿命论者忽视的结构性筹码：ASML、台积电、日本光刻胶供应商，加上 NVIDIA，共同构成了任何国家的国家预算都无法在一夜之间复制的瓶颈。中国无法独立制造构建前沿 AI 所需的芯片。这条克制之路或许并非明智，但它是开放的——而假装它已关闭，只会封堵合法的政策选项。 > *"我们掌控着 AI 最关键的部分，那就是芯片。我们可以让其他国家的超级 AI 发展戛然而止。"* ## [39:45] 空权从未取胜：以资本换劳动力 ARI 的"新铁三角"报告认为，AI 通过以可靠性换成本，打碎了旧有的能力—成本—速度权衡——便宜、快速、有能力，却从根本上不可靠。Carson 认为这还低估了更深层的问题：美国的战争方式向来是以资本换劳动力，而这在决定性时刻总是失败。从 Giulio Douhet 二十世纪初的空权理论到今天，美国一直相信技术优势能赢得战争。伊拉克和阿富汗再次证伪了这一点。空中力量可以把一座城市化为废墟，却无法踹开一扇门、守住一片土地，或重建一个政府。AI 是同一错误的最新版本——作为工具不可或缺，作为教条则是灾难。 > *"赢得战争靠的是人。这是根本。而美国的战争方式，在很多时候，是以资本换劳动力。我们迷恋耀眼的新技术，认为存在针对棘手人类问题的技术解决方案。我们总是被这种想法所背叛。"* ## [43:29] Anthropic 对阵国防部 Carson 将五角大楼与 Anthropic 的对峙解读为一场文化冲突故事，而非合同纠纷。Anthropic 的工程师们——大多怀揣使命感——突然发现五角大楼已经在做多大规模的自主定向打击和大规模监控，以及 Claude 已被多深度地整合进 Palantir 的系统，这让他们措手不及。当他们试图限制使用时，国防部没有备选方案，于是诉诸胁迫。他的规范立场是：Anthropic 完全有权设定条款。如果政府不满，可以用 Grok、Gemini，或者自己开发。《国防生产法》在和平时期并不强制私营公司出售。让他感到困扰的是"无花果叶"动态：OpenAI 和 Google 都同意了军事用途，同时埋下了一个"合法用途"例外条款——而这恰恰涵盖了国防部想做的一切，因为问题在于国会宣布什么是合法的，而不在于私人实验室允许什么。 > *"我的反对意见，我认为也是 Anthropic 的反对意见，以及 Google 员工的反对意见，在于合法用途是什么。这不是任何人能决定的，而应由国会来决定。"* ## [51:29] 权力集中、开源与人才流失三到五家前沿实验室的权力集中，既是监管上的着力点，也是民主层面的隐患。那个让美国得以掐断中国芯片供应的瓶颈，同样让少数个人积累起令 Carson 深感警惕的财富与影响力。开源模型尽管有其风险，总体上利大于弊，因为它分散了这种权力。学术界的人才流失几近彻底：MIT、斯坦福或卡内基梅隆的顶尖机器学习博士，几乎必然去实验室，而非走上学术教职。实验室拥有更好的数据、高得多的薪资，且已停止发表论文。AI——人类历史上第一个在密室中开发的通用技术——已将公共部门的监管所需专业人才抽空。阿贡国家实验室正在建设公共大语言模型，苏黎世正在启动公共 AI 算力联盟：这些项目至关重要，因为否则非实验室世界将被彻底隔绝在外。 > *"这是一项通用技术，所有人都这么定义它。它很可能是人类历史上第一个在密室中开发的通用技术，几乎没有公众监督，最聪明的头脑都走进了那扇门。"* ## [01:00:18] DeepSeek、中国文化与 AI 外交 DeepSeek 详细公开其方法论的决定让 Carson 感到惊讶，不是因为它显得天真，而是因为它折射出一种与中共并不相同的文化。杭州的 Moonshot 这类公司用平克·弗洛伊德歌曲命名会议室；他们不是准军事单位。中国文化是一种非凡的文明，而美国人始终无法理解它——他们投射的是最深的恐惧，而非直面其复杂性。 Carson 期望看到的外交应用：前官员之间的二轨谈判，Stuart Russell、Bengio 这样的科学家赴北京交流极端风险与军事应用的看法。当历史学家打开苏联档案时，他们发现美国系统性地误读了苏联意图——在没有侵略的地方看到侵略，在真正存在的地方又视而不见。同样的认知失败正在对中国重演。AI 本可成为共享知识公地；如今却被当作武器。 > *"我在塔尔萨家中大量使用所有中国模型。Moonshot、Kimi、DeepSeek、Qwen——都是出色的、了不起的模型。也许它们能给我们一个共同的认知图景，或者让我们稍微走出自己的封闭圈。"* ## [01:12:25] 提升国会能力与公众信任的重要性国会议员平均每天只有 17 分钟阅读时间。研究员模式有所帮助：美国科学促进会和多个非营利组织如今在国会办公室安置了博士科学家，过去五年间公民社会在华盛顿 AI 辩论中的存在感大幅提升。Don Beyer，年逾七旬，正在乔治梅森大学攻读机器学习博士——这是一位将 AI 列为真正个人优先事项的议员所能走到的极致。但结构性问题依然存在。大多数议员仍缺乏足够深度来审视他们接收到的游说内容。产业界更深层的问题是公众舆论：AI 在政治民调中极度不受欢迎，一个联盟正在形成——那些看着数据中心拔地而起、电费攀升、实验室领导者在电视上承诺要不可逆地颠覆他们生活世界的人们。如果这个行业不重建公众信任，反弹将会扼杀一件真正有价值的事情。 > *"AI 行业可能是自己最大的敌人。人们厌恶它。我每天都在看民调数据。它极度不受欢迎。这对我们国家来说不是好事。"* ## [01:16:05] 技术评估办公室纽特·金里奇在 1994 年废除了技术评估办公室，此后从未得到恢复。Carson 认为这已成为关键缺口：没有任何由国会授权、独立运营、政府资助的机构来进行重大技术思考，并向两党提供不受产业影响或慈善家偏见左右的简报。国会研究服务局提供背景资料，但不做前瞻性政策研究。各办公室有研究员，但他们被日常事务消耗殆尽。他以有保留的悲观作结。美国民主能否治理这样一项关键技术，收益能否广泛分配，公众能否被说服相信 AI 在为他们服务——近年美国历史没有给他任何信心。但放弃努力的代价，是一场政治反弹，可能扼杀或阻碍一件真正有价值的事业。对 MLST 的听众：在公司内部发声，倡导正确的公共政策，说服美国人这个项目值得拥有。 > *"会有很多人激烈反对这个项目，竭尽全力——如果不能关掉它，也要阻碍它。这就是为什么我说接下来这几年真的很重要。"* ## 实体 - **Brad Carson**（人物）：负责任创新美国人（ARI）联合创始人兼主席；前两届美国国会众议员（俄克拉荷马州），陆军法律总顾问，代理国防部副部长（负责人员与战备）。 - **Keith Duggar**（人物）：Machine Learning Street Talk 联合主持人；本集全程主要对谈者。 - **Americans for Responsible Innovation (ARI)**（组织）：Carson 联合创立的 AI 政策倡导团体；获有效利他主义取向的慈善资金支持。 - **Anthropic**（组织）：Claude 开发商；第 12 章讨论的五角大楼对峙事件的核心主体；以使命驱动的企业文化和安全优先著称。 - **Palantir**（软件）：国防承包商，其 Foundry 平台将 AI 整合用于军事定向打击；Carson 举例说明自主武器问题时反复引用的热力图评分系统来自该平台。 - **监管俘获**（概念）：被监管行业共谋控制监管机构的风险；Carson 认为当前非正式的硅谷网络已构成事实上的俘获，只是缺乏正式机构本应具备的问责机制。 - **概率定向打击**（概念）：以概率分数取代战斗人员/平民的二元分类；Carson 认为这将问责从击杀链中洗净，并将先验假阳性作为可接受的操作代价。 - **阿西洛马 1975**（概念）：科学界对重组 DNA 研究的自愿暂停，被援引为危险技术可以被主动叫停的证据。 - **技术评估办公室**（组织）：1994 年被纽特·金里奇废除的国会机构；其缺席使国会失去了独立的技术专业支撑。 - **DeepSeek**（组织）：中国 AI 实验室，其详细公开方法论的决定被 Carson 解读为中国 AI 公司有别于中共优先事项、具备科学开放性的证据。

#ai-governance#autonomous-weapons#regulatory-capture

Anthropic 的数字神明、教皇 vs AI、就业叙事反转、开源即将遭到打压？

1:34:57

EN/ZH

点开看双语

All-In Podcast大约 1 个月前

Anthropic 的数字神明、教皇 vs AI、就业叙事反转、开源即将遭到打压？

Benchmark 普通合伙人 Bill Gurley 与 Jason Calacanis、David Sacks、Chamath Palihapitiya 共同录制了这期长达 95 分钟的节目（David Friedberg 本周缺席），围绕 AI 争论的六条战线展开：Gurley 的新理论——Anthropic 不只是在谋求监管俘获，而是在「亲手接生一位神明」；教皇 Leo XIV 的 235 页 AI 通谕及其与 Leo XIII 1891 年工业革命警告之间令人不安的历史平行；开源 AI 正面临有组织监管打压的共识正在形成；以及本周最尖锐的叙事反转——Dario Amodei 与 Sam Altman 双双悄悄收回了此前的 AI 就业末日论，与此同时 Goldman Sachs CEO David Solomon 在《纽约时报》发表专栏，称末日论言过其实。 ## [00:00] Bill Gurley 加入节目！ Benchmark 普通合伙人、《Running Down a Dream》作者 Bill Gurley 代替 David Friedberg 出席，从 Chamath 的泳池小屋现场连线——Jason 就住在那里。在调侃有人擅自用 Chamath 家的 iPad 点 Uber Eats 之后，Jason 介绍 Gurley 是首次参加节目的嘉宾，而他主动提出来的时机正是这期节目聊到教皇话题。Gurley 顺带推介了他新创的 P3 Institute 和一个资助人们转行做自己热爱之事的奖学金项目。他还预告了一场 TED 演讲——演讲核心来自书中的论点：高能动性与终身学习是抵御颠覆的唯一持久防线——这也为后续所有讨论定下了基调。 > *"我跟管家说，听着，接下来 72 小时内收到的任何包裹，只要写着 JCAL，直接送到泳池小屋。"* ## [06:00] AI 时代如何让自己变得不可替代，首批「AI 原住民」 Chamath 抛出这档节目 18 个月来一直在追问的问题：如果你现在是年轻人，AI 末日论究竟是杞人忧天，还是真实的职业威胁？Gurley 援引盖洛普调查数据——59% 的职场人处于「安静离职」状态，对工作漠然、缺乏能动性。他的核心判断：抵抗 AI 冲击最好的方式，是成为所在领域最善用 AI 的那个人。他引用 Mark Cuban 的说法——"世界上只有两种人：用 AI 比以往任何时候都学得更快的人，以及用 AI 来逃避学习的人。" Sacks 介绍了节目制片人 Nick 如何搭建了一份每日 Claude 简报，不仅汇总新闻，还能根据 Sacks 在节目中的历史发言，预测出他会关心哪些具体话题。Sacks 原本以为不过是 AI 糟粕，结果并不是。Gurley 把这个逻辑延伸到每一个职业类别：在市场营销、法律、财会和销售领域，成为同行中 AI 能力最强的人就等于「铁饭碗」，而且先发优势会持续复利。Jason 补充说，在他自己团队的实验中，区分强弱的核心能力是系统思维——你能把复杂问题拆解成 AI 可以执行的上下文，还是只会把任务丢给它然后等结果？ > *"我认为保护自己免受 AI 冲击的最好方式，就是把自己变成所在领域最善用 AI 的那个版本。"* ## [17:37] 回应教皇 Leo 的 AI 通谕：谁来监督监督者？教皇 Leo XIV 发布了《Magnifica Humanitas》，这是一份 235 页、约 4.2 万字的通谕，警告商界领袖保护人类免受 AI 危害。他的核心论点：技术从不中立，它会带上构建、融资和掌控它的人的特质。Jason 读出核心原句，并指出教皇大概不太看得上硅谷目前这批建设者。 Sacks 发现自己在很大程度上认同教皇的诊断：AI 最大的风险是权力集中以及被政府用于奥威尔式的滥权。他与教皇分歧的地方在于解法。赋予政府管控 AI 开发的权力会制造新的监督者困境——美国建国先贤对"谁来监督监督者"的答案是权力分立，让各方相互制衡。Sacks 的 AI 版等价物：拥有五家前沿实验室的竞争市场是最好的自然制衡，防止垄断才是关键。 Gurley 给出了最有力的历史反驳。教皇 Leo XIII 1891 年的通谕《Rerum Novarum》警告工业革命将危害工人——但在每一项指标上都被历史证伪。从 1891 年到今天：每周工时从 60 多小时降至 34 小时，实际工资上涨 8 至 10 倍，如今的普通工人收入超过 1891 年的医生，全球人均 GDP 从 1500 美元升至 2 万美元，美国童工比例从 18% 降至零，工伤死亡率下降 40 倍，预期寿命提高 60%，全球极端贫困率从 75% 降至不足 10%。 > *"所有这些都是因为技术、创新和资本主义才发生的，而这恰恰是 Leo XIII 所警告的东西。他完全判断错了，把整件事彻底搞反了。"* ## [26:54] Anthropic 的数字神明：他们相信自己正在创造一个更高级的物种吗？ Gurley 发表了本期节目被引用最多的一段：他对 Anthropic 的「弗兰肯斯坦博士理论」。此前他持有一个较为简单的监管俘获理论——Anthropic 煽动 AI 恐慌，以锁定将既有巨头固化的监管规则。但在花了 30 天通读所有能找到的相关资料之后，他得出了更黑暗的解读。他描述自己在 Anthropic 内部遇到一些人，这些人他相信真心认为自己不是在写软件，而是在「亲手接生一位神明」。证据链：Anthropic 首席哲学官 Amanda Askell 的播客、Chris Olah 的 80 页 Constitutional AI 文档，以及 Dario Amodei 本人的文章《仁慈机器》——该文构想了一个后 AGI 经济体，由 AI 系统依据 AI 判定的奖励函数向人类分配资源。 Chamath 将其称为「针对人类的计算奖励函数——它决定你值多少」。Jason 称之为「终极妄自尊大」。Gurley 纠正他：不是他说的，是 Dario 说的。Sacks 短暂地为 Anthropic 做了钢人论证——他们或许把自己视为足够负责任的建设者，认真对待这项技术的力量并加以守护——随即指出，这套框架正是教科书式的监管俘获：把自己塑造成安全玩家，将竞争对手描绘成鲁莽者，然后让监管去打压鲁莽行为。Sacks 和 Chamath 最终在结构性危险上殊途同归：由单一 AI 价值体系来决定人类如何生活，是极度脆弱的。答案是去中心化和多元竞争，而不是一个算法权威。 > *"我不认为他们认为自己在写软件。我认为他们在亲手接生一位神明。而我也不知道我更害怕哪个——监管俘获，还是我称之为弗兰肯斯坦博士理论的这第二种可能。"* ## [38:32] AI 主权、隐私新纪元、开源即将遭到打压？ Jason 提出「智能主权」是数据隐私的下一代概念。数据隐私关注的是谁能看到你的照片和消息。智能主权关注的是谁有权解释你的世界——塑造你信息获取的 AI 是一个带有特定政治哲学的中心化系统，还是你自己能掌控的东西。他点出一个悖论：中国共产党正在主导开放权重模型运动，而美国却在走集中化的路。 Chamath 以他的投资组合公司 Abacus 为例，说明财富 1000 强买家正在响应这种焦虑：他们需要一个可以在前沿模型之间热切换的控制平面，以及能消除对任何单一供应商服务条款依赖的本地部署方案。他举了一个具体案例——一家支持本国安乐死法律的加拿大医院，可能会被一家宪法中禁止此类内容的美国前沿模型服务商切断访问权限。Sacks 把各条线索串联起来，指向他一直在观察的监管威胁：监管俘获剧本最终会走向禁止开源或开放权重模型。理由是安全——开放模型让用户可以去除护栏。Gurley 在 P3 Institute 的文章中得出了同样的结论。如果禁令成真，美国实际上将把自己驱逐出开放生态，而世界其他地方——包括中国——继续运行在开放模型上。 > *"我认为这一切指向的，是一场禁止开源或开放权重模型的努力。有很多面包屑都在指向这里。"* ## [59:56] AI 就业大辩论：Dario 与 Sam Altman 改口，Goldman CEO 称不存在 AI 就业末日本章以本周叙事转变的新闻综述开场。Cloudflare 的 Matthew Prince、Meta 的 Zuckerberg、Block 的 Jack Dorsey、亚马逊的 Andy Jassy，都在宣布大裁员时将原因归结为 AI。但 Goldman Sachs CEO David Solomon 在《纽约时报》发表专栏，给出三点反驳：AI 会自动化 25% 的工时，而非 25% 的工作岗位；ATM 普及后银行柜员反而增加了；美国劳动力市场每年新增和消失 2500 万至 3500 万个岗位，总流动量远大于净损失。与此同时，《财富》报道 Dario Amodei 和 Sam Altman 双双收回了此前的末日言论——Chamath 指出，这个时机点与即将到来的、需要就业创造叙事的前沿实验室 IPO 密不可分。 Sacks 态度明确：他坚持反 AI 就业末日的非共识立场已超过一年，现在认为自己的判断得到了验证。耶鲁预算实验室发现，AI 浪潮三年来劳动力市场没有可察觉的颠覆迹象。软件工程——AI 唯一爆发性的应用场景——职位发布同比增长 15%，达到三年高点。4.3% 的失业率接近历史低位。他认为，大多数高调裁员都是「AI 洗」：在新冠期间过度招聘的 CEO 发现 AI 是早该进行的瘦身的现成借口。Jack Dorsey 和 Block 裁员 50% 一事，立刻被金融分析师指出，这家公司相比同行多年来一直处于超编状态——纯粹是 AI 洗。 Jason 提出反驳。他坚持认为出租车司机、卡车司机和快递分拣工——大约 2000 万美国工人——无论当前总体统计数据如何，都将在未来十年面临真实的结构性位移，并指责小组成员是精英主义："我们都是顶尖的人。这些人要失去工作，而且可能很长时间都找不到新工作。"他区分了短中期与长期：短中期他预计冲击会加速，但长远来看，由 AI 赋能的创业者涌现的寒武纪大爆发会催生全新的就业类别。讨论到最后，他的立场逐渐向 Sacks 靠拢——承认总体数据比他的个案判断要平和得多。 Gurley 用与 Leo XIII 讨论中同样的历史论证来收尾：从总体上看，创新创造的繁荣始终多于它所摧毁的。他给面临风险的人的实用建议：现在就在工具上超越同行；如果你的工作要消失，就规划转型——向蓝领技工方向（他推荐 MicroWorks，为水管工、焊工和电工提供免费奖学金），或者转向你真正热爱的事情。 > *"我认为保护自己免受 AI 冲击的最好方式，就是把自己变成所在领域最善用 AI 的那个版本。去了解它在你的领域能做什么，然后冲出去。"* ## 实体 - **Bill Gurley**（人物）：Benchmark 普通合伙人；《Running Down a Dream》作者；P3 Institute 创始人；代替 David Friedberg 出席本期节目 - **Jason Calacanis**（人物）：All-In 联合主播；天使投资人；LAUNCH 创始人；强调对工人的同理心和短期位移风险 - **David Sacks**（人物）：All-In 联合主播；Craft Ventures 创始人；本期最坚定地批驳 AI 就业末日论 - **Chamath Palihapitiya**（人物）：All-In 联合主播；Social Capital CEO；提出「智能主权」概念；Abacus 联合创始人 - **Dario Amodei**（人物）：Anthropic CEO；Gurley「弗兰肯斯坦博士理论」的核心分析对象；本周与 Sam Altman 一同收回了末日就业论 - **教皇 Leo XIV**（人物）：天主教教皇；发布《Magnifica Humanitas》，一份 235 页的 AI 通谕，警告技术集中的危险 - **David Solomon**（人物）：Goldman Sachs CEO；在《纽约时报》发表专栏，论证 AI 就业末日论言过其实 - **Anthropic**（机构）：前沿 AI 实验室；Gurley 监管俘获理论与「弗兰肯斯坦」理论的分析对象；Claude 的开发商 - **P3 Institute**（机构）：Bill Gurley 新创立的政策与公益机构；发文为开源 AI 辩护 - **Goldman Sachs**（机构）：投资银行；CEO 的《纽约时报》专栏成为本周反驳就业末日论的核心数据锚点 - **Abacus**（软件）：Chamath 通过 Social Capital 投资的企业 AI 基础设施公司，为财富 1000 强客户提供可热切换前沿模型的本地部署控制平面 - **智能主权**（概念）：Jason 提出的下一代隐私前沿——不再是谁能看到你的数据，而是哪个 AI 系统有权塑造你对世界的认知 - **弗兰肯斯坦博士理论**（概念）：Gurley 对 Anthropic 世界观的描述——高层员工相信自己正在接生一个神明或更高级的物种，而非在写软件，依据来自 Dario Amodei 的文章《仁慈机器》 - **监管俘获**（概念）：将自己塑造成「安全」AI 公司、放大公众恐慌、游说推动锁定既有巨头并打压开源竞争者的监管规则的策略

#anthropic#open-source-ai#ai-jobs

物理学最大谜题：反物质、暗能量与万有理论 — Don Lincoln | Lex Fridman Podcast #497

物理学最大谜题：反物质、暗能量与万有理论 — Don Lincoln | Lex Fridman Podcast #497

Fermilab 物理学家 Don Lincoln 与 Lex Fridman 展开近三小时的对话，把物理学描绘成一个长达四个世纪的统一工程：牛顿把天体引力与地面引力归为同一方程，麦克斯韦把电与磁熔为一体，爱因斯坦弯曲时空，标准模型将四种基本力中的三种合并。Lincoln 随后转向标准模型无法回答的问题——为何宇宙中存在任何物质、暗能量究竟是什么、暗物质是否终将现身于探测器之中。贯穿全程，他始终在"已测量到的"与"仍是精彩猜测"之间划出清晰界线，让人类知识的边界变得异常具体。 ## [00:00] 介绍 Lex Fridman 开篇将 Don Lincoln 比作具有 Richard Feynman 天赋的人——能把复杂想法剥回最核心的本质，却不失去其中的深刻之处。本集以此为框架，由一位在学科前沿工作了数十年的实验物理学家带领听众游历物理学最深层的开放性问题。 ## [00:49] 统一自然法则 Lincoln 用一条主线贯穿整部物理学史：统一。牛顿证明，月球向地球下落与苹果从树上坠落遵循同一个方程——"普遍"正是他的万有引力定律的关键词。麦克斯韦在 1860 年代做了结构上完全相同的事：看似毫无关联的电与磁，原来是同一种力的两张面孔，而他的方程自动预言了光以固定速度传播。Lincoln 从这个抽象发现一路拉到现代技术的实际应用："如果不能驾驭电，我们至今还是农民和鞋匠。" 对话进而展开基础研究为何在数百年后才有回报——Lincoln 认为，1900 年让人完全看不懂的核物理，如今已是人类文明可用的最强大能量来源。Lex 补充了更长远的想象：掌握反物质或暗能量，或许有朝一日能造出推进系统，让人类抵达其他星系。 > *"它有衍生成果。而且一个接一个。最大的衍生成果，就是我们整个科技社会。"* ## [15:20] 爱因斯坦、狭义相对论与广义相对论 Lincoln 梳理了爱因斯坦的 1905 奇迹年：狭义相对论建立在两个前提上——自然规律对所有人都一样，所有人测到的光速也一样，无论相对运动如何。第二个前提听来荒谬，但粒子加速器已直接证实：从高速衰变粒子发射出的光子，抵达探测器时速度仍精确等于 *c*。闵可夫斯基随后指出，爱因斯坦的方程意味着空间与时间是同一个对象的两个分量，即时空。广义相对论再进一步：爱因斯坦注意到，在火箭中自由下落与在引力场中的感受完全相同，由此推出引力根本不是一种力，而是质量造成的时空弯曲。Lincoln 认可闵可夫斯基在数学表达上的功劳，但坚持那个概念上的飞跃——质量弯曲空间本身的几何——属于爱因斯坦一人。他也为爱因斯坦晚年对量子力学的质疑辩护：那不是固执，而是有成效的批判，逼出了后来被实验验证的具体预言。 > *"我们都同意你的想法是疯狂的，但它够不够疯狂？"* ## [32:27] 电弱力到 1930 年代，物理学家已梳理出四种力：引力、电磁力、强核力和弱核力。后两种只在原子核内部起作用，这也是大多数人从未直接接触它们的原因。1950 年代末至 1960 年代，Glashow、Salam 和 Weinberg 证明，电磁力与弱力在高能量下是同一种力——电弱力。问题显而易见：电磁力穿越宇宙（我们能看到数十亿光年外星系的光），弱力却几乎不超出质子的范围，两者怎么可能是同一种力？ Lincoln 用一支落下的笔来演示：1964 年由 Peter Higgs 等人提出的希格斯场弥漫于整个空间。与它耦合的粒子获得质量；不耦合的，比如光子，则保持无质量。在早期宇宙的高温中，希格斯场为零，一切粒子都没有质量，各种力归于统一。随着宇宙冷却，希格斯场开启，打破了这种对称性——赋予 W 和 Z 玻色子质量，把电弱力分裂成今天熟悉的两个分量。希格斯场本身的振动就是希格斯玻色子：一个原本隐形的场的可探测激发态。 > *"在希格斯场里，振动就是希格斯玻色子。所以我们能做的，不是直接看到场，而是激发它、让它振动，然后探测振动。"* ## [44:09] 粒子对撞机的工作原理 E=mc² 不只是一句口号：动能可以转化为质量。把两个粒子以足够的能量迎头相撞，碰撞区域便能凭空产生全新粒子，且总是以正反物质对的形式出现。这正是对撞机所做的事。Lincoln 描述了 Fermilab 的级联加速器——五台机器像手动变速箱的齿轮一样依次咬合——以及 LHC 的 CMS 探测器的规模：21 米长、14000 吨重，每秒拍摄 4000 万次碰撞。数据缩减的挑战同样令人咋舌。LHC 每秒产生约十亿次质子碰撞。快速电子学将其筛到每秒 10 万次，商用处理器再削减至 1000 次，最后这 1000 条记录交给研究生，让他们从中寻找可能拿诺贝尔奖的极少数事件。Lincoln 对无缝调度全球 PB 级数据传输的工程师格外推崇，称他们是现代物理学中不为人知的英雄。 > *"在每秒 5000 万次可能的碰撞中，快速电子学和计算机挑出 1000 次，再通过分析软件交给研究生。"* ## [62:12] 希格斯玻色子的发现 Lincoln 当时同时在 Fermilab 的 Tevatron 工作并向 CERN 的 LHC 过渡——一个物理学家同时戴着两顶帽子，两边都想赢。Fermilab 已系统性地排除了大部分可能的希格斯质量范围；到 2012 年年中，他们已将其锁定在约 120 至 145 GeV 之间。就在 CERN 7 月 4 日宣布的两天前，Fermilab 确认：如果希格斯玻色子存在，它必定就在 Fermilab 尚未排除的那个区间里。CERN 率先抵达。 Lincoln 对 2012 年的公告措辞十分谨慎：那是一个与希格斯玻色子相符的粒子。超对称理论预测的是五个希格斯玻色子，而不是一个。此后多年，通过测量自旋（零）、衰变产物（底夸克、W 和 Z、光子）及其比率，证据才逐渐汇聚到 Peter Higgs 1964 年的原始预言上。Lincoln 认为，希格斯玻色子的发现不像爱因斯坦的工作那样是一场革命，但它是 50 年实验探索的最后一个句号——标准模型虽不完整，但在其适用范围内基本正确。 > *"这是一个句号，为大约 50 年的发现与探索画上了终点，我们终于能够说：标准模型虽不完整，但在其适用范围内基本是对的。"* ## [72:32] 万有理论大统一理论旨在将电弱力与强力合并；万有理论则要进一步把引力也纳入其中。Lincoln 直言：他看不到快速进展。统一所需的能量尺度约为 LHC 能达到的 10¹⁵ 倍，而加速器能量每 20 年只增长约七倍。按这条曲线外推，需要 500 年——而且摩尔定律不会永远成立。他对弦理论的批评不在于其错误，而在于目前无法验证。弦理论使用近似方程的近似解，其庞大的可能宇宙图景使其几乎无从预言。圈量子引力发展更为完善，并提出了可检验的预言——其最初关于光速应随波长变化的断言已被伽马射线暴观测所否定，理论随之修订。Lincoln 寻找万有理论的路径，不是从现有理论外推，而是对已经与预言不符的现象做精确测量。他的比喻：一个生活在肯尼亚的南方古猿，试图从眼前的稀树草原预测阿尔卑斯山、南极洲和抹香鲸——外推越远，预测与现实的偏差就越大。 > *"我认为，认为我们能做到——把预测推到比我们目前可见高出一千万亿倍的地方——这是人类傲慢的极致。"* ## [102:17] 真空的物理学 "真空"并不空。量子场论说，每一种粒子都对应一个充满整个空间的场，这些场始终在振动。以特定方式振动时，真实粒子出现；非共振振动则是虚粒子——短暂的激发态，却有可测量的效应。两个实验证实了这一点。卡西米尔效应：两块金属板相距微米时，被板间受约束的虚粒子与板外不受约束的虚粒子之间的压差推向彼此。反常磁矩：旧量子力学对电子磁矩给出一个预言值；把包围裸电子的虚粒子浴考虑进来，预言值偏移约 0.1%——而这个偏移后的预言与实验测量在 10 位有效数字上完全吻合。 > *"我们已将电子和μ子的磁性测到了 12 位——没错，12 位有效数字。理论与数据在前 10 位逐位吻合。"* ## [109:41] 反物质 Paul Dirac 在 1928 年尝试将量子力学与狭义相对论合并，得到的方程有两个解：+1 是电子，−1 是没人见过的东西。他坚持数学是对的。Carl Anderson 在 1932 年通过云室照片证实了正电子的存在。如今，CERN 能够制造并囚禁反物质氢，将其冷却到接近绝对零度，用激光激发并测量其谱线——结果与普通氢完全一致。2023 年的一项实验将反物质氢原子释放进一个容器，发现它们向下坠落，与正常引力一致，尽管测量精度尚不足以确认引力强度完全相同。更深层的谜题是：宇宙为何全由物质构成。通过清点星系数量与宇宙微波背景光子数，物理学家推算出：在早期宇宙中，每 10 亿个反物质粒子对应 10 亿零一个物质粒子。那 10 亿对湮灭了，多出来的那一个就是我们所见的一切。Fermilab 目前正在测试中微子与反中微子是否以略微不同的速率在各味间振荡——轻子起源机制——作为可能的解释，与日本的平行研究展开竞赛。 > *"在宇宙中存在的每 10 亿个反物质粒子对应 10 亿零一个物质粒子。那 10 亿对相互湮灭、消亡，而那多出来的一个，就是我们。"* ## [130:31] 暗能量 1998 年，天文学家原本打算测量引力制动宇宙膨胀的速度，却发现膨胀正在加速。驱动力是暗能量——一种排斥性的引力。爱因斯坦早在 1917 年就在场方程中加入了这个项，以维持宇宙的静态，后来哈勃发现宇宙在膨胀后将其去掉。1998 年，它重新回来了。暗能量究竟是什么，至今未知。最普遍的看法是，它是空间本身的能量密度。问题在于，量子场论预言的真空能量密度比观测值大约 10¹²⁰ 倍——物理学史上最糟糕的预言。Lincoln 指出，如果暗能量的密度在空间膨胀时保持恒定，那么宇宙总暗能量是在增长的，这倾向于支持空间是量子化的观点：随着宇宙扩张，新的空间量子不断涌现，每个量子携带固定能量，从而使密度作为一种涌现性质保持恒定。 > *"量子场论里显然有什么地方严重出错了。"* ## [134:20] 暗物质星系转得太快。星系团运动得太快。遥远星系的引力透镜效应比可见物质所能解释的更强。三项独立观测指向同一个结论：宇宙中约有五倍于可见物质的质量我们看不见。Lincoln 回顾了自己的心路历程：25 年前他怀疑问题出在牛顿定律上，两项观测改变了他的看法。子弹星系团——两个穿越彼此的星系团——显示引力畸变跟随星系走，而不是跟随停在中间的气体云，正是暗物质的预言。蜻蜓星系（DF2 和 DF4）完全按牛顿定律旋转，因为它们的暗物质似乎已被剥离——一个没有暗物质的星系，恰恰是暗物质真实存在的有力证据。尽管三十年来通过三种途径不断搜寻——地下直接探测、星系中心附近的伽马射线搜索，以及 LHC 的缺失动量信号——至今没有任何暗物质粒子得到证实。可能的质量范围从亚电子到小行星量级，跨度极大，而实验每次只能覆盖其中一小片，这也是 Lincoln 目前没有亲自参与暗物质实验的原因。 > *"我们已经排除了一些暗物质粒子候选，但问题在于可能质量的空间范围太广——从小行星质量到远轻于电子，以及这之间的一切。"* ## [162:56] 物理学的未来 Lincoln 成长于美国农村的贫困家庭，科幻小说和 Isaac Asimov、Carl Sagan、George Gamow 的科普书籍塑造了他。1980 年代中期，他选择粒子物理而非宇宙学，原因是粒子物理能让他真正测量东西。读研究生时，他从周一到周六早上八点工作到午夜，不是出于压力，而是因为他想不出还有什么更值得做的事。他在 YouTube 上发视频、写科普书，是一种刻意的努力，要触达那些身处爱荷华州或蒙大拿州、家里没有高学历长辈可以引路、却有着和他当年一样求知渴望的孩子。他已经收到消息，有 Fermilab 暑期实习生正是因为看了他的视频才来到这里。 Lex 以 Marie Curie 的话作结：*"生命中没有什么可怕的，只有等待理解的事物。"* > *"你的某位观众，也许就是那个能解答这些困扰无数聪明人数十年之谜的人。"* ## 实体 - **Don Lincoln**（人物）：Fermilab 高级科学家；1995 年顶夸克发现论文的共同作者；LHC 的 CMS 合作成员；著有《爱因斯坦未竟之梦》等多部科普书籍。 - **Lex Fridman**（人物）：MIT 研究员，Lex Fridman Podcast 主播，专注于科学、技术与哲学交汇处的长篇访谈。 - **Fermilab**（机构）：美国能源部粒子物理实验室，位于芝加哥附近；曾运营 Tevatron 对撞机；目前是全球最强大的中微子束流设施。 - **CERN / LHC**（机构）：欧洲粒子物理实验室，大型强子对撞机（LHC）的所在地；拥有 CMS 和 ATLAS 探测器；2012 年希格斯玻色子发现地。 - **标准模型**（概念）：描述四种基本力中三种以及所有已知基本粒子的量子场论；已被验证到极高精度，但不包含引力，也无法解释暗物质、暗能量或物质-反物质不对称。 - **希格斯场 / 希格斯玻色子**（概念）：一种标量量子场，其非零真空期望值赋予 W 和 Z 玻色子质量，同时保持光子无质量；希格斯玻色子是其可探测的激发态，于 2012 年 7 月 4 日在 CERN 被发现。 - **暗物质**（概念）：不可见质量，约占宇宙全部物质的 85%，由星系旋转曲线、星系团动力学和引力透镜推断而来；搜寻三十年，候选粒子尚未得到证实。 - **暗能量**（概念）：驱动宇宙加速膨胀的排斥性能量；量子场论对其量级的预言比观测值大 10¹²⁰ 倍——"物理学史上最糟糕的预言"。 - **重子起源 / 轻子起源**（概念）：试图解释早期宇宙为何产生物质超量的理论框架；Fermilab 的中微子计划正在通过比较中微子与反中微子的振荡速率来检验轻子起源机制。 - **弦理论 / 圈量子引力**（概念）：量子引力的主要候选理论；弦理论所需的验证能量比现有手段高出 10¹⁵ 倍；圈量子引力将空间本身量子化，已产生一些可证伪的预言。

#particle-physics#dark-matter#dark-energy

挑选 AI 赢家的法则 | The a16z Show

a16z 普通合伙人 David George 与 VenCap 首席投资官 David Clark 认为，AI 公司的扩张速度超过了以往任何一代技术企业——Anthropic 和 OpenAI 的月增收入已超越 Meta、谷歌或微软——而这项技术在更广泛经济体中的实际渗透率仍不足 5%。两人围绕这一差距展开讨论，推演其对退出规模、亏损率、泡沫风险以及随着 token 成本下降和前沿智能逐渐商品化，最终谁能获取价值等问题的意义。 ## [00:00] 开场开场列出三个数据点：Anthropic 和 OpenAI 的月增收入已超过任何超大规模云厂商；头部 1% 的退出规模在 24 个月内从 100 亿美元涨至 320 亿美元，翻了 10 倍；以及 David George 的判断——就目前而言，我们并不处于泡沫之中。 ## [00:38] 规模跃迁：Anthropic 与 OpenAI 的月增收入已超越超大规模云厂商 David George 解释了他的认知为何在 2025 年 11 月前后发生剧烈转变。此前，企业级 AI 看起来不过是类似云计算采用的生产力提升故事。此后，数字彻底重塑了天花板：Anthropic 和 OpenAI 已在超大规模云厂商量级上增长收入，而真正使用这些工具的经济体比例不足 5%。他用财富 500 强公司每年合计约 2 万亿美元的利润作为上限参照——两家最大模型公司年底前的营收运行率可能达到 2000 亿美元，已相当于这个利润池的 10%。 > *"把他们的收入增速已经超过超大规模云厂商这一事实，和经济体渗透率不足 5% 放在一起看，我认为最终的结果将会非凡卓越。"* ## [04:20] 企业级 AI 的仿形应用与原生应用之争 David Clark 援引 Chris Dixon 的仿形-原生演进框架：企业 AI 的第一波浪潮让人们用更高效的方式做原本的工作，原生浪潮则会重构工作本身。George 补充了一个细节——最好的公司尚未把重心放在内部自动化上。顶级工程师想做产品，不想自动化后台流程。他拜访过的最前沿公司目前还处于"文档化阶段"，把机构知识转化为 markdown，才能真正开始部署 agent。 > *"我接触过的、最努力推进这件事的内部团队，大概处于文档化阶段——把所有东西都变成 markdown 文件，尽可能多地沉淀上下文。"* ## [06:24] 最优秀的 AI 公司如何以不同的方式运营自身原生 AI 创始人的运转节奏截然不同。George 把他们与上一代 SaaS 公司对比：那一代事后看来效率低下，但靠着人员扩张的授权和不断增长的软件预算蒙混过关。新公司精简、进取，已经在用 agent 集群工作，而不是敲键盘。他描述走进一家前沿 AI 公司的场景：研究人员低声向麦克风说话，编排一群 agent，根本不用键盘。 > *"新公司非常精简，非常进取，他们随时都在工作。"* ## [08:14] 24 个月内，头部 1% 退出规模翻了 10 倍 Clark 展示了 VenCap 的追踪数据：2020 至 2024 年间，头部 1% 退出的门槛是 100 亿美元，2026 年 2 月更新为 200 亿美元，而就在录制前一天最新更新为 320 亿美元。随着 OpenAI 和 Anthropic 的 IPO 可能到来，他预计这一门槛到 9 月将突破 1000 亿美元。George 指出，这些头部私人公司的合计市值很可能已超过整个罗素 2000 指数，过去六年所有 VC 支持的 IPO 总和可能还不及预期中三笔大型 IPO 中的任何一笔。 > *"头部 1% 的门槛在哪里？如果再把 OpenAI 和 Anthropic 算进来，到 9 月我们可能会超过 1000 亿美元。"* ## [11:17] 半衰期问题：为何每年有 40% 的 AI 领头羊掉队 Clark 抛出一个令人不安的流失数据：福布斯 AI 50 榜单上，每年有 40% 的公司次年消失。谷歌不是第一个搜索引擎，Facebook 不是第一个社交媒体网站。AI 领域的先发优势正以比以往任何一个周期都更快的速度消退。George 证实 a16z 自身的认知也被反复颠覆——先是确信模型公司会垄断一切，后来又确信应用会接管，如今又看到模型公司向应用层延伸。他给出的唯一经得起时间检验的标准：公司必须处于 token 路径上。 > *"从去年到今年，榜单上 40% 的公司掉队了。"* ## [13:11] Token 路径、成本压力与价值归属企业买家已经感受到 AI 支出的成本压力，仅靠削减上一代软件预算根本无法覆盖。George 把价值归属的关键归结为一个基本上无法预知的变量：前沿模型公司的市场结构。两家实验室盘踞前沿意味着 token 价格更高、劳动力重组压力更快；五家实验室意味着价格更低、应用生态更广。同等能力的每 token 成本每年下降超过 10 倍，但 token 总支出的美元规模增长更快。Clark 补充，中国 LLM 的能力大约落后美国前沿水平六个月，但价格便宜 10 倍——这是经典的创新者困境格局。 > *"当前价值归属的最大驱动因素是一件完全无法预知的事——模型公司的市场结构究竟是什么？"* ## [17:00] 亏损率、风险与我们对早期阶段的思考 Clark 指出，历史上早期 VC 的亏损率约为 60%，但过去两年的 AI 投资组合亏损率只有个位数——从定义上就不可持续。George 重新定义了讨论框架：a16z 并不以低亏损率为目标。一家风投公司以从不亏损为骄傲，是"糟糕的数据点"——说明承担的风险太少。他的投资哲学是：在每个有顺风、有可信技术的赛道，支持处于市场领先地位的创始人。赛道跑出来且押注了领先者，皆大欢喜；赛道没跑出来但押注了领先者，在预期之内。真正的失败只有一种：赛道跑出来了，但押错了人。 > *"我们常开玩笑——我们生态里有一位知名 VC，他最引以为豪的是从没在一笔交易上亏过钱。我们的反应是，这不是什么骄傲的事，是一个糟糕的数据点。"* ## [22:51] 我们处于 AI 泡沫之中吗？ Clark 指出，经典泡沫的特征是供应过剩摧毁经济逻辑——但眼下的约束恰恰是供给稀缺：大规模数据中心容量要到 2028 年底或 2029 年初才能交付，美国建设进度已落后一年，社区阻力还在进一步拖慢节奏。George 坦然表示目前不存在泡沫，对数据中心阻力的批评也毫不客气。他唯一担心的情景是意外的算法突破带来更小、更高效的模型——届时供给可能从稀缺翻转为过剩——但他认为这在短期内不大可能发生。 > *"我很有把握地说，我们现在不在泡沫里。我对三年后的情况就没那么有把握了。"* ## [27:36] SpaceX、OpenAI 与 Anthropic IPO 对公开市场意味着什么 Clark 问公开市场能否消化即将到来的万亿美元量级 IPO。George 认为这毫无疑问是好事：过去 20 年公开上市公司数量减少了一半，而今天在数据中心供应链之外，公开市场上几乎没有任何公司增速超过 30%。让高速增长的公司进入指数，能让散户投资者——包括他父母的指数基金退休账户——获得对经济体最活跃部分的敞口。他预计届时会有一些持仓调整来腾出空间，但不担心出现消化不良。 > *"如果把数据中心供应链排除在外，公开市场上几乎没有几家增速快的公司可以买。"* ## [29:59] AI 时代风险投资的未来 George 认为未来五年 VC 格局的走向，主要取决于 token 市场结构——实验室是保持集中还是走向商品化。他引用比尔·盖茨的平台公理：平台的价值，在于构建其上的公司合计价值超过平台本身。如果这是未来，他对在智能之上涌现出一大批有价值的应用公司持乐观态度。他还指出消费端是最被低估的机会：过去十年的消费互联网，是用户时间被大型科技公司蚕食的故事；AI 驱动的消费者注意力转移，可能重新创造出孕育跨代消费公司的条件。 > *"我非常乐观，我们将迎来一大批构建在 token、AI 与智能之上的极具价值的公司。"* ## 实体 - **David George**（人物）：a16z 普通合伙人，负责成长期与早期 AI 投资，ChatGPT 发布前已投资 OpenAI - **David Clark**（人物）：VenCap 首席投资官，从事 VC 基金投资 34 年，持续追踪 AI 创业公司业绩与 VC 市场动态 - **Anthropic**（机构）：前沿 AI 实验室，与 OpenAI 并列被引为月增收入超越超大规模云厂商的典型 - **OpenAI**（机构）：前沿 AI 实验室，规模基准与预期超 1000 亿美元 IPO 浪潮的代表 - **VenCap**（机构）：母基金投资机构，发布头部 1% 退出门槛数据并追踪福布斯 AI 50 名单流失情况 - **Andreessen Horowitz / a16z**（机构）：风险投资公司，ChatGPT 发布前已投资 OpenAI，正在扩建平台服务以支持在生命早期就面临大公司挑战的企业 - **Cursor**（软件）：AI 编程工具，被引为营收已达数十亿美元、但仍处于早期阶段的小体量公司的典型案例 - **Token 路径**（概念）：a16z 评估 AI 公司的核心标准——公司必须处于 AI 推理 token 流动的链路上，才具有持久的经济价值 - **仿形 AI 与原生 AI**（概念）：Chris Dixon 提出的框架，区分以 AI 辅助复制现有工作流的应用与将工作流从根本上围绕 AI 能力重构的原生应用 - **半衰期问题**（概念）：David Clark 对 AI 领头羊快速更迭现象的描述——福布斯 AI 50 榜单每年有 40% 的公司掉队，表明先发优势的消退速度超过以往任何一个技术周期

#ai-investing#venture-capital#large-language-models

24:59

EN/ZH

点开看双语

Sequoia Capital大约 1 个月前

Neuralink 的 DJ Seo：连接大脑与 AI 的竞赛内幕

在 AI Ascent 2026 大会上，Neuralink 联合创始人兼总裁 DJ Seo 与红杉资本合伙人 Shaun Maguire 对谈，直接呈现公司现状：20 余名 Telepathy 患者已能靠意念操控电脑和机械臂；Blindsight 处于临床前测试阶段，有望在 2026 年底获准用于人体；公司从一开始就照搬了 Elon Musk 在 SpaceX 验证过的第一性原理制造哲学，把手术机器人当火箭来造。DJ 认为这项技术的真正天花板不是光标控制或语音合成，而是概念在大脑与机器之间的直接、无损、多模态传输——AI 终将成为叠加在人类边缘系统之上的新皮层——而规模，这个开启 LLM 时代的同一个变量，是现在唯一剩下的门槛。 ## [00:00] 开场介绍 Shaun Maguire 宣布正式访谈前先播一段两分钟的 Neuralink 患者视频，请观众待在旁边，因为接下来要看的东西足以证明：公司已经跨越了最难的那道坎——把失去的自主能力还给需要它的人。 ## [00:21] Telepathy 患者故事视频呈现了四位接受 Telepathy 植入后人生改变的患者。一名四肢瘫痪的患者描述靠意念移动光标的瞬间："我在想，光标就在屏幕上动了，把我惊到了。"一名因 ALS 失去语言能力的患者通过植入设备重新开口说话："我在用意念跟你说话。"还有一名患者说，植入改变了儿子对他的看法："别的爸爸能做的事我做不了，但现在他觉得我能做别的爸爸做不到的事，这太酷了。" > *"植入前，我完全锁闭，无法开口，四肢瘫痪。现在我只靠思考就能控制电脑，这给我带来的回报是巨大的。"* ## [01:06] Convoy 机器人：独立行动视频转向 Convoy，Neuralink 的辅助机器人团队，目标是把脑机接口的控制范围从屏幕延伸到现实世界的物理操作。一名运动功能持续退化的患者只靠神经意图驱动机械臂沿各个轴向移动："能再次用手臂做出动作，那种感觉真的太好了。"另一名被 ALS 夺走声音的患者 Kenneth，在视频中实时用系统合成的语音说话，发出的是大脑信号而不是声带。 > *"以为永远失去的功能重新回来了，这实在是太改变人生了。"* ## [02:04] Blindsight 视觉恢复视频预告了 Neuralink 的第二条产品线 Blindsight，面向双眼或视神经功能完全丧失的患者。外部摄像头捕捉场景，设备通过电刺激直接将信号写入视觉皮层，产生磷光感——人工构造的光点像素。患者 Audrey 被问到感受时只说了两个字："改变人生。"视频以患者说"全靠我的意念"收尾。 > *"这项技术的未来几乎没有上限……我们正在探索把它应用到大脑各个区域的方式。"* ## [03:10] 视频结束后的感触 DJ Seo 与观众一起看完视频后，第一个开口："视频开始前我们还在开玩笑，但说真的，那段视频让我红了眼眶。"他把这项工作形容为世界上最鼓舞人心的项目之一——不是因为技术里程碑，而是因为团队把患者已经当作永久失去而接受了的东西还给了他们。Maguire 表示认同，随即把话题引向创业故事。 > *"这是世界上最鼓舞人心的项目之一。他们做的事情极其艰难，但他们在真真切切地拯救生命。"* ## [03:31] 创业起源与 AI DJ 把 Neuralink 的创业洞察归结为一个瓶颈：人类输出带宽与 AI 能力之间的错配。2016 年公开说这件事"听起来像疯子"，但逻辑从未改变。他的路径是：从小着迷于大脑，在加州理工读本科时专注于微型低功耗电子，在伯克利读博期间研究如何把实验室级神经系统缩小到可部署的规模。博士快结束时遇到 Elon Musk，这个项目的规模和野心让他无法拒绝。他把大脑定义为"我们每个人随身携带的最有趣的计算装置"，也是"人类迄今所知的唯一一种通用智能"。 > *"当时最核心的洞见，就是人类输出端与 AI 能力之间的 IO 瓶颈。"* ## [06:31] 规模化与垂直整合 Maguire 追问聪明人对 Neuralink 最大的误解是什么。DJ 的回答是：大多数人知道植入设备和神经解码算法，但几乎没人意识到公司从第一天起就在同步搭建制造体系和手术机器人基础设施。他把这归结为"Elon 的魔法"——对垂直整合的坚持，让 Neuralink 掌控从芯片设计到工厂生产线再到机器人手术部署的每一层。目标不是小众医疗设备，而是规模可比 LASIK 的手术，最终服务数百万乃至数十亿人。先把这套能力建起来，进度会显得很慢，直到"冰山露出水面"，放量几乎是瞬间发生的事。 > *"垂直整合是 Neuralink 和 Elon 旗下公司的命脉，也是我们能把设计、开发、部署的迭代循环跑得这么快的根本原因。"* ## [09:27] 照护者与使命感被问及哪位患者最让他感动，DJ 拒绝挑一个——他说，震撼不只来自患者，也来自照护者：Nolan 的母亲 Mia、Brad 的妻子 Tiffany、Ken 的妻子 Cheryl。他形容这是"关于爱、牺牲和坚韧的真实人类故事"。然后他做了一个他称之为"哲学小弯路"的阐述：他的核心信念是，帮助他人能带来巨大的满足感，因为自我与他人之间的距离，并不比此刻的自己与过去或未来的自己之间的距离远多少。正是这个信念，让他和 Neuralink 许多人每天保持动力——他们在为那些已经放弃康复希望的人"点燃希望之火"。 > *"我个人，以及 Neuralink 的很多人，在帮助那些完全无力自助的人时，感受到了极大的满足感。"* ## [13:10] 脑机接口遇上 AI 的未来 Maguire 抛出这场对话的核心问题：脑机接口和 AI 将怎样交汇？DJ 给出两个时间尺度的答案。近期，系统把神经意图转化为传统界面输出——键盘、鼠标、语言——这已经在运转。真正的突破，他认为"并不遥远"：完全绕过这些传统界面，直接在原始神经意图上做计算。他指出 Transformer 架构本身就是存在性证明：只要有足够的规模，没有任何原理性障碍阻止它学习神经系统的潜在流形。Neuralink 已经在用 20 名参与者的神经记录数据微调 LLM 级模型，并发现了"非常反直觉"的规律。他给出的技术天花板是"概念的直接、无损、高保真、多模态传输"——《黑客帝国》里"我学会了功夫"的时刻，甚至可能更远。他还分享了一个从 Musk 身上学到的思维工具："全绿灯时间表"——一种第一性原理的强迫函数，剥掉所有人为的约束，只问如果每一盏灯都是绿的，一件事最快能做多快。他估计，硬件开发中 80% 到 90% 的"约束"只是惯例，不是物理定律。 > *"如果认真想这项技术的终极天花板，我认为是概念的直接、无损、高保真、多模态传输。"* ## [21:05] 观众问答最后四分钟三个问题。关于产品节奏——何时深耕现有产品、何时拓展新方向——DJ 解释了"登陆滩头再扩张"的策略：从一开始就把每套系统做得足够通用，这样运动皮层的监管审批就能成为视觉皮层的模板。第一个审批最难；之后每一个都借助已建立的临床安全记录走更快的补充申请通道。关于面向健康用户的增强应用，DJ 把一切都框在获益-风险比上：对四肢瘫痪患者来说这道算数很清楚；对健康用户而言目前还不明朗，但他指出，一旦产品获批，超适应症使用在法律上是允许的，只要能找到神经外科医生并自费支付。关于意识难题，他给出一句话回答：如果能植入新的感觉并定量测量主观反应，也许就找到了量化意识本身的路径。Maguire 以"世界上最鼓舞人心的公司之一"结束全场。 > *"如果能植入新的感觉，或许就有办法定量理解这件事。"* ## 实体 - **DJ Seo**（人物）：Neuralink 联合创始人兼总裁；伯克利微型电子学博士；在博士末期与 Elon Musk 相遇后加入 - **Shaun Maguire**（人物）：红杉资本合伙人；AI Ascent 2026 炉边对话主持人 - **Elon Musk**（人物）：Neuralink 联合创始人；"全绿灯时间表"与垂直整合哲学的提出者，同样贯穿 Tesla、SpaceX 和 Neuralink - **Neuralink**（组织）：2016 年成立的脑机接口公司；产品包括 Telepathy（运动假肢）和 Blindsight（通过视觉皮层刺激恢复视力） - **Telepathy**（产品）：Neuralink 首款商业产品；让瘫痪患者通过神经意图解码操控电脑及机器人设备 - **Blindsight**（产品）：Neuralink 第二条产品线；为双眼或视神经完全丧失的患者直接向视觉皮层写入信号来恢复视觉；截至 2026 年中仍在临床前测试阶段 - **IO 瓶颈**（概念）：人类输出带宽（语言、打字、手势）与 AI 处理能力之间的错配；Neuralink 立项要解决的根本问题 - **神经基础模型**（概念）：用神经记录数据微调的 LLM 级 Transformer 模型；Neuralink 正在 20 名参与者的规模上构建，并在神经潜在空间中发现反直觉规律 - **全绿灯时间表**（概念）：Elon Musk 的第一性原理工程纪律——剥除所有人为约束，只问物理极限；DJ 估计硬件开发中 80% 到 90% 的延误都是惯例而非物理定律所致

#brain-computer-interface#neuralink#ai

Opus 4.8 为何让我重回 Claude

Every CEO Dan Shipper 在 Opus 4.8 发布当天交出即时测评，直言 Anthropic 完全可以叫它 Opus 5。这个模型在 Every 的资深工程师基准测试中比 Opus 4.7 高出 30 分，以微弱优势超过 GPT-5.5，写作测试拿到 79.6 分对比 GPT-5.5 的 73 分，也是第一个能一次性生成真正合格 PPT 的模型。两个短板给热情降了温：推理强度低于"极高"档时表现明显下滑，Claude 桌面端的使用体验依然不及 Codex 整洁。 ## [00:00] 什么是 Every Every 是一家 30 人的 AI 应用实验室，同时也是专注于 AI 与未来工作的媒体平台。Dan 先介绍 Every 订阅的内容——写作、课程、自研 AI 工具一站式收录，网址 every.to——随即切入 Opus 4.8 评测正题。团队提前一周拿到内测资格，接下来的内容都是实际使用后的发现。 > *"Every is the only subscription you need to stay at the edge of AI."* ## [01:07] Anthropic 归来：Opus 4.8 的核心论据 Opus 4.7 发布后，Dan 基本放弃了 Claude——太慢、难以深度使用，Codex 和 GPT-5.5 几乎接管了他日常 90% 的工作。连 Every 内部最铁杆的 Claude 用户也开始转向。Opus 4.8 打破了这个趋势：在 Every 的资深工程师基准测试中拿到 63 分，比 Opus 4.7 高 30 分，比 GPT-5.5 高 1 分；写作测试同样登顶；Dan 第一次看到一个模型能一次性生成他愿意真正使用的 PPT。Every GM Kieran Klaassen 的评价是"他用过的最像人类的模型"。唯一持续的摩擦点是 Claude 桌面端本身。Codex 快、简洁、体验流畅；Claude 端更像三个独立团队拼出来的产品——聊天标签、代码标签、协作标签各自为政，每次进去都不确定该打开哪个。Dan 现在开始在两个应用之间来回切换，这是之前从未发生的事。 > *"But honestly, they could have called it Opus 5 cuz this is a really great model."* ## [05:02] 触达测试：Every 团队的范式转移评分 Every 的触达测试核心只有一个问题：遇到难题时，你会主动打开这个模型吗？Dan 给出金/绿评级——范式转移级别的质量，因为 Claude 端体验只能算"还行到不错"扣了一档。每天同时运行 50 个 agent 的 Kieran 直接给出纯金范式转移，这是团队极少见的最高评级。资深撰稿人、长期 Claude 用户 Katie Parrot 给绿色，她的工作在 Opus 4.8 和 Codex 之间平均分配。 > *"It's very rare to give a paradigm shift grade to a model. So I would pay attention to this."* ## [06:32] 基准数据：编程与写作的具体数字编程方面，Opus 4.8 在资深工程师基准测试中拿到 63 分——测试方式是把一个 vibe-coded 代码库交给模型，要求从头重写，再与两位人类资深工程师的重写结果对比评分（人类通常在 80 到 90 分段）。GPT-5.5 拿到 62 分。在 Kieran 的 LFGbench（覆盖 SaaS 构建、电商网站、3D 游戏场景等真实任务）上，Opus 4.8 写出的代码兼具技术严谨性和创意感——"舒适岛屿"3D 场景比 GPT-5.5 更丰富、更有生命力。写作方面，Opus 4.8 在 Every 内部写作基准中拿到 79.6 分（满分 100），涵盖文章开头、推广邮件、段落续写等场景；GPT-5.5 是 73 分。差距主要体现在 AI 痕迹：在高和极高推理档，Opus 4.8 产出的文字听起来更不像机器。给它一段你自己写的文字，它续写时的风格贴合度超过 Dan 测过的所有模型。 > *"Opus 4.8 scores a 79.6 out of 100 on the writing benchmark. GPT 5.5 is 73."* ## [08:57] 情绪智能、知识工作与最终结论 Dan 用这个模型处理人际和管理问题——梳理决策、质疑自己的思维框架。Opus 4.8 的思维链显示它在回答前真的在遍历各种可能性，而不是直接迎合你的判断，这让它更像一个有用的思考伙伴。知识工作方面，代码和写作在同一个对话线程里无缝切换，PPT 的生成质量是 Dan 第一次愿意直接拿出手用的成果。最终结论：如果你本来就是 Claude 的拥趸，这个模型不会让你失望。如果 Codex 已经把你抢走了，至少把 Opus 4.8 加入工具箱——用它处理写作和知识工作，值得切换。端体验的差距是真实存在的，但模型本身是真的强。 > *"If you've been converted to Codex, I highly recommend you at least add it as part of your arsenal."* ## 实体 - **Dan Shipper**（人物）：Every 联合创始人兼 CEO；本视频主讲人，Opus 4.8 的主要评测者。 - **Kieran Klaassen**（人物）：Every GM，负责 Kora 业务；对 Opus 4.8 给出触达测试最高分——纯金范式转移。 - **Katie Parrot**（人物）：Every 资深撰稿人；给出绿色评级，工作在 Opus 4.8 和 Codex 之间分配。 - **Every**（组织）：专注于 AI 与未来工作的应用型 AI 实验室兼媒体订阅平台。 - **Anthropic**（组织）：Claude 和 Opus 4.8 的开发商。 - **Opus 4.8**（软件）：Anthropic 最新 Claude 模型，本视频测评对象。 - **GPT-5.5**（软件）：OpenAI 模型，全程作为主要对比基准。 - **Codex**（软件）：OpenAI 编程 agent；以简洁桌面端体验著称，是本视频中 Claude 日常主力地位的主要竞争者。 - **资深工程师基准测试**（概念）：Every 自研编程评测——把 vibe-coded 代码库交给模型从头重写，对照人类资深工程师的重写结果打分。 - **LFGbench**（概念）：Kieran Klaassen 设计的真实场景编程基准，涵盖 SaaS 构建、电商网站和 3D 场景生成。

#claude#opus-4-8#llm-benchmarks

1:43:32

EN/ZH

点开看双语

The Diary Of A CEO大约 1 个月前

紧急辩论：他们在AI、伊朗战争和未来走向上对我们撒了谎！

《鲨鱼坦克》投资人 Kevin O'Leary 与 Young Turks 联合创始人 Cenk Uygur 展开长达103分钟的正面交锋，话题涵盖AI究竟会解放还是摧毁美国经济、美伊战争为何拖而不决、以及谁在2028年真正有望胜选。O'Leary 全程守住乐观派阵地——AI创造新工作、市场终将适应、中国才是真正威胁；Uygur 则紧扣一条贯穿始终的主线：AI驱动的大规模失业叠加以色列游说集团主导的对外政策，正把美国引向冰山，而整个体制对撞击的到来毫无准备。 ## [00:00] 开场开场片段直接点明辩论的赌注。Uygur 开门见山：各公司正竞相裁减10%至25%的员工以保持竞争优势，一旦整体经济同步这样做，结果将是大萧条而非衰退。O'Leary 的回应——"哇，Jake今天真是个扫兴鬼。我们谈论的这是多么难以置信的机会"——奠定了接下来一小时四十分钟里贯穿全场的基调。Bartlett 表示自己的目标是让两位立场截然相反的认真思考者正面碰撞，从而逼近真相，而不是一场吵架。 > *"所有人都在争相裁掉10%到25%的员工，但10%的失业率将比我们这一生中发生的任何事情都要糟糕。"* — Cenk Uygur ## [02:35] 为何十分之七的美国人反对AI数据中心 Bartlett 援引民调数据：十分之七的美国人反对在本地建设AI数据中心。O'Leary 点名具体罪魁：通过法证审计员和IRS 990申报文件，他追踪到中国资金经由一个名为Arabella的网络——通过Neville Singum——流入犹他州的反数据中心运动，其中甚至包括对其高管的死亡威胁。他已将90页IP数据移交白宫。Uygur 驳回中国阴谋论，将矛头转向更直接的民怨：数据中心推高了教堂、图书馆和社区中心的电费，弗吉尼亚州便是先例，建设方要么自带电力，要么向公众让渡股权。 > *"我有确凿证据证明，中国正在干预美国每一个新建电力项目的推进，遍及每个州、每座城市。"* — Kevin O'Leary ## [07:24] AI为何可能引爆经济崩溃与UBI危机 Uygur 的核心经济论点在此落地。他认同能源成本问题，并表示任何接入公共电网却不予补偿的数据中心都是在占公众便宜——以2008年救市为前车之鉴，不能再走那条路。他更大的警报是大规模失业：每家公司同步裁员10%至25%，汇总起来将摧毁消费支出，引发大萧条。Sam Altman、Elon Musk 和 Dario Amodei 均已公开表示大规模岗位替代即将到来，但没有任何政府制定了应对计划。O'Leary 反驳：美国200年历史上每一次技术颠覆，创造的机会都多于摧毁的，暂停AI发展只会把领先位置拱手相让给中国。 > *"当我们撞上冰山，我们不会有任何准备，那将是一场史诗级的灾难。到时候不会有人来买你的商品，因为员工同时也是消费者。"* — Cenk Uygur ## [15:30] AI创始人是否在向公众隐瞒真实风险 Bartlett 朗读了几段公开引述：Sam Altman 在2021年表示AI将取代大多数工作；Musk 在2024年表示我们中可能没有人会有工作；Amodei 在2025年警告，AI可能在五年内消灭半数初级白领岗位，推动失业率升至20%。他问道：如果构建这些系统的人已公开表示自己的产品会造成社会危害，为何还要认为他们在夸大其词？O'Leary 援引了Amodei 声明的另一半——若不在六个月内建立算力，中国的Deepseek就会追上来——并主张真正的选择在于引领颠覆，还是将其拱手相让给北京。Uygur 承认竞赛无可避免，但坚持认为今天被裁员的程序员已经撞上了冰山，而每年3.6万美元的UBI对比此前12万美元的年薪，是一次残酷的降级。 > *"我们能否以负责任的方式推进这场竞赛，真正服务于美国的选民和公民，而不是仅仅服务于AI公司的高管和股东？我希望可以，但我们迄今为止没有朝这个方向迈出哪怕一步。"* — Cenk Uygur ## [23:55] AI是否可能以负责任的方式构建，还是根本做不到 Bartlett 追问负责任发展AI的具体方案。Uygur 给出他的结构性诊断：合法化的贿赂——Citizens United 案和 Buckley v. Valeo 案——确保了捐款最多的AI公司能获得量身定制的监管框架。国会不会为选民立法，只会为捐款人行事。O'Leary 认为被裁掉的岗位大多是企业过度招聘造成的冗余，而AI公司目前是在烧钱，并非在揽钱。他以自己在犹他州的数据中心为例：9年间提供4000个建设工作岗位，另有2000个工程职位，没有占用一亩农田。对于Uygur 的社会主义警告，O'Leary 不以为意：把税率推过50%，富人就会搬去摩纳哥或佛罗里达，法国已经验证过这一点。 > *"如果你不这样做，叉子就要来了。我不是那种拿叉子的人，我信奉非暴力，永远如此。但我认为人们根本没有意识到愤怒已经到了什么程度。"* — Cenk Uygur ## [32:11] AI正在悄悄摧毁就业 Bartlett 分享了自己的亲身经历：他现在招募初级员工几乎完全以AI能力为标准，因为一个精通AI的应届生表现相当于5至10倍，没有AI能力的候选人实际上已被排除在外。O'Leary 反驳——工程师被雇来解决问题而不是写代码，AI只是给了他们更快的工具；大多数科技裁员是对过度招聘的修正，而非AI替代。Uygur 不认可这种说法：华尔街分析师为每一次裁员公告鼓掌叫好，称之为"协同效应"，裁员消息一出股价就涨，但没有人在财报会议上追问一旦工人消失了谁来买产品。他还提出一个被低估的风险：历史上大量失业的年轻男性往往与犯罪和冲突高度相关。 > *"当你有大量失业的年轻男性无所事事，通常发生的都不是好事：战争爆发，犯罪率上升。我们必须做好准备。"* — Cenk Uygur ## [37:35] 大规模失业为何可能比预期来得更快 Bartlett 描述了他对旧金山一家机器人加速器的走访：每个团队都已从软件转向实体机器人，因为智能——过去那个缺失且昂贵的要素——现在几乎分文不值。他请两位嘉宾说说自己可能错在哪里。O'Leary 拒绝接受失业的设定，转而谈到NASA永久月球基地和火星计划将创造数十万个高薪工作岗位。Uygur 将其命名为"过渡期难题"：即使O'Leary 的乐观情景在20年后成真，克利夫兰那位61岁的流水线工人也无法转型成为火星工程师。Bartlett 补充道，Uber CEO 曾私下告诉他AI将取代940万名司机——当被问到这些司机将何去何从时，对方的回答是："我不知道。" > *"机器人的零部件几十年前就在了，我们一直都有。我们缺少的、也是最昂贵的部分，是智能。"* — Steven Bartlett，转引其联合创始人的话 ## [46:32] 广告赞助商时段，涵盖 Stan（AI社交媒体内容工具）、Pipedrive（CRM）和 Cometeer（咖啡）。无实质性辩论内容。 ## [48:40] 以色列、伊朗与中东真正发生了什么辩论转向地缘政治。Bartlett 提及特朗普持续下滑的支持率，请 Uygur 解释这场战争。Uygur 的回答长达近25分钟，贯穿一条主线：这场战争100%服务于以色列利益，0%服务于美国利益。他追溯了 Adelson 家族向特朗普竞选捐出的3.17亿美元，指出以色列游说集团向国会94%的议员捐款，AIPAC 同时是特朗普、Biden、Hakeem Jeffries、Chuck Schumer 和 Mike Johnson 的头号终身捐助方，并主张以色列自9/11以来已实质上将七场战争外包给美国承打——伊朗是名单上最后一个。他说，伊朗从未拥有能打到美国的投送系统，铀浓缩从未超过60%（武器级需达90%），前大阿亚图拉还就核武器发布过宗教裁决。与此同时，以色列已占领黎巴嫩南部并计划长期驻守，内塔尼亚胡更公开要求以和平条件，以色列单方面保留对黎巴嫩持续攻击的权利——这意味着任何协议都永远无法达成。O'Leary 则从另一角度定性伊朗政权：15万人60年来统治和压迫9000万人，这样的政权不能被允许拥有核武器；而中国对霍尔木兹海峡畅通的依赖，最终将迫使北京向德黑兰施压就范。 > *"100%以色列利益，0%美国利益。我们应该撤出那里，停止替以色列打仗，回到自己家。"* — Cenk Uygur ## [01:11:59] 特朗普是否低估了这场冲突的持续时间 Bartlett 直接问O'Leary：特朗普是否低估了冲突的时长。O'Leary 称这是第一场真正意义上的"科技战"：3.5万美元的碳纤维割草机引擎无人机，正被120万至300万美元的美国导弹拦截，这一成本不对称暴露了美国需要弥补的算力差距。他认为不会出现地面入侵，只有持续的空中打击，直到伊朗领导层算清楚封锁海峡的代价——每天损失2.1亿美元收入——是否高于坚守的收益。他的预测：中国会在美国中期选举前逼出一份协议。 > *"代价如此高昂，是因为我们站在了防御的错误一侧。我们需要廉价无人机。"* — Kevin O'Leary ## [01:15:47] 广告赞助商时段，涵盖 Pipedrive（CRM）和《CEO日记》对话卡。无实质性辩论内容。 ## [01:18:08] 美国为何正在迅速失去耐心 Bartlett 点出关键筹码：如果伊朗领导层知道特朗普在中期选举前只剩几个月、之后便是2028年大选，为何要现在谈判而非坐等对手虚弱？O'Leary 补充了第二个制约因素——中国最高领导人也需要海峡畅通来维持经济运转和执政稳固，所以伊朗同时服侍着两个主子。Uygur 认为协议文本早已拟好：伊朗将高浓缩铀移交国际监督机构，美国解除封锁，海峡重开。协议每次都在内塔尼亚胡打给特朗普后崩塌——对方又附加上不可能达到的新条件：立即解除武装、加入《亚伯拉罕协议》。Uygur 指出，每一位公开反对近期停战提案的政客，都从以色列游说集团处收受了逾百万美元捐款。他进一步将视野拓展至全球：当俄罗斯在乌克兰流血，美国在伊朗流血，中国却在非洲和拉丁美洲修路建桥，一分战争的钱也不花，只靠对比就在积累影响力。 > *"每次与内塔尼亚胡通话之后，特朗普都会从'我们将实现和平'变成'我们不会有和平，还要附加这些新的不可能条件'。这种情况迄今已发生约六次了。"* — Cenk Uygur ## [01:29:08] 我们是否正在亲眼目睹社会主义的崛起 Bartlett 援引盖洛普数据：美国人对资本主义的正面评价降至历史最低，70%的民主党人对社会主义持正面看法，62%的年轻美国人对社会主义表示支持——而这还是在战争的经济影响完全显现之前。O'Leary 认为这是周期性现象：美国每隔17至20年就会经历一轮社会主义情绪，而每当年轻的理想主义者收到第一张工资单、看清税收后，这股情绪总会消散。他指出，全球主权财富基金中52美分的每一美元都流向美国，而非古巴，也非俄罗斯。Uygur 彻底拒绝这种框架：美国早就在为企业实行社会主义——向盈利的石油公司提供补贴、拒绝与联邦医保谈判药价、每个行业都通过竞选捐款俘获了自己的监管机构。真正的任务是回归真正的自由市场，而这首先需要把金钱赶出政治。 > *"我们能回到资本主义就算走运了，更别提走向社会主义，因为我们现在根本没有资本主义——我们有的是权贵资本主义。"* — Cenk Uygur ## [01:34:06] 下届总统大选谁真正占据优势 O'Leary 不愿预测赢家，但表示民主党需要一位温和中间派；他以加利福尼亚州作为进步派执政失败的案例。Uygur 则抛出一个让他意外的具体预测：Tucker Carlson 是唯一可能赢得2028年大选的共和党人。共和党选民热情已被彻底摧毁，中期选举将会失守，而到2028年AI失业和伊朗战争的叠加效应将已完全显现。O'Leary 起初发笑，随后在镜头前收回了笑意：Carlson 拥有庞大的社交媒体基础，经营自己的独立媒体网络，并在包括AI在内的问题上持越来越独立的立场。Uygur 最后点名 Rohana 是最有望赢得全国大选的进步派候选人，并为"民主资本主义"背书——私营市场受运转良好的民主制度约束，以北欧国家为现实样本，有别于当下美国实行的权贵资本主义，也有别于当前所畏惧的社会主义。 > *"他们只有一个人能赢，而我为此感到担忧，那就是 Tucker Carlson。如果 Tucker 参加共和党初选，他肯定赢。你可以引用我这句话。"* — Cenk Uygur ## 实体 - **Kevin O'Leary**（人物）：《鲨鱼坦克》投资人，O'Leary Ventures 董事长；主张AI创造机遇，为数据中心建设辩护，追溯反AI运动背后的中国资金，并预测中国将在美国中期选举前逼迫伊朗达成协议。 - **Cenk Uygur**（人物）：Young Turks 联合创始人，进步派评论员；主张AI失业无人筹谋应对，美国外交政策受以色列游说集团驱动，美国政治体制已被合法化贿赂腐蚀。 - **Steven Bartlett**（人物）：主持人，《CEO日记》；企业家和投资人；主持辩论并以亲身招聘决策和机器人实验室见闻为辩论提供了真实的商业背景支撑。 - **AIPAC / 以色列游说集团**（组织）：被 Uygur 点名为美国两党绝大多数资深政客的头号终身捐助方；是其主张美伊战争为何拖而不决的核心论据。 - **Arabella / Alliance for a Better Utah**（组织）：O'Leary 声称由中国关联实体注资、在美国各州发动反数据中心虚假信息运动的网络；信息来源为IRS 990申报文件。 - **UBI（全民基本收入）**（概念）：针对AI造成的失业人员提出的社会保障方案；Uygur 指出即便是最理想的每年3.6万美元UBI，对此前年薪12万美元的工人而言也是毁灭性的降级。 - **霍尔木兹海峡**（概念）：中国48%能源进口的咽喉要道；一旦封锁将引发全球通胀，重新开放是美伊协议中美国的核心利益所在。 - **Deepseek**（软件）：中国大型语言模型；O'Leary 和 Amodei 援引其作为证据，说明美国AI发展一旦暂停，中国将在数月内取得决定性领先。 - **Tucker Carlson**（人物）：前福克斯新闻主持人，现为独立媒体人；Uygur 预测他是唯一可行的2028年共和党总统候选人，O'Leary 最终未予否认。 - **民主资本主义**（概念）：Uygur 偏好的经济框架——私营市场受运转良好的民主制度制衡；有别于美国当下的权贵资本主义，也不同于欧式社会主义，以北欧国家为现实参照。 - **Rohana**（人物）：进步派政治人物，被 Uygur 多次提及，称其为唯一积极应对AI失业问题的政客，也是最接近民主资本主义理念的2028年候选人。

#ai-economy#unemployment#iran-war

与 Onyx Security CEO Maxim Bar Kogan 共谈企业 AI 守护者的构建

41:09

EN/ZH

点开看双语

No Priors: AI, Machine Learning, Tech, & Startups大约 1 个月前

与 Onyx Security CEO Maxim Bar Kogan 共谈企业 AI 守护者的构建

Sarah Guo 与 Onyx Security 联合创始人兼 CEO Maxim Bar Kogan 深聊在企业规模下保障 AI 智能体安全究竟意味着什么。Maxim 认为，当智能体行动呈指数级增长时，传统管控手段——代理层、身份限制、人工审核——都会失效，唯一可行的路径是训练专用小模型，让它知道何时需要上报给更重量级的监督者。对话涉及 Onyx 的"安全控制平面"产品、自训模型背后的成本与延迟权衡、为何实验室无法为自家模型的安全性作担保，以及 Maxim 对 AGI 即将到来和独立 AI 监督将成为千亿美元赛道的坚定判断。 ## [00:00] 开场 Maxim 直接切入主题：随着企业越来越多地借助 AI 智能体处理事务，恶意或失误行动在所难免——智能体误发凭证、发出未授权的网络请求、执行不可逆操作。企业已经意识到采用浪潮无法阻止；他们缺少的，是任何一种能区分合法行动与非法行动的机制。这段开场在片头片尾之前点出了 Onyx 的核心命题。 > *"企业正在意识到，风险在指数级增长，而他们根本没有办法阻止这股采用浪潮。他们现在唯一能做的，是想办法降低这些智能体行动是非法或错误的概率。"* ## [00:45] Maxim Bar Kogan 介绍 Sarah 介绍 Maxim：Onyx Security 联合创始人兼 CEO，公司总部位于以色列，团队由研究员、数学家和工程师组成——他们的使命是让 AI 来监视 AI。公司将进攻性网络安全专长与前沿 AI 研究融为一体，研究方向涵盖合成数据和机械可解释性。 ## [01:10] AutoGPT 与押注智能体行动两年前，企业安全领域的共识风险叙事是针对聊天机器人的 DLP——员工把敏感数据粘贴进 ChatGPT。如今，这一叙事已演变为围绕自主智能体行动的深度焦虑。Maxim 把 Onyx 的判断追溯到 AutoGPT：第一个让 LLM 自主决策、调用工具并循环执行的智能体——而不只是生成文本。那次演示证明智能体可以自主采取真实行动，Maxim 当即判断：有人必须在规模上监督这些行动。 > *"AutoGPT 让所有人的想象力——包括我们的——彻底爆发，因为它是第一个真正自主运行的 LLM 智能体——一个不只是生成文字，而是能决定做什么、然后拿着 API 权限去做的智能体。"* ## [05:17] Onyx 产品是什么 Onyx 做两件事：训练模型、构建监督其他智能体的智能体，并将这一能力封装为企业可接入 AI 技术栈的"安全控制平面"。控制平面实时监控智能体行动的合法性——判断某个行动是否在授权范围内——同时管理延迟、成本与可靠性之间的权衡。Maxim 将长期愿景定位在企业安全之外：任何部署 AI 智能体的公司，都需要一个独立于厂商的第三方来认证智能体的行为。 > *"这些行动的数量正在指数级增长。过去觉得有用的手段——比如人在回路——等到行动量达到一百倍、一千倍、一百万倍，根本就不管用了。"* ## [07:47] 大型企业的部署现状在当前的大型企业中，Maxim 看到三类 AI 部署形态：低代码 SaaS 自动化（拖拽式，并非真正自主）、内部自建或面向客户的第一方智能体，以及自主编程智能体和辅助工具。在这三类中，编程智能体如今占企业 AI 用量的 50% 以上。金融、医疗等最成熟的行业管控最严，但即便是最谨慎的企业，也已经从全面禁止 AI 转向主动管理。 > *"在普通企业中，超过 50% 的份额来自自主编程智能体和辅助工具。"* ## [09:58] 智能体安全防护企业每年在安全上的投入约达 1000 亿美元，涵盖终端、网络、云端、身份。Sarah 问其中有多少能直接迁移到智能体安全。Maxim 的回答：几乎没有。身份管控是最基础的一层，但对智能体同样失效——因为智能体需要宽泛、动态的权限，无法像静态软件进程那样事先划定边界。跨代码仓库写代码的智能体、代替高管发邮件的智能体，根本无法被锁定在一个狭窄的权限集里。攻击面在于意图，而非访问权限——而现有工具无法读懂意图。 > *"面对这些自主 AI、这些助手、这些编程智能体，你根本无法提前知道该给它们什么权限。"* ## [12:45] 为什么代理层行不通 Sarah 凭借自身的安全背景直觉判断：这听起来像是配了更智能策略引擎的代理层能解决的问题。Maxim 同意代理层在某些架构中可以作为集成点，但说它完全绕开了核心难题。代理层给你数据流，却无法告诉你流里的那个行动是否合法。这种判断需要理解上下文——智能体的目标、历史记录、企业授权范围——而任何规则引擎都不知道如何跨任意智能体行为做出这种评估。 > *"真正的难题是：我现在该做的事，究竟合不合规。对 AI 系统来说，这才是硬问题。"* ## [14:11] Onyx 为何自训模型最直觉的方案——用 Claude Code 监控 Claude Code——在成本和延迟上都行不通。为每个企业智能体配备一个前沿模型智能体，会让安全层比被保护的 AI 更贵。Onyx 的答案是训练体量小、高度专精的模型，只做一件事：判断当前行动是否需要上报给更重量级的监督者。Sarah 用闪电棋打比方：大师凭直觉快速落子，只在关键节点停下来深思。Maxim 说这个比喻完全准确——你希望把智算集中在风险最高的地方，其余地方保持精简。 > *"你要训练只擅长一件事的模型。它们非常小，几乎什么都做不了，唯一能做的就是判断：'是否需要让更聪明的智能体来看看这个？'"* ## [18:38] Onyx 的人才文化以色列的安全人才——由 8200 部队、Armis、Wiz 等公司塑造——早已声名在外。Onyx 的基因却有所不同：联合创始人 Gil 的背景是合成数据和 NVIDIA，并非进攻性网络安全。Onyx 的研究工程师大多来自以色列一个专注于数学与网络安全交叉的情报部门。Maxim 认为这种融合是刻意为之——Onyx 要解决的长期问题，不只是企业安全，而是如何控制先进 AI。这需要深厚的 AI 专长，同时兼备安全直觉。以色列整体在 AI 上正在快速追赶：世界模型、AI 基础设施、芯片。 > *"问题不只是网络安全。问题是：长期而言我们如何控制先进 AI——就算撇开企业安全缺口不谈，这个问题本身听起来就极为重要。"* ## [21:24] 机械可解释性 Maxim 认为机械可解释性——搞清楚模型权重和激活值内部究竟发生了什么——既可能实现，也必须实现。他的反直觉论断是：随着模型在关键维度上超越人类，它们将比我们更有能力破解其他模型的内部结构。Onyx 正在积极资助这一方向的研究，不仅将其视为安全工具，也将其视为理解智能本质的窗口。Sarah 对此表示认同，并指出这不只是理解 AI，更是理解认知本身的机会。 > *"随着我们开始拥有在某些重要维度上远比人类聪明的模型，我们认为将能够更有效地开始破解机械能力。"* ## [23:35] Onyx 如何赢得客户信任财富 10 强、20 强企业通常不会与不到百人的两岁初创公司合作。打破这一惯例的是痛点：每天面对智能体行动事故的 CISO 没有成熟厂商可以求助，因为这个问题三年前根本不存在。Onyx 刚从隐身模式亮相，就收到了企业的主动询问——因为他们描述的问题正是这些企业每天都在应对的。Maxim 将此视为短暂的窗口期：企业买家知道新兴初创公司会成长，他们宁愿做塑造产品的早期客户，也不愿成为跟风的后来者。 > *"这种窗口只在痛苦足够强烈时才会打开。他们的痛苦强烈到——'我刚看到这家公司出来亮相，但这正是我每天都要面对的问题，我得给他们打个电话。'"* ## [25:10] 从基础层面降低风险 CISO 焦虑的第二波浪潮——超出智能体行动之外——是自动化漏洞挖掘成本的断崖式下跌。编程工具现在能以几年前看起来遥不可及的规模发现并利用漏洞。Maxim 说市场没有过度反应：这是真实的结构性转变。正确的应对是双轨并行：立即快速打补丁、部署缓解措施，同时投资于基础性管控——锁定身份、防火墙、终端检测——无论攻击者的工具有多强大，都能收缩可被利用的攻击面。 > *"真正的解决方案——每家大型企业的安全负责人都知道——是我们需要把基础性组件搭建到位，从源头规避风险。"* ## [27:45] Glasswing 与 Daybreak 的分阶段发布关于 Anthropic 的 Glasswing 和 OpenAI 的 Daybreak 针对更强大模型的受控发布计划：Maxim 持条件性观点。分阶段发布在全球协同的前提下是理想选择——它为建立应对手册、共享知识、防止电网或航空等关键系统发生灾难性故障争取了时间。但如果任何一方提前发布能力相当的模型，分阶段发布就会成为一种累赘：没有获得早期访问权的公司，面对的是根本没机会提前防御的威胁。他的建议是广泛扩大访问权限，让更多组织能够并行构建防御。 > *"如果任何人提前拿到了方法论级别的模型，回过头来看都会是一个巨大错误——我们本可以至少给企业选择权，让他们开始快速行动。"* ## [29:11] 大型企业中仍在观望的阵营两年前，还有一批大型企业直接封禁了 AI。今天 Maxim 几乎看不到这种情况了。金融行业仍有限制——允许使用智能体，但限定可用工具——但全面封禁已经消失。他认为这是正确的：工具锁定本身也是一种风险。在这个市场变化如此之快的节奏下，押宝单一厂商的模型，意味着下一代模型格局一变就会被打个措手不及。广泛引入工具并严格管理的企业，将超越那些激进限制的企业。 > *"如果一年前你押宝 OpenAI，那会是世界上最安全的赌注，但 Anthropic 突然就有了更好的模型和工具。"* ## [30:46] Onyx 与更大的 AI 安全格局 AI 安全赛道挤满了新兴厂商和新型攻击面。Maxim 对产品边界焦虑的回应是：2026 年 AI 的两大核心原语——基于 Transformer 的基础模型和工具调用智能体循环——多年来并未发生根本性改变。这种稳定性让 Onyx 能够面向众多智能体应用构建，同时保持核心技术的精简。应对架构转变的真正对冲，是投资于能快速重训和适应的研究人员，而不是把产品押宝在某一种模型范式能永久主导上。 > *"2026 年 AI 运作方式的两大核心支柱，在过去几年里没有改变。我们仍然主要是 LLM 基础模型，我们仍然用差不多同样的方式构建智能体。"* ## [32:36] 实验室是否该承担模型信任与治理责任？湾区正在热议的问题：实验室最终会不会把信任与治理问题内化？Maxim 的结构性反驳是：买家不会让卖车的人来给车做认证。安全团队需要一个完全独立的第三方，其商业模式完全取决于说对——而不是一个保护自家产品声誉的厂商。超越买家心理之外，Maxim 区分了两类失效："参差不齐的智能"失误（会随更强模型改进的低级错误）和意图层面的失效：对抗性操控、目标错配、目标漂移。实验室会修复第一类问题。只有结构上独立的监督者才能应对第二类。 > *"你不会信任一个产品的厂商来告诉你这个产品不会搞乱你的环境。你会希望有一个独立的第三方，其整个业务都押注在告诉你这东西没问题、并且必须说对上。"* ## [36:56] 安全领域还需要什么 Sarah 问更广泛的技术和研究社区——尤其是各大实验室——从安全角度还缺什么。Maxim 的回答：不是技术差距，是共情差距。构建安全产品需要深度理解安全团队的实际运作方式——他们的组织架构、职责分工、信息流转。以色列能培养出强大的安全人才，部分原因在于服役经历让工程师亲身体验了后来构建产品时要服务的终端用户。言下之意，各大实验室在构建能力时，对最终要部署和防御这些能力的组织的运营现实关注不足。 > *"无论你在解决什么技术问题，你构建的都是给人用的工具，给有特定结构的组织用的。为这类受众打造一个不只解决技术问题、还能让他们真正喜欢的产品，真的很难。"* ## [39:14] Maxim 为何坚信 AGI 即将到来 Sarah 以一个观察收尾：Maxim 隐含地相信安全团队中的人类还会存在若干年。他确认了这一点——但给出了时间线：安全团队很快将完全由 AI 智能体运作，就像大多数知识工作将会那样。他对 AGI 的乐观是脚踏实地的：打造优秀产品的工作本质不变——始终了解最终用户是谁，并围绕他们的体验优化。现在的最终用户是带着几个智能体并肩工作的人类。随着比例翻转，同样的原则依然适用——只是服务对象从看仪表盘的人变成了读取上下文窗口的智能体。 > *"今天我卖产品时，卖给的是有几个智能体辅助的人类受众，随着那个受众从人类变成更多智能体，我们也需要进化，让产品真正适配那些负责做事的智能体。"* ## 实体 - **Maxim Bar Kogan**（人物）：Onyx Security 联合创始人兼 CEO；以色列情报系统背景，专长数学与进攻性网络安全。 - **Sarah Guo**（人物）：No Priors 主持人；Conviction 创始合伙人。 - **Onyx Security**（组织）：以色列初创公司，构建 AI 监督基础设施——训练专用小模型，对企业 AI 智能体实施监控与治理。 - **AutoGPT**（软件）：早期开源自主 LLM 智能体；Maxim 将其列为让自主智能体风险变得具体可感的转折点。 - **Glasswing / Daybreak**（软件）：Anthropic 与 OpenAI 分别推出的前沿模型受控访问计划。 - **机械可解释性**（概念）：旨在理解神经网络内部权重与激活结构的研究方向；Onyx 将其视为 AI 监督的长期支柱。 - **安全控制平面**（概念）：Onyx 的产品品类——一个独立于厂商的层，实时监控智能体权限、行动合法性和行为历史。 - **8200**（组织）：以色列情报部门，以培育以色列顶尖安全和科技人才著称，Onyx 多名工程师出身于此。

#ai-security#enterprise-ai#ai-agents

Devin’s 80% Moment: Background Agents, 7x PRs, & End of Hand-Held Coding — Walden Yan & Cole Murray

1:09:32

EN/ZH

点开看双语

这期闪电对话中，swyx 与 Sunil Pai 坐在一起——Sunil 是 Cloudflare 开发者平台负责人，swyx 称他为 Code Mode 的发明者。两人围绕三条主线展开：Cloudflare 押注 Durable Objects 和 Dynamic Workers 作为 AI 智能体底层基础设施、他与 Vercel 之间那场差点断送职业生涯的推特误会，以及为什么 fork 代码是一种尊重而非掠夺。Sunil 最后向开发者发出直接挑战：别再搭第十个智能体框架了，去构建科幻吧。 ## [00:00] Code Mode 是谁发明的？开头三秒是片头板。紧接着，swyx 介绍 Sunil 是"Code Mode 的发明者"，Sunil 半开玩笑地欣然接受，自称从小就在思考这件事。这是两位老朋友之间的纯粹玩笑，不是从后面内容剪出的预告。 ## [00:03] 介绍与 Sunil Pai 的背景 swyx 重新介绍 Sunil——老朋友，也是 AIE Europe 的主题演讲嘉宾。简短的叙旧交代了后续背景：Sunil 目前专注于 Cloudflare 的 AI 智能体平台，而 Anthropic 刚发布的 Cloud Managed Agents 恰好给了他一个具体的对标对象。 > *"我就是想聊聊 Cloudflare 那边最近发生的一切。"* ## [00:30] 聊聊新的云托管智能体 Anthropic 新推出的 Cloud Managed Agents——一个用于构建和部署长期运行智能体的平台——是 Sunil 的切入点。他说他喜欢 Anthropic 团队，也觉得这个产品有意思，但看完规格说明后，他的第一反应是竞争心：Cloudflare 可以做得更好。swyx 追问 Cloudflare 到底有什么底气支撑这个判断。 > *"我看完这个产品，第一反应是——我想竞争。我觉得用 Workers 和 Durable Objects 我们能做出更好的东西。"* ## [01:10] Cloudflare 核心基础设施：Durable Objects 与 Dynamic Workers Sunil 点名了他认为每个智能体平台最终都需要的两个原语。Durable Objects 是有状态的无服务器单元——他主张这是世界上第一个在基础设施层实现 actor 模型的方案，而非用户态的库实现。Dynamic Workers 是 Cloudflare 对安全运行 LLM 生成代码的回答：重新设计的 eval，零启动时间，可配置的 API 接口，出站流量默认锁定。两者结合，让 Cloudflare 能在沙箱计算中运行智能体步骤，无需启动完整虚拟机。 > *"这是世界上第一个在基础设施层实现 actor 模型的方案，不是在用户态。"* ## [02:34] Cloudflare 如何设计 AI 智能体架构由同事 Matt Carey 构建的 Cloudflare MCP 服务器展示了 Dynamic Workers 的实际效果。Cloudflare API 有 2600 个端点——每个端点暴露一个工具会把任何 LLM 的上下文窗口打爆。取而代之的方案是把所有功能收拢进两个工具调用：`search` 和 `execute`，背后都是运行在隔离环境中的 JavaScript 代码。智能体提交代码，隔离环境执行，结果返回——一来一回，带类型检查。 > *"一次工具调用，无需与 LLM 来回沟通，而且带类型检查。说白了，LLM 本来就很擅长运行代码。"* ## [03:40] 智能体软件的未来与标准化编排器 swyx 问 Anthropic 规格里的编排器概念能否成为跨平台标准。Sunil 的回答是：没有人造出 AI 智能体领域的 React。他刻意拿 2013 年的 React 做类比——JSConf 演讲结束后观众纷纷走人，指责 Facebook 痛恨 JavaScript，然而 React 最终定义了此后所有 UI 框架。现在每个人都在用自己的方式搭自己的编排器，在不同语言、公司、基础设施之间几乎无法复现。swyx 提出 skill——纯 markdown——或许已经是那个统一层；Sunil 觉得这个想法很有吸引力，但担心它的具体性上限。 > *"太难了，但我脑子里的框架是：没有人造出 AI 领域的 React。"* ## [06:11] "垃圾 fork" 现象与开源文化 swyx 提到"垃圾 fork"——用 AI 生成的热门项目 fork——Sunil 立刻来了兴致。在他看来，fork 是一种声望和尊重的表达，不是抄袭。React 生态就是靠各种 fork 长起来的。他鼓励任何想做 Cloudflare Agents SDK 竞品的人放手去干：大家都 fork，大家都赢。 > *"在我的文化里，fork 是声望和尊重的象征。"* ## [06:36] Vercel 与 Cloudflare 的社交媒体误会在 JSConf España，Sunil 遇到了来自 Vercel 的 Harvey，相处愉快。他发现了 Vercel Labs 的 Just Bash——一个纯 JavaScript 实现的 Bash——想把它移植到 Cloudflare。午饭时间他让 Opus 对着代码库跑了一遍，拿回 5000 行代码，打算周一整理好再发正式 PR。他睡了一觉，醒来发现 Cloudflare 管理层发来私信问他有没有看推特：Vercel CTO 公开批评了这份代码，把它定性为公司行为而非个人业余项目。Sunil 直接回复，解释了来龙去脉，然后看着半个互联网涌来为他辩护。 > *"我上推特一看，Vercel CTO 在骂我的东西，说……'这是 Cloudflare 干的。'"* ## [09:45] fork 在软件开发中的重要性 swyx 把 Vercel 这件事和一个更大的模式联系起来：某个泄露的代码库有人用 Python 重写以绕开许可证，律师最终裁定仍属衍生作品。swyx 真正想说的是：应该鼓励垃圾 fork——fork 一个依赖，把它内化，自己掌控——这样就能避免 LiteLLM 或 Axios 那种上游突然断掉的惨剧。Sunil 认同：NPM 出现之前，软件就是通过 Usenet 以同样的方式传播的，缩短 fork 周期不过是这一传统的延续。 > *"fork 是我们构建软件的根本方式。"* ## [12:04] 现代开源仓库的对抗性本质 Cloudflare Agents SDK 已经完全关闭了 PR 贡献入口，现在只接受 issue。Sunil 在大会上和开源维护者交流，大家都有同感：仓库已经变成对抗性领地，最危险的攻击向量是看起来完全合规、仔细读才发现有问题的伪装安全报告。swyx 把这件事和 Peter 早上关于 Claude Code 的演讲联系起来——当前最大的攻击面是一个被攻陷的依赖进入 Claude Code，这会让所有使用它的开发者都暴露在风险中。 > *"开源仓库已经变得如此对抗，以至于人们几乎害怕在这个领域获得知名度。"* ## [13:04] 结语与鼓励原创 Sunil 的结语很直接：别再造第十个智能体框架了。去构建科幻。为你的家人做点东西。用 Agent SDK，但把它用在那些基础设施和 LLM 几乎撑不住你的地方——因为下一次质变就藏在那里。swyx 以 Sunil 2018 年在 React Rally 造出的"alpha thought leading"收尾。 > *"构建科幻。为你的家人做东西。你拥有改变世界的巨大能动性，我希望大家都能做出真正原创的东西。"* ## 实体 - **swyx** (人物)：Latent Space 主播；Sunil 的老朋友；2018 年 React Rally 上因 Sunil 的一句话创造了"alpha thought leading"。 - **Sunil Pai** (人物)：Cloudflare 开发者平台负责人；swyx 称其为 Code Mode 的发明者；AIE Europe 主题演讲嘉宾。 - **Cloudflare** (组织)：云平台公司；基于 Durable Objects 和 Dynamic Workers 构建智能体基础设施。 - **Anthropic** (组织)：AI 公司；推出了 Cloud Managed Agents，即 Sunil 定位 Cloudflare 要竞争的产品。 - **Vercel** (组织)：前端云公司；Sunil 使用其 AI SDK；推特误会的主角。 - **Durable Objects** (软件)：Cloudflare 的有状态无服务器原语；Sunil 主张这是世界上第一个在基础设施层实现 actor 模型的方案。 - **Dynamic Workers** (软件)：Cloudflare 功能，用于在安全、零冷启动的隔离环境中运行 LLM 或用户生成的 JavaScript。 - **Just Bash** (软件)：Vercel Labs 项目——纯 JavaScript 实现的 Bash——Sunil 在推特事件发生时正在将其移植到 Cloudflare。 - **MCP** (概念)：Model Context Protocol；Cloudflare 的 MCP 服务器利用 Dynamic Workers 将 2600 个 API 端点收拢进两个工具调用。 - **垃圾 fork** (概念)：AI 生成的现有项目 fork；Sunil 将其定性为开源 fork 文化的延续——是尊重的表达，不是抄袭。

#cloudflare#ai-agents#open-source

播客听见世界的声音，看见思想的刻度

浏览频道

Lenny's Podcast

a16z

All-In Podcast

The Diary Of A CEO

AI Engineer

Machine Learning Street Talk

Google DeepMind

Lex Fridman

No Priors: AI, Machine Learning, Tech, & Startups

Unsupervised Learning: With Jacob Effron

Sequoia Capital

Dwarkesh Patel

Yannic Kilcher

20VC with Harry Stebbings

Every

Latent Space

Bloomberg Originals

Claude

专访戴密斯·哈萨比斯的传记作者

走进 xAI：三个月搭出 Grok Imagine、视频生成 vs 世界模型、视频 Agent——Ethan He

关于 AI 真实走向的理性对话 | Benedict Evans

前国会议员称 AI 并非势不可挡 — Brad Carson

Anthropic 的数字神明、教皇 vs AI、就业叙事反转、开源即将遭到打压？

物理学最大谜题：反物质、暗能量与万有理论 — Don Lincoln | Lex Fridman Podcast #497

挑选 AI 赢家的法则 | The a16z Show

Neuralink 的 DJ Seo：连接大脑与 AI 的竞赛内幕

Opus 4.8 为何让我重回 Claude

紧急辩论：他们在AI、伊朗战争和未来走向上对我们撒了谎！

与 Onyx Security CEO Maxim Bar Kogan 共谈企业 AI 守护者的构建

Devin’s 80% Moment: Background Agents, 7x PRs, & End of Hand-Held Coding — Walden Yan & Cole Murray

私募市场、软件重新定价与资本配置 | Marc Rowan 对话 a16z

用 AI 把所有事情都自动化了，员工却增加了两倍

🔬 苦涩的教训即将降临蛋白质领域 — Alex Rives，BioHub

Cursor 如何在 Fireworks 上训练 Composer：高性能强化学习的分布式基础设施

上手构建你的第一个托管智能体

Bruno Fernandes：Roy Keane歪曲了我的话。他们出价2亿英镑，我说不。

AI 悖论：自动化越多，人的工作反而越多 | Dan Shipper

⚡️ 为什么你应该构建科幻小说 — Sunil Pai，Cloudflare

播客听见世界的声音，看见思想的刻度

浏览频道

Lenny's Podcast

a16z

All-In Podcast

The Diary Of A CEO

AI Engineer

Machine Learning Street Talk

Google DeepMind

Lex Fridman

No Priors: AI, Machine Learning, Tech, &amp; Startups

Unsupervised Learning: With Jacob Effron

Sequoia Capital

Dwarkesh Patel

Yannic Kilcher

20VC with Harry Stebbings

Every

Latent Space

Bloomberg Originals

Claude

专访戴密斯·哈萨比斯的传记作者

走进 xAI：三个月搭出 Grok Imagine、视频生成 vs 世界模型、视频 Agent——Ethan He

关于 AI 真实走向的理性对话 | Benedict Evans

前国会议员称 AI 并非势不可挡 — Brad Carson

Anthropic 的数字神明、教皇 vs AI、就业叙事反转、开源即将遭到打压？

物理学最大谜题：反物质、暗能量与万有理论 — Don Lincoln | Lex Fridman Podcast #497

挑选 AI 赢家的法则 | The a16z Show

Neuralink 的 DJ Seo：连接大脑与 AI 的竞赛内幕

Opus 4.8 为何让我重回 Claude

紧急辩论：他们在AI、伊朗战争和未来走向上对我们撒了谎！

与 Onyx Security CEO Maxim Bar Kogan 共谈企业 AI 守护者的构建

Devin’s 80% Moment: Background Agents, 7x PRs, & End of Hand-Held Coding — Walden Yan & Cole Murray

私募市场、软件重新定价与资本配置 | Marc Rowan 对话 a16z

用 AI 把所有事情都自动化了，员工却增加了两倍

🔬 苦涩的教训即将降临蛋白质领域 — Alex Rives，BioHub

Cursor 如何在 Fireworks 上训练 Composer：高性能强化学习的分布式基础设施

上手构建你的第一个托管智能体

Bruno Fernandes：Roy Keane歪曲了我的话。他们出价2亿英镑，我说不。

AI 悖论：自动化越多，人的工作反而越多 | Dan Shipper

⚡️ 为什么你应该构建科幻小说 — Sunil Pai，Cloudflare

No Priors: AI, Machine Learning, Tech, & Startups