LaiDub

播客

Claude Code 中的 MCP
3:37
EN/ZH
点开看双语
ClaudeClaude Code 10113 天前

Claude Code 中的 MCP

Anthropic 对 Claude Code 中 Model Context Protocol 的完整讲解:它能连接哪些外部资源、如何添加和划定服务器作用域,以及每个已配置服务器在上下文窗口上悄悄产生的隐性开销。适合正准备将 Claude Code 接入 Linear、GitHub 或内部工具的开发者。 ## [00:02] MCP 存在的意义——上下文在编辑器之外 开门见山:Claude Code 所需的大部分上下文并不在代码仓库里,而是散落在数据库、生产力应用和公共包中。MCP 是一套开放标准,让 Claude 自行决定何时调用这些外部来源,而不是等你手动粘贴进来。 > *Model Context Protocol 是一套开放标准,让 Claude Code 能连接到外部工具和数据源。* ## [00:35] 工具,以及 MCP 服务器究竟接入了什么 在列举具体服务器之前,讲解者先厘清了"工具"这个概念:Claude Code 这类 agent 借助工具来执行动作,这正是它们区别于只会返回文本的普通对话的地方。接着给出两个具体例子——一个 Linear MCP 服务器可把团队 issue 拉进会话,Context7 服务器则能实时推送当前依赖的最新文档。更多连接器可在 claude.com/connectors 找到。 > *工具赋予 Claude Code 这样的 agent 执行动作的能力,让它们能更好地完成任务。* ## [01:14] 添加服务器:HTTP 与 STDIO,以及 /mcp 服务器通过 `claude mcp add` 添加,分为两种类型:**HTTP** 服务器由服务商远程托管,通过网络访问;**STDIO** 服务器是本地进程,运行在自己的机器上。安装完成后,会话内的 `/mcp` 命令可以列出已连接的服务器、查看状态,并随时停用不需要的服务器。 > *HTTP 服务器用于远程服务……STDIO 服务器用于在本机运行的本地进程。* ## [01:42] 三种作用域:local、user 与 project(.mcp.json) 每个服务器都属于三种作用域之一。**local** 将服务器限定在当前项目且仅对自己可见;**user** 让服务器在你所有项目中都可用;**project** 会生成一个 `.mcp.json` 文件并提交到版本控制,这样所有参与该项目的团队成员都会自动获得相同的服务器配置。 > *project 作用域使用 .mcp.json 文件,你将其提交到版本控制后,所有参与该代码库的人都会自动获得完全相同的服务器配置。* ## [02:04] 工具定义会消耗上下文——何时应优先选用 CLI 或 skill 连接器列表背后有一个容易被忽视的代价:每个已配置的 MCP 服务器都会把自己的工具定义注入上下文窗口,无论你是否正在使用它。讲解者给出几层应对策略——用 `/mcp` 停用闲置服务器;如果有 `gh` 或 `aws` 这样的 CLI 可用,优先选它,因为 CLI 不会携带持久性工具定义;或者把工作流封装成 skill,只有 Claude 决定调用时才会加载完整内容。当 MCP 工具定义超过上下文的 10% 时,Claude Code 会切换到工具搜索模式按需发现工具——虽然有用,但不如预加载可靠。 > *MCP 服务器会把工具定义加入上下文窗口,即使你并未使用它们。所以配置了大量服务器时,会大量占用可用上下文。* ## [03:10] 小结 三件要记住的事:`claude mcp add` 安装服务器,`.mcp.json` 与团队共享服务器配置,`/mcp` 用来清理那些实际没在用的服务器。 > *用 Claude MCP add 添加服务器,用 .mcp.json 将其限定到项目范围以便团队自动获取,并通过停用不在用的服务器来控制上下文占用。* ## 实体 - **Anthropic 教程讲解者** (Person): Anthropic 为 Claude Code 101 系列官方配音的讲解者。 - **Model Context Protocol (MCP)** (Standard): 开放协议,让 Claude Code 通过 HTTP 或 STDIO 服务器连接外部工具和数据源。 - **Linear MCP server** (Software): 将团队 Linear issue 引入 Claude Code 会话的连接器。 - **Context7 MCP server** (Software): 为 Claude Code 提供当前所用依赖最新文档的连接器。 - **.mcp.json** (Config): 提交到版本控制的项目级配置清单,让每位团队成员继承相同的 MCP 服务器配置。 - **/mcp** (CLI command): 会话内命令,用于列出、查看和停用已连接的 MCP 服务器。 - **Tool search mode** (Feature): 当 MCP 工具定义超过上下文窗口 10% 时,Claude Code 进入的回退模式,按需发现工具。 - **Skill** (Concept): 完整 MCP 服务器的轻量替代方案;在 Claude 按需加载主体之前,上下文中只存放其名称和描述。

#claude-code#mcp#ai-agent
打造 AI 原生工程团队
28:38
EN/ZH
点开看双语
Claude14 天前

打造 AI 原生工程团队

Fiona Fung 负责 Anthropic 旗下 Claude Code 与 Cowie 的工程和产品,她分享了当 Agentic 编程成为团队默认工作方式后,哪些环节出了问题——代码评审、所有权、规划、招聘——以及为了持续交付他们重写了哪些规范。核心逻辑:当编码不再是瓶颈,所有围绕保护昂贵工程带宽而建立的流程就会悄然失效,管理者的职责是快速察觉并重写它们。 ## [00:00] 开场与五大主题 Fiona 开场坦言现场人数远超预期(Boris 和 Jared 的场次还没散),顺势和观众自拍,然后介绍背景:她曾在 Meta 和 Microsoft 带团队,现在负责 Claude Code 与 Cowie 的工程和产品。这套演讲稿一个月前刚写完就已经改过一轮——最初写稿时例程(Routines)功能还不存在。她预告了五条主线:瓶颈已经迁移、团队规范不得不重写、如何推行这些变化、哪些信号证明变化奏效,以及她仍在思考的待解问题。 > *"这套 PPT 大概一个月前做好,内容已经改过了,因为当初写的时候根本没有例程这东西。"* ## [02:10] 转变:瓶颈已经迁移 Fiona 给整场演讲定了一个副标题:*过去管用的,现在未必还管用*。她把听众带回当年用光盘发货的 Visual Studio 2005——制造车间要压盘,截止日期硬得像石头——再指出从光盘到在线分发已经重塑了团队的交付节奏。这次的转变更彻底:多年来编码产能和工程师带宽是最贵的稀缺资源,而这一点在 Claude Code 团队悄然改变了。瓶颈在转移,并不是消失,而是迁移到了验证、评审、跨职能交接和安全合规。现在真正重要的问题是"代码对不对"和"安不安全",旧有的规划与所有权规范悄然失去了意义。 > *"过去管用的,现在未必还管用。"* ## [07:40] 重写团队规范:代码评审、JIT 规划、技术争论 Claude Code 团队不得不逐条重写规范。第一条是代码评审——人的判断力转向"这段代码真的需要谁来看"。第二条是规划——Fiona 称之为 JIT 规划,类比 JIT 编译,因为原型验证不再是那个需要六个月路线图来保驾护航的昂贵步骤。第三条是技术争论:用代码说话。两个工程师不需要在文档里互相说服,各自原型化 API、看对调用方的影响,Fiona 也明确表示她同样关心 API 对下游的影响,不只看实现本身。统一的原则是:当构建成本低、争论成本高,不能让最后一个提交代码的人赢——要建立让*你*拥有最终话语权的例程。 > *"当构建便宜、争论昂贵,这又会怎样改变你的团队规范?"* ## [13:30] 例程与 Claude 作为第二双手 现在 Fiona 早上喝咖啡时读的是例程(Routines)跑了一夜的产出,而不是自己亲手启动工作。团队重度依赖 Claude 做代码评审——Claude 盯着 PR、处理代码风格、lint、反馈请求,在提交前发现 bug,补充测试——人则专注于还需要建立信任的那些判断场景。她还强调工具的产品感:她曾把 Claude 的终端输出主题配成节日冰蓝色加雪花,随即话锋一转说更重要的是更早发现 bug(左移)和自动化那些"点两下才能回答"的问题,这些比任何单一工具都值钱。 > *"哪些地方你非常信任 Claude,哪些地方你还是希望有人类来把关?"* ## [16:45] 跨职能缺口与招聘策略 Fiona 分享了一个用户调研的故事:团队没有专职内容设计师,于是 Claude 成了她的搭档,负责撰写简洁、适合终端场景的文案。与此同时,团队里的 PM 写代码,工程师也承担 PM 的工作。这引出了招聘的反向结论:非传统背景的程序员现在能做更多工程工作,所以领导者要把招聘火力集中在团队真正欠缺的硬核能力上。她刚加入时,Claude Code 团队产品通才和创意型人才充足,但分布式系统专家严重不足——那正是她主攻的招聘方向。 > *"有了 Claude,非传统背景的程序员现在能做更多工程工作,工程师也可以更多地承担其他角色。"* ## [18:51] 扁平组织与亲自回应客户反馈 Fiona 给招聘方出了道难题:招聘经理,但要求他们先以 IC 身份入职。招聘方觉得她疯了;Fiona 的回答是,吃自家狗粮、亲身使用 Claude Code 本身就是这份工作的一部分,如果候选人对此没有热情,早点知道对团队是好事。扁平的组织结构加上 Claude 作为上下文切换的助力,让她这个管理者仍然能在桌面 Claude Code 上亲自写代码、直接回应客户请求——而不是把每个客户问题都转进工单系统,她直接拉开本地代码仓库,自己回答。 > *"你想招经理,但他们要先从 IC 做起。没有经理会愿意这样的。"* ## [25:00] 走势向好的信号与待解问题 团队的工作度量指标朴实无华:每次提交默认都是 Claude 协助完成,Fiona 大约四个月没见过一次非 Claude 辅助的提交了。但她同时警告不要迷恋"AI 生成了 X% 的代码"这种标题——吞吐量是一个信号,不是目标。最终要问的问题是你在让什么产品变得更令人愉悦、在解决什么问题,质量和可靠性要和数量一起盯。她以"审计自己的投入"收尾,提出她仍在问自己的问题,并把建议递给听众,请他们带回各自的团队思考。 > *"在我们这里,每次提交默认都是 Claude 协助完成的。我大概四个月没见过一次非 Claude 辅助的提交了。"* ## 实体 - **Fiona Fung**(人物):Anthropic 工程总监,负责 Claude Code 与 Cowie 的工程和产品;曾在 Meta 和 Microsoft 带团队。 - **Boris**(人物):Claude Code 工程负责人,演讲中多次提及的合作者。 - **Kat**(人物):Anthropic 同事,同日早些时候做了 Claude 代码评审主题的主题演讲。 - **Claude Code**(软件):Anthropic 开发的 Agentic 编程工具,现为 Fiona 团队的默认工作方式。 - **Cowie**(软件):Fiona 团队同时负责工程和产品的姊妹产品。 - **Anthropic**(机构):构建 Claude 与 Claude Code 的公司。 - **JIT planning**(概念):Fiona 提出的规划方法,从六个月路线图转向即时规划,类比 JIT 编译。 - **Shift left**(概念):将 bug 发现和验证前移——通过自动化和工具提前拦截,而非事后评审。 - **Routines**(概念):团队依赖的、可重复的 Claude 驱动工作流,确保单个人对结果拥有最终话语权,而不是"最后提交者获胜"。

#agentic-coding#engineering-management#claude-code
Ben Horowitz 谈美国活力与 AI 的未来 | The a16z Show
29:03
EN/ZH
点开看双语
a16z14 天前

Ben Horowitz 谈美国活力与 AI 的未来 | The a16z Show

Ben Horowitz 与 David Ulevitch 在 a16z 美国活力峰会(华盛顿)录制本期节目,全面探讨一家风险投资机构肩负行业领导责任的意涵:从美国将 AI 融入国家防御的竞速,到 Anthropic 与战争部合同破裂的真实原因,再到风险投资行业向大型综合机构与垂直专精机构两极集中的趋势。Horowitz 最后点出他眼中美国最被低估的战略风险:当中国与日本满怀乐观向前冲时,美国国内对 AI 却弥漫着深刻的悲观情绪。 ## [00:00] 预告片 开场蒙太奇勾勒出本集的核心张力:超过 70% 的中国公民对 AI 持乐观态度,而持同等乐观立场的美国人不足 30%。David Ulevitch 道出关键筹码——a16z 已押下美国历史上规模最大的风险投资赌注,赌的是美国将赢得下一个世纪的技术竞争。 > *"超过 70% 的中国人对 AI 持乐观态度,而美国持乐观态度的人不足 30%。"* ## [00:41] 美国技术主导地位为何对世界至关重要 在 a16z 完成创纪录的 150 亿美元募资——史上规模最大——之后,David Ulevitch 追问:如此体量究竟意味着哪些义务?Horowitz 援引恩师 Andy Grove 的忠告:当你引领一个行业,整个行业的道德与操守都系于你一身。他将其转化为一个第一性原理论证:对人类而言真正重要的,是每个人是否有真实的机会去贡献自身价值,而在这一维度上,没有任何国家能与美国比肩。 Horowitz 从工业革命一路拉到当下,画出一条直线:美国赢得 20 世纪,靠的是技术优势;AI 革命呈现出完全相同的历史岔路口。他将 a16z 的使命归结为一个问题——这家机构能做什么来帮助美国在技术上取胜——并主张,从投资组合构建到政府参与的每一项决策,都源于这个北极星。 > *"所以当我思考我们在这个行业中的角色时,答案是:我们能做什么来帮助美国在技术上取胜?"* ## [04:04] 美国活力、AI 与追赶中国 Ulevitch 询问,自美国活力业务启动以来,在国家安全与风险投资交汇地带投资,哪些事情最令 Horowitz 感到意外。Horowitz 解释了为何美式自由在结构上无可替代:《独立宣言》主张权利是不言而喻的——并非政府赋予——这使这些权利几乎不可撤销,而其他任何国家都未能以同等力度复制这一特质。 谈及与中国的竞争格局,Horowitz 指出,ChatGPT 出现前,业界普遍认为中国在 AI 领域拥有巨大优势——主要原因是中国已将 AI 深度融入军队与政府官僚体系,而美国远远落后。此后最令人振奋的进展,是美国追赶的速度:一批甘愿服务于国家利益的创业者,叠加上一个真正向新公司敞开大门、愿意为此改革采购规则的联邦政府。 > *"但那种'旧有错误认知'中有一点是真实的:他们在将 AI 技术与政府——包括军事层面、官僚体系层面以及各个领域——整合方面远远领先于我们。所以当我们刚起步时,在这一方面可以说是从极度落后的位置出发的。然而令人惊讶的是,我们追赶的速度之快超出了所有人的预期。"* ## [08:50] Anthropic 合同:真相究竟如何 话题转向 Anthropic 与战争部合同高调破裂一事。Horowitz 给出一个聚焦于交易机制的解读,穿透了公开叙事的包装:Anthropic 握有压倒性的谈判筹码——他们已完成部署、国家正走向冲突边缘、软件供应商从未拥有过如此强大的议价能力——但他们选择了退出。在 Horowitz 看来,这种行为只有一种解释:Anthropic 本就想脱身,很可能是迫于内部员工压力,并借一场哲学层面的分歧作为退出的理由。 他反驳了"承接国家安全 AI 合同在道德上存在污点"这一论断。战争部所受的规则约束与监督力度远超任何私营机构,一旦规则被打破,信息泄露几乎是板上钉钉。Ulevitch 将这一观点延伸至更广泛的创业者群体:允许员工否决地缘政治决策的公司,是在用"情绪地缘政治"取代那些用毕生学习与牺牲换来真知灼见的人的审慎判断。 > *"合同破裂,是因为 Anthropic 想退出这笔交易。"* ## [13:37] 将美国活力输出至盟友 Ulevitch 提出地理扩展的问题:美国活力这个名称颇为本土化,但这项业务实际上关乎美国及其盟友。Horowitz 花了大量时间在海外拜访外国领导人——他们都希望复制美国的创业文化。他阐明了这为何困难重重:规模化创业需要一种根深蒂固的信念,即政府不会随意没收你的建设成果,而真正具备这种文化的国家寥寥无几(瑞典和以色列是值得一提的例外)。 他识别出几个具体的合作机会:墨西哥在汽车及相关领域积累的高品质制造专长;日本在机器人领域的深厚积淀,以及日本国防开支的急速攀升(从 GDP 的 0% 升至 3%)——考虑到两国对中国的共同顾虑,这创造了高度契合的利益基础。该章节以 Ulevitch 指出即将到来的机器人革命将成为这一业务的下一个重大主题作为收尾。 > *"美国确实给了每个人一个机会,创业者真的可以依赖这一点。"* ## [16:56] 权力、责任与 a16z 如何服务创始人 近期有报道将 a16z 描述为一个借助资本与人脉塑造市场的"权力掮客"。Horowitz 重新诠释了这一标签:权力并非机构为自身利益所积累的东西——它是提供给创始人的产品的一个特性。创业者拥有绝妙的想法,却缺乏敲开国会正确大门、拿下关键企业客户或驾驭监管的能量;a16z 的规模将这一差距转化为创始人的优势。 内部文化则有意为之地发挥反制作用。机构的首条文化原则——"一流的商业,只以一流的方式进行"——意味着准时赴约、及时回复、诚实待人。这些小细节防止机构滑入将创始人视为请托者而非合作伙伴的姿态。 > *"所以在我看来,权力是我们产品的一个特性。"* ## [18:58] 风险投资现状:为何大多数机构无法规模化 Horowitz 从结构层面解释了为何大多数风险投资机构无法突破一定规模。这个行业最初的设计前提是:每年只有约 15 家公司能跻身年营收 1 亿美元的行列,因此共享收益与共享控制权的小型合伙人制度是合理的。Mark Andreessen 提出的"软件正在吞噬世界"命题让这个前提彻底失效:如今每家公司都是科技公司,目标市场急剧扩张,对组织规模的需求随之膨胀。 要抓住这个扩张的市场,就必须进行组织重构——而重构需要一个单一的决策者。建立在共识控制基础上的机构无法顺畅重构,因为在重构中失去权力的人必然会从内部阻挠。a16z 自创立之初便实行集中控制,因而能够反复重构,如今已拥有 600 余人,以小团队形式共用一个统一平台运作。最终格局呈哑铃状:覆盖每个技术领域的大型综合机构,以及专注于 AI 基础设施、生物、加密或游戏的垂直专精机构。中等规模的综合机构正遭受双重挤压。 > *"当你重新分配权力时,那些有投票权的人会感到不满,他们会从内部破坏重组,而不完成重组就无法规模化。"* ## [23:21] 媒体新规则 媒体讨论从一个结构性观察开始:新旧媒体并非两种不同的游戏——它们是同一场游戏,只是规则变了。在稀缺时代(频道有限、格式固定),制胜策略是防守:避免失误,因为一声 Howard Dean 式的嚎叫在三台鼎立的媒体格局中将永久流传。在丰裕时代(频道无限、格式无限),制胜策略是进攻:保持有趣,因为任何无聊的内容都会淹没在噪声之中。 Horowitz 以 Alex Karp 为新范式的典范:极具娱乐性、立场始终如一(亲美),且毫不畏惧出人意料。"密集输出"的纠错机制——犯错之后连上十档播客——让个别失误变得可以承受,这在旧世界里是完全不可能的。他给创始人的忠告:你再也无法靠"不犯错"取胜;胜利属于那些值得被关注的人。 > *"所以,制胜的关键不是不犯错,而是保持有趣。"* ## [26:22] 美国的 AI 乐观主义鸿沟 Horowitz 道出他最大的忧虑:一项民调显示,超过 70% 的中国公民对 AI 持乐观态度,而持同等乐观立场的美国人不足 30%。他将这一鸿沟归因于美国媒体文化——那种系统性地放大 AI 风险(监控、就业替代、存在性威胁),却系统性地压低积极叙事的文化。他将此与日本作对比:日本对 AI 重燃热情,正在激活整个创业生态。 他向台下的创始人、政策制定者和技术人员提出请求:重新校准叙事。AI 将终结交通死亡,治愈癌症,消除我们已知的贫困。这些成果理应获得与风险同等的关注时间。他以火作类比收尾——一种能烧毁村庄的技术,却同样能温暖家园、烹制食物——并论证说,驾驭双刃剑式的风险,是每一项变革性技术的常态,而非 AI 特有的失格理由。 > *"我们将治愈癌症。"* ## 实体 - **Ben Horowitz**(人物):a16z 联合创始人及普通合伙人;全程主要发言人,援引其作为创始人、CEO 与风险投资人的亲身经历。 - **David Ulevitch**(人物):a16z 普通合伙人,主导美国活力业务;在华盛顿特区美国活力峰会上主持本次对话。 - **Andy Grove**(人物):英特尔前 CEO;Horowitz 的导师,其关于行业领导力的格言构成了本集开篇章节的框架。 - **Alex Karp**(人物):Palantir CEO;被援引为新媒体格局下直接、有趣、立场鲜明的沟通典范。 - **Mark Andreessen**(人物):a16z 联合创始人;"软件正在吞噬世界"命题的提出者,该命题是 a16z 规模化逻辑的理论基础。 - **美国活力**(概念):a16z 专注于服务美国国家利益的投资业务——涵盖国防、制造、先进软硬件——现已延伸至盟友国家。 - **Anthropic**(组织):AI 安全公司,其与美国战争部签订的合同宣告破裂;Horowitz 认为合同瓦解是因为 Anthropic 主动选择退出,而非真正存在道德分歧。 - **a16z**(组织):Andreessen Horowitz;在最新一轮募资中筹得逾 150 亿美元,为机构历史之最,也是风险投资史上规模最大的单支基金。 - **战争部**(组织):美国联邦国防部门;Anthropic 采购合同的对手方,也是美国活力投资组合公司的核心客户。 - **Palantir**(组织):国防与分析软件公司;被援引为成功在硅谷与国家安全领域交汇处运营的典范企业。

#american-dynamism#ai-policy#venture-capital
Claude Agent 平台的内部秘密:来自亲历者的深度拆解
43:21
EN/ZH
点开看双语
Every14 天前

Claude Agent 平台的内部秘密:来自亲历者的深度拆解

Dan Shipper 在 Anthropic 的"Code with Claude"开发者活动上,与 Claude 平台产品负责人 Angela Jiang 和工程负责人 Katelyn Lesse 进行了一次深度对话。三人共同拆解了 Claude 平台从简单补全 API 成长为全托管 Agent 基础设施的历程,探讨了为何执行框架(harness)与模型正日益不可分割,以及"结果 + 预算"愿景对 Agent 开发未来意味着什么。他们追溯了 Agent 生命周期的每个阶段——从启动第一个会话到停用老旧 Agent——并分享了 Anthropic 内部真实部署中的经验与教训。 ## [00:00] 一年后,平台会变成什么样 Dan 一上来抛了个之后整集都在绕的问题:一年之后,Claude 平台会是什么样?Angela 给出的画面是:Claude 对自身的理解深到能自己挑子 Agent、自己即时写出执行框架。Katelyn 接上另一半——这种世界对底层基础设施的要求会高得离谱。这段对话其实剪自节目后半段,放在开头是因为整场访谈都是在拆解:从今天的原语,怎么走到那个终点。 > *"我们希望探索这样的方向:Claude 能真正深度理解自身,自行决定应该使用哪个模型,自行决定如何启动所有子 Agent。"* — Angela Jiang ## [01:48] Claude 平台如何从 API 演进为 Agent Angela 勾勒了一条演进轨迹:从早期的 LLM API(无状态、探索性、最大曝光面),到基于会话的对话,再到如今的全自主 Agent。贯穿始终的逻辑只有一条:将抽象层提升到足够高,让客户以尽可能少的投入从 Claude 获得最佳结果。早期用户想要所有底层旋钮;如今,大多数来到 Anthropic 的团队都希望"开箱即用"地获得完整的功能集。平台的使命,就是不断缩短意图与结果之间的距离。 > *"最终可能就是这样:一套原语加上一套基础设施,让你能以尽可能少的工作量尽快获得结果。"* — Angela Jiang ## [04:09] Claude Managed Agents 的基础原语 Katelyn 解释道,Claude Managed Agents 由 Messages API 上所有人都能使用的相同原语组成——代码执行沙箱、网页搜索和内置工具——但被封装在 Anthropic 已经在内部经过实战检验的精心设计的执行框架中。Angela 补充说,团队对两类原语有明确立场:文件系统和技能(skills)。这两者被视为承重性选择,决定了 Claude 在所有 Agent 任务中的行为方式。平台设计为模块化,开发者可以在标准框架不适配的地方插入自定义组件;对于希望直接使用 Messages API 的团队,Anthropic 也发布了参考实现。 Dan 描述了他的团队在 Mac Mini 上通过 `claude -p` 命令运行 Claude 的方式,并对锁定依赖和与 Claude Code 产生分歧感到担忧。Katelyn 回应说,Anthropic 内部的第一方产品与外部客户运行在同一平台上,这意味着 Managed Agents 和 Claude Code 之间的分歧会随时间缩小。 > *"我们将我们认为最强大的那些能力整合在一起,放入一个执行框架和一套基础设施中——这就是我们认为从 Claude 获得最佳结果的方式。"* — Katelyn Lesse ## [10:37] 为什么框架与模型正在合并为一个整体 Angela 挑战了一种传统认知:通用的、可随意替换模型的执行框架才是正确架构。随着各家实验室的模型在技术路径上日益分化,真正的优势在于框架与模型的紧密协同设计,而非随意热替换。Anthropic 在内部对记忆功能测试了多个框架变体,发现它们的表现"差异极大"。这意味着:应将 Agent(框架 + 模型)作为冗余的基本单元,而非单独把模型作为单元。 Dan 追问这是否会在模型本身产生路径依赖。Angela 承认,所选择的原语确实会塑造模型的发展轨迹,一旦选错就很难纠正。她以两条分叉路径为例:过度侧重推理的模型,与深入押注计算机使用的模型——两者都难以回头。 > *"框架与模型高度绑定。你仍然需要冗余,仍然可能希望在某些任务上使用其他模型,但这种切换应该发生在 Agent 层面——即框架加模型——而不是仅仅替换模型。"* — Angela Jiang ## [18:49] 扼杀大多数 Agent 项目落地的基础设施门槛 Katelyn 指出了大多数 Agent 项目真正的拦路虎:不是框架工程,而是团队试图从原型迁移到生产时碰到的基础设施门槛。保持持久化服务器运行、管理沙箱故障、存储对话记录数据、安全注入凭证——这些平淡无奇的问题,会杀死那些在 Mac Mini 上技术上"跑通了"的项目。Anthropic 自身反复踢到这堵墙的经历,正是构建 Managed Agents 的首要动机。 Angela 将 vaults(凭证保险库)原语描述为迈向一键部署 Agent 的早期一步:一旦 Agent 身份和凭证在平台层得到安全处理,添加 Slack 集成最终应该像告诉 Claude "添加 Slack" 然后看着机器人出现一样简单。 > *"所有人都会遇到同样的问题:哦,我要么需要一台一直运行的服务器,要么需要能弹性伸缩的基础设施,还要存储对话记录,还要安全沙箱,以及所有这些事情。"* — Katelyn Lesse ## [24:49] 为什么团队 Agent 与个人生产力工具形态截然不同 Angela 解释了为何像 Claude Code 这样的个人生产力工具无法简单地扩展到团队使用。一旦三个人需要一个共享 Agent 来跨角色自动化端到端流程,笔记本电脑上的工具就会在可用性、访问控制和协调方面崩溃。她引用 Vercel CEO Guillermo Rauch 提出的内部"AI 软件工厂"框架作为团队级 Agent 采用的正确心智模型:不是个人增强,而是一套完整的组织级 Agent 堆栈,持续为公司每个职能部门产出高价值的成果。 > *"一旦到了团队层面,一切都会变得复杂得多。最明显的一点就是,它不能放在你的笔记本电脑上。"* — Angela Jiang ## [26:36] Anthropic 法律团队如何用 Agent 审查营销文案 Katelyn 介绍了 Anthropic 内部真实部署的一个案例:一个法律审查 Agent,接收营销文案提交并在任何内容到达人工律师之前完成初审。Agent 可以直接批准文案,或将其升级为人工审查,从而消除低价值的工单排队工作。其形态是在 Managed Agents 之上构建的轻量应用层,两个团队共享可见性。 Angela 和 Dan 深入探讨了为什么这是一个 Agent 而非一个技能:人在环路中的要求、启动独立会话的需要,以及多团队协作,都超出了单次技能调用所能处理的范围。由此形成的治理模型颇为亮眼:终端用户发现可以通过 Claude Code 自助完成小幅改进,而无需等待平台团队审批。Angela 将最终用户体验描述为简单地"与 Claude 对话",即便底层系统实际上是"无数个 Claude 彼此协作"。 > *"在底层,是无数个 Claude 彼此协作,直到那些 Claude 自己去完成更复杂的工作——而这些复杂工作并不需要人类逐一解读。"* — Angela Jiang ## [34:24] 用多 Agent 编排实现顾问策略、对抗组合与蜂群模式 Angela 重点介绍了人们正在用新发布的编排原语搭建的三种多 Agent 架构模式:顾问策略(将执行与建议分离)、对抗组合(一个 Agent 生成内容,另一个批判)、以及蜂群(将问题拆分为大量小的并行任务再汇总结果)。每种模式适用于不同类型的问题——蜂群擅长漏洞挖掘,而广泛研究类任务则更适合顾问或并行分解架构。乐高式的原语让从业者可以在架构层面持续优化,而不仅仅停留在提示词层面。 > *"如果我们能让原语像乐高一样,人们就可以将它们组合起来,以稍高一个层次的形式解决问题——更像是一种架构或策略。"* — Angela Jiang ## [35:50] 以"结果 + 预算"为终态衡量 Agent 的成功 Angela 阐述了长期度量哲学:将一切压缩为一个结果和一个预算,让平台解决所有中间决策。特定领域的评估指标(例如编码 Agent 的 PR 合并率)今天仍然有用,但终极目标是一个可验证的结果规格,让 Claude 能够反复自我评分。Katelyn 谈到了相邻的 Agent 老化问题:Anthropic 已经构建了技能,帮助团队在新模型发布时升级 Agent;最前沿的团队已经在运行元 Agent,持续监控其他 Agent 的性能退化并自动触发升级。 > *"我们的核心原则是:这些事物的终态,可能就是把一切压缩为一个结果和一个预算。大概就这两个参数。"* — Angela Jiang ## [39:11] 一年后的平台面貌:当 Claude 自行编写执行框架 Angela 设想了一个世界:用户只需提供结果和预算,Claude 便自行选择模型、启动子 Agent 并即时编写执行框架——完全消除框架工程,就像今天的平台已经消除了大量手动工具构建和提示词工程一样。她对"结果"这半个等式在一年内或许可以实现(允许一定的预算误差)持谨慎乐观态度。Katelyn 补充了基础设施层面的推论:这样的世界需要一个能够支持 Agent 持续自我重建的平台,在不设瓶颈的前提下处理任意形态的长期运行请求。 > *"Claude 能够充分理解自身,几乎可以即时地'写出自己',在结果和预算这个二维世界中找出必要的解法。"* — Angela Jiang ## 实体 - **Angela Jiang**(人物):Anthropic Claude 平台产品负责人;Managed Agents 产品愿景的共同设计者。 - **Katelyn Lesse**(人物):Anthropic Claude 平台工程负责人;专注于基础设施的可靠性与规模化。 - **Dan Shipper**(人物):Every 播客《AI & I》主持人;Every 的 CEO;正在 Claude 平台上构建内部 Agent 产品。 - **Claude Managed Agents**(软件):Anthropic 的托管 Agent 基础设施——一套封装了 Messages API 的执行框架加云计算环境,内置记忆、沙箱、vaults 和技能(skills)。 - **Messages API**(软件):Anthropic 的核心 API;Managed Agents 及所有第一方产品的底层原语。 - **Anthropic**(组织):构建并运营 Claude 模型系列及其平台的 AI 安全公司。 - **Every**(组织):出品《AI & I》的媒体公司;Managed Agents 的早期客户,正在构建内部编辑 Agent。 - **Stripe Minions**(软件):Stripe 基于 Agent 基础设施构建的内部端到端软件开发平台;被引用为全公司范围编码 Agent 部署的标杆案例。 - **Vercel**(组织):开发者基础设施公司;CEO Guillermo Rauch 提出的"AI 软件工厂"框架被用作团队级 Agent 采用的心智模型。 - **结果 + 预算**(概念):Anthropic 的长期设计原则——Agent 交互的最终形态只需提供一个可验证的结果和一个成本上限,平台负责解决所有中间决策。

#claude#managed-agents#ai-platform
马斯克的Anthropic交易、下一个AI垄断者?、"AI版FDA"恐慌、押注AI浪潮
1:22:01
EN/ZH
点开看双语
All-In Podcast14 天前

马斯克的Anthropic交易、下一个AI垄断者?、"AI版FDA"恐慌、押注AI浪潮

在这期极具分量的节目中,All-In的主持人们深入剖析了SpaceX意外向Anthropic出租算力一事——这笔交易或将奠定Anthropic在AI领域的主导平台地位——并就David Sacks的"洛克菲勒式"类比究竟是预言还是偏执展开辩论。随后,几人共同探讨了白宫关于"AI版FDA"的试探性表态,最终认为这不过是媒体炒作,并以对AI驱动的市场繁荣持乐观但谨慎的判断收尾。Brad Gerstner代替生病缺席的David Friedberg出场,在这期长达82分钟的节目中,带来了来自公开市场和私募市场的投资者视角。 ## [00:00] 主持人介绍!洛杉矶市长选举随想 Jason Calacanis带着全员登场:Chamath Palihapitiya、David Sacks,以及代替生病缺席的David Friedberg出席的第五位嘉宾Brad Gerstner。暖场话题很快转向洛杉矶市长选举——Spencer Pratt正在向现任市长Karen Bass发起出人意料的有力挑战。众人盛赞Pratt在辩论中的病毒式表现——他将一位市议会候选人就无家可归政策问题驳斥得体无完肤——Chamath指出,在当代政治中,一支锋利的社交媒体团队具有举足轻重的影响力。 Brad特别提到加州的一项宪法修正案倡议,该倡议拟以宪法形式保护退休储蓄并禁止财富税,他认为这可能是一个潜在的地震信号。Jason观察到,纽约市对冲基金巨头肯·格里芬公开宣布撤出对纽约的投资,起因是纽约市议员Zohran Mamdani在竞选视频中将矛头指向其住所,凸显了激进进步政治与资本外流之间的张力。 > *"如果加州实际上通过了一项保护退休储蓄和个人资产、禁止财富税的宪法修正案,而且Spencer Pratt当选,这向全国释放的信号——这是一个非常非共识的观点,但我对此越来越乐观。"* — Brad Gerstner ## [04:38] SpaceX-Anthropic交易、Elon Web Services、SpaceX IPO估值、Anthropic疯狂增长轨迹 Jason率先爆出重磅新闻:SpaceX将其全部Colossus 1算力——位于孟菲斯、以H100为核心的数据中心——出租给Anthropic,为供给受限的Anthropic新增了逾22万块英伟达GPU和300兆瓦的电力。这笔交易立即让Claude Code的速率限制翻倍,并为付费用户取消了使用峰值上限。 Chamath将Anthropic爆炸式的增长定性为纯粹的供给约束:若电力无限充裕,营收将"更加抛物线式攀升"。他认为这笔交易是马斯克战略性地为SpaceX估值故事降低风险——化解外界对轨道数据中心延期的质疑,同时产生短期收入来补贴Grok的训练成本。Brad估计这一安排将为SpaceX带来40至50亿美元的2026年增量营收,并将EWS(Elon Web Services)称为继AWS、Azure和GCP之后真正意义上的第四大超大规模云服务商。他同时警告,有组织的活动人士——而非自发的本地反对声音——正在使用与当年拖垮美国核电建设相同的剧本来阻挠数据中心的审批落地。David Sacks指出,Anthropic从1月1日的100亿美元ARR增长到4月的440亿美元ARR——他称这是硅谷从未见过的增长轨迹。 > *"硅谷从来没有见过这样的事情。别说全国其他地方了。我是说,我们在硅谷天天跟指数打交道。即便如此,大家也从未见过在这种规模级别上实现这样的增长。"* — David Sacks ## [26:48] Anthropic会成为下一个大垄断者吗?早期信号还是过度反应? David Sacks对Anthropic与约翰·D·洛克菲勒的美孚石油公司进行了深度类比,认为"安全优先"的话语体系可以发挥监管俘获的功能——为Anthropic和OpenAI的新兴双寡头构筑护城河,同时将竞争对手拒之门外。他指出,若Anthropic在未来18个月内维持10倍的年增长,它将可能成为"人类历史上有史以来最强大的垄断者",其规模将使Mag-7的合计营收相形见绌。 Brad强力反驳:按照GAAP口径,Anthropic和OpenAI仍是羽翼未丰的初创公司;谷歌和亚马逊每年产生数千亿美元的自由现金流用于押注竞争性模型;在AI赛道刚刚起跑时就采取预防性反垄断行动将是"一场灾难"。Jason将Brad的立场翻译为"别动我的纸面财富",因为Altimeter持有其中多家公司的仓位。Sacks澄清,他的北极星是充分竞争——但他将Anthropic封禁OpenClaw使用其API一事列为值得审查的具体反竞争行为。 > *"除非他们目前的发展轨迹发生某种改变,否则Anthropic将成为人类历史上有史以来最强大的垄断者——一万亿美元的ARR还在以某种速度增长。Dario称之为AGI,我称之为人类历史上最大的垄断体。"* — David Sacks ## [35:21] "AI版FDA"恐慌,白宫如何看待AI安全 有报道称,白宫正考虑发布一项行政令,成立一个AI工作组,可能要求对新的前沿模型进行预发布安全审查——据《纽约时报》报道,导火索是Anthropic的机密"Mythos"模型据称令国家安全官员深感震惊。美国国家经济委员会主任Kevin Hassett在Fox Business上以FDA进行类比,而财政部长Scott Bessent则措辞更为谨慎,强调在创新与安全之间寻求平衡。 Sacks将其中大部分内容称为被Andrew Ross Sorkin的DealBook专栏放大的"假新闻",并指出白宫幕僚长Susie Wiles已发表声明,为FDA的类比降温。他透露曾与Hassett直接交谈,确认没有任何高级官员实际支持预审批制度。他援引白宫3月20日发布的《国家AI监管框架》,证明本届政府倾向于具体解决方案,而非宽泛的监管俘获。几人最终聚焦于一项具体措施:在前沿模型API访问的预览期内引入KYC(了解你的客户)要求,以及加速向CrowdStrike和Palo Alto Networks等公司部署具备网络能力的AI。 > *"有一个相当大的AI意识形态派别或末日论者,他们基本上在采用经典的'危机不可浪费'策略。是的,我们确实面临着真实存在的网络安全问题——所有人现在都需要加固自己的系统。但他们想做的,是利用这个问题来试图在华盛顿构建一套永久性的新基础设施。"* — David Sacks ## [52:01] 扭转AI负面形象:公益、医疗与教育创新 Jason从监管防守转向主动进攻:科技行业应如何主动对抗公众对AI的负面印象?他提议,即将上市的公司——Anthropic、OpenAI、SpaceX——可以通过"Invest America"账户,将1%至5%的IPO所得专门划拨给每一位美国人,创造切实可感的共同收益。他还呼吁认真对待最低工资和全民医保议题,认为财务状况更健康的消费者群体从结构上有利于资本主义本身。 Brad支持"Invest America"理念,并补充说数据中心所在社区应获得直接收益,例如免费的本地用电。David转向政治显著性数据:在39项选民议题中,AI排名第29位——远低于生活成本和经济增长,而在这两项指标上,AI恰恰具有通缩和扩张的正向作用。行业真正应该传递的信息是经济成果,而非安全治理。Chamath给科技领袖的沟通能力打了"D减,正在向F滑落"的低分,并呼吁科技界在美国大规模进行切实的再投资。 > *"我认为,对于科技、科技寡头、硅谷,尤其是AI,存在着相当深刻的风向转变。这种风向转变已经在主街层面发生,我认为它正开始向华盛顿渗透。"* — Chamath Palihapitiya ## [60:04] 交易AI市场,经济现状 Brad领衔进行全面的市场盘点:AWS年化营收达1500亿美元(增速28%),Azure达1080亿美元(增速39%),谷歌云达800亿美元(增速63%)。标普500指数创历史新高,10年期国债收益率为4.3%,通胀处于受控状态——远好于此前围绕关税和地缘政治冲突所预测的各种悲观情景。标普500运营利润率从2023年的11%改善至2026年第一季度的13%,而Mag-5的合计员工人数三年间仅增长3%,营收却大幅飙升。 Chamath则呼吁保持谨慎:目前仍无直接证据表明AI正在整体提升企业利润率,一场清算将在大约500天后到来——届时,运营支出削减与营收增长之间的分叉将决定AI繁荣是真实的还是海市蜃楼。Jason反驳称,对初创公司而言,投资回报率已经是"既成事实"——耐克和DoorDash的AI生成广告创意、投资组合公司以一半的人力规模交付产品。David将特朗普政府的系列政策——撤销拜登时代的芯片出口许可证和AI审批制度、释放能源许可——归功于创造了这场繁荣的条件,并指出应届大学毕业生的失业率实际上有所改善,与"初级岗位消失"的叙事相悖。 > *"我认为,姑且称之为500天吧,在这期间你只需要保持净多头。但我认为,就在未来数百天内,你将不得不面对一个重要的清算时刻。为这些token付费的人需要看到切实的收益。"* — Chamath Palihapitiya ## 实体 - **Jason Calacanis**(人物):主持人兼主持;天使投资人,播客联合创始人 - **Chamath Palihapitiya**(人物):Social Capital普通合伙人;联合主持人;AI投资回报率和市场周期的逆向宏观声音 - **David Sacks**(人物):联合主持人;前白宫AI与加密货币事务主管;以洛克菲勒类比将Anthropic定性为潜在的历史性垄断者 - **Brad Gerstner**(人物):Altimeter Capital创始人兼CEO;第五位嘉宾;看好算力股和AI市场结构 - **Dario Amodei**(人物):Anthropic CEO;被Sacks称为"Daario D. Rockefeller";SpaceX算力交易的当事方 - **Elon Musk**(人物):SpaceX和xAI的CEO;Elon Web Services和Colossus 1算力租赁策略的架构师 - **Anthropic**(机构):Claude背后的AI实验室;四个月内ARR从100亿增至440亿美元;垄断争议和FDA讨论的核心 - **SpaceX / xAI**(机构):Colossus 1数据中心的出租方;以EWS品牌定位为新兴第四大超大规模云服务商 - **Elon Web Services (EWS)**(概念):SpaceX的算力租赁业务,定位为AWS、Azure和GCP的超大规模竞争者 - **Mythos**(软件):Anthropic的机密网络能力前沿模型,据报道令白宫国家安全官员深感震惊 - **KYC for AI**(概念):在前沿模型API访问预览期内要求进行身份核验的提案 - **Invest America**(概念):提议IPO阶段的科技公司将部分所得划拨至美国公民的全民投资账户

#ai-monopoly#anthropic#spacex
Claude Code 中的 Hooks
3:21
EN/ZH
点开看双语
ClaudeClaude Code 10115 天前

Claude Code 中的 Hooks

Anthropic 对 Claude Code Hooks 的简短演示——这是一种确定性的"逃生舱口",用于那些在每次编辑、每次工具调用、每次提交时都必须执行的操作。核心理念:如果你在 claude.md 里写了"始终运行 prettier"并寄希望于模型,那你已经输了;把它移到 Hook 中去。 ## [00:02] 什么是 Hooks 以及为何具有确定性 Hooks 在 Claude Code 生命周期的固定时间点触发,讲解者的核心论点是:与提示级别的指令不同,Hooks 始终会执行。在 claude.md 中告诉模型在每次文件编辑后运行 prettier,大多数时候会奏效——但"大多数时候"正是 Hook 所要填补的空缺。意图相同,但由运行时强制执行,而非向 LLM 建议。 > *You can tell Claude in your claude.md file to run prettier after every file edit and most of the time it will do that, but sometimes it won't. It's not perfect. But a hook makes it happen every single time with no exceptions.* ## [00:37] 常见使用场景 四个典型示例划定了应用范围:文件编辑后自动格式化、记录所有执行命令以满足合规要求、阻止危险操作(如修改生产文件),以及在 Claude 完成长时间任务时向自己发送通知。 > *Common use cases could include auto formatting after file edits, logging all executed commands for compliance, blocking dangerous operations like modifying production files, and sending yourself notifications when Claude finishes a task.* ## [00:52] 配置 Hooks 与五个生命周期事件 配置写在 `settings.json` 中:选择一个事件,可选择用匹配器限定它适用于哪个工具,再提供一条 Shell 命令。五个事件覆盖整个循环——`UserPromptSubmit` 在 Claude 看到提示之前触发,`PreToolUse` 和 `PostToolUse` 包裹每次工具调用,`Notification` 在 Claude 向用户发送通知时触发,`Stop` 在 Claude 完成响应时触发。 > *Pre-tool use which runs before a tool call, post-tool use runs after a tool call completes. Notification runs when Claude sends a notification, and stop runs when Claude finishes responding.* ## [01:22] 使用 post-tool-use hook 自动格式化 典型示例:一个匹配器为 `Edit` 或 `MultiEdit` 的 `PostToolUse` Hook,在 Claude 修改文件时触发。该命令检查文件扩展名并路由到正确的格式化工具——TypeScript 用 prettier,Go 用 gofmt,Python 用 ruff,或项目统一规定的任何工具。 > *You set a post-tool use hook with a matcher of edit or multi-edit, right? So, it fires whenever Claude modifies a file. The command checks the file extension and runs the appropriate formatter.* ## [01:49] 用 pre-tool-use 和退出码阻止工具调用 `PreToolUse` Hook 通过 stdin 以 JSON 形式接收工具名称和输入,并通过退出码决定执行结果:`0` 表示继续,`2` 表示阻止。当 Hook 阻止操作时,它写入 stderr 的内容会作为反馈传回给 Claude,让模型知道原因并调整计划。这正是执行硬性规则的地方——阻止写入生产配置目录、拒绝包含 `rm -rf` 的 bash 命令、阻止向 main 分支提交。讲解者的观点:这些是团队需要保证的事情,而不仅仅是建议。 > *If it exits with code two, the action is blocked and the STD error message gets fed back to Claude's feedback so Claude knows why it was blocked and can adjust.* ## [02:26] 项目级 Hooks 与团队共享 `.claude/settings.json` 中的 Hooks 是项目范围的,可以提交到代码仓库,这意味着整个团队在克隆后会自动继承它们。通过 `CLAUDE_PROJECT_DIR` 环境变量引用脚本,确保无论 Claude 的当前工作目录在哪里,命令都能正确解析。最终原则:如果某件事每次都必须执行,不要把它写在提示里——把它放到 Hook 中。 > *If something needs to happen every time without fail, don't put it in a prompt. Put it in a hook.* ## Entities - **Anthropic Tutorial Narrator** (Person): Anthropic Claude Code 101 系列教程的官方解说员。 - **Claude Code** (Software): Anthropic 的智能终端编码工具,Hooks 在其生命周期事件中插入运行。 - **Hooks** (Concept): 在 Claude Code 循环固定时间点触发的确定性命令——提示级指令的运行时强制替代方案。 - **settings.json** (Configuration): Hooks 声明的位置;项目根目录下的 `.claude/settings.json` 提交到仓库,供团队共享相同规则。 - **PreToolUse / PostToolUse / UserPromptSubmit / Notification / Stop** (Events): Hook 可附加的五个生命周期事件。 - **CLAUDE_PROJECT_DIR** (Environment variable): 在 Hook 命令中用于引用项目相对路径脚本,与 Claude 当前工作目录无关。

#claude-code#hooks#developer-tools
⚡️ Matt Pocock - 为何工程基础在 AI 时代更加重要
22:02
EN/ZH
点开看双语
Latent Space15 天前

⚡️ Matt Pocock - 为何工程基础在 AI 时代更加重要

Matt Pocock 在 AI Engineer Europe 与 swyx 共同论证:旧日软件设计经典——DDD、深模块、统一语言——在 AI 编码时代不是过时了,而是更加重要。核心论点:代码不只是编译目标;对人类来说易于修改的代码库,对 AI 同样易于修改。两人沿途还聊到课程制作、为何传统讲授仍胜过 AI 原生学习,以及 TypeScript 悄然主导 AI 工程生态的现象。 ## [00:04] AIE Europe 开场与魔咒课程 swyx 在伦敦 AI Engineer Europe 播客展台迎接 Matt。Matt 开玩笑说 AIE 是他参加过"最糟糕"的活动(实际上场地令人叹为观止),随后谈到他刚结束两周制的 Claude Code 课程。他解释了为何采用短期集训制:AI 发展太快,自主进度课程无法保证及时更新,而"魔咒"——在课程发布时碰上颠覆性变更——已成常态:AI SDK v4 课程第二天 AI SDK v5 就发布了,这次 Claude Code 课程期间源码又意外泄露。 话题随后转向教学本身作为一种手艺。Matt 拒绝成为"预言者"型 YouTuber——他不预测未来,只教授经久耐用的内容——并指出"教师优先"的定位是他内容的核心差异所在。 > *我不是那种试图预测未来的人。我只是想教好东西。* ## [02:51] 为何工程基础在 AI 时代更加重要 Matt 预告了他在 AIE 的演讲主题。流行叙事说代码已不重要,因为英语加上 AI 编译器就能生成应用程序。但每次他试图忽略代码,最终都落得"一团糟"。于是他重拾经典——《极限编程》《程序员修炼之道》《软件设计哲学》以及 DDD——并发现这些原则可以直接移植到提示词中。即便将实现委托给 AI,仍在脑中维护架构,会带来超额回报。 > *如果你的代码库对人类来说易于修改,那它对 AI 来说也会同样易于修改。* ## [04:23] 窄腰架构与深模块 swyx 引入互联网架构中的"窄腰"概念(TCP/IP、HTTP 处于第 3-4 层),将其作为约束 AI 生成混乱代码的方法:定义严格接口,委托内部实现。他将这一思路延伸到以九人团队运营 AIE——"模型-视图-爪"(model-view-claw)而非 MVC,人与 AI 之间的协调才是真正的系统问题。 Matt 将此映射到 John Ousterhout 的"深模块"概念:在简单接口背后封装大量功能,即端口与适配器风格。这在他的经验中是将 AI 用于编码的最佳方式——人类负责把控接口,然后将实现委托给 AI。 > *深模块本质上就是——用简单的接口封装大量功能。有点像端口与适配器,对吧?* ## [06:37] 领域驱动设计遇见 AI DDD 正在迎来复兴,Matt 认为这是因为这套框架已经存在足够长时间,已沉淀进这些模型的潜在空间。你不需要发明新词汇;你可以接入一个模型已经理解的、可组合的体系。更深层的原因:DDD 从根本上就是关于让代码与语言对齐——而这恰恰是与 AI 对话时最需要的事情。 他用 `mattpocock/skills` 仓库(约 1.3 万星)及其"统一语言"技能加以具体说明——这是一个 Claude Code 技能,可扫描代码库、挖掘晦涩的术语,并与你共同将其提炼成一个 Markdown 文件,他在提示时会一直保持打开状态。他在 `agents.md` 中引用了它,但不会整段粘贴,这样 Agent 在搜索这些词汇时能自行找到它。 > *本质上,你是在构建一个统一的领域模型,让 AI 和你说同一种语言。* ## [10:05] 教学作为一种超强技能 swyx 问 Matt 是如何把事情讲解得如此出色的。Matt 的答案是:在成为开发者之前,他做了六年声音教练——当他以初级开发者身份入行时,沟通能力感觉就像一种不公平的优势。此后他不断收窄焦点:将时间对半分给学习材料和寻找合适的表达方式。经典著作在这方面帮助很大,因为它们提供了现成的心智模型,让他能借此解释新概念。 他还介绍了自己的课程制作流程:一个"探索与利用"阶段、卡片盒笔记风格的 Obsidian 知识库、一个定制规划应用、P1/P2/P3 优先级排序,以及"每节课只教一件事"且显式声明依赖关系的原则。他生产的大部分内容最终都被剪掉了。 > *沟通能力一直让我感觉是一种荒谬的超强技能,是我口袋里旁人都没有的东西。* ## [13:20] 人们究竟如何学习 AI 工程 话题转向 AI 是否改变了人们的学习方式。Matt 区分了知识(讲授)、技能(互动练习)和智慧(小组讨论——如今也包括与 AI 对话)。反直觉的是,他越是倾向于 AI 实验性教学,越会让受众反感。大多数学习者仍然希望接受传统讲授;swyx 回忆起 Maven 的基于集训的教育路径最终也落在了同样的地方。 Matt 的折中方案是强制完成作业,但不强制形式:在 TypeScript 课程材料中,他先让学习者直面问题,之后再给予知识讲解。 > *我越是倾向于那种 AI 实验性的东西,实际上就越会让人们对我的材料产生抵触。* ## [15:04] TypeScript 超越 Python swyx 指出 TypeScript 今年在 GitHub 调查中超越了 Python——这是他未曾预料到的转变,尤其是在 Python 的表达力一直主导后端 AI 工程的背景下。Matt 的信息茧房 100% 是 TypeScript,但他真正的论点在于生态系统:当你关注用户体验和交付聊天类应用时,框架引力在 TypeScript 一侧(Vercel 的 Next.js、Cloudflare 的各种变体)。swyx 承认这将实质性地改变他所推广的框架选择。 > *如果你关注用户体验,关注交付优质产品,你大多数时候都是在用 TypeScript 做。* ## [16:45] 控制反转与可组合技能 Matt 展望未来。他押注的 TypeScript 评估工具(Everlight)陷入停滞——"没人想做评估"。下一个前沿是*控制反转*:随着编码 Agent 在架构上趋于同质化(Firebase 风格后端、小型工具集),真正有趣的维度变成了控制权究竟掌握在开发者还是运行框架手中。Claude Code 的不透明性换来了易用性,但牺牲了可观测性;Pydantic AI("Pi")走向另一个极端——完全控制,完全维护负担。 他最后将视野拓展到编码 Agent 之外。软件工程师目前领先一步,是因为 AI 在他们的领域能产出高质量输出;但他编写的可组合技能——比如那个三句话"审问我"技能,让 AI 不断追问直到双方达成共同理解——可以推广到任何你希望 AI 与你保持一致的领域。 > *控制反转将变得非常重要——你把更多控制权交给开发者,而不是交给运行框架。* ## 实体 - **Matt Pocock**(人物):Total TypeScript 与 AI Hero 的创始人;通过两周制集训课程教授 TypeScript 和 AI 工程。 - **Shawn Wang / swyx**(人物):主持人;AI Engineer 及 AIE 系列会议的创始人。 - **AI Engineer Europe (AIE)**(组织):本次对话录制地点,位于伦敦;Matt 的演讲在 13 天内获得 100 万次观看,创 AIE 历史最快纪录。 - **AI Hero**(组织):Matt 的 AI 工程教育平台(aihero.dev)。 - **Claude Code**(软件):Anthropic 的编码 Agent;Matt 刚结束课程的主题,也是全程反复出现的示例。 - **Domain-Driven Design (DDD)**(概念):以将代码与业务领域语言对齐为核心的软件方法论;Matt 认为它可以直接移植到 AI 提示中。 - **Ubiquitous Language**(概念):DDD 中维护共享词汇文档的实践;Matt 同名的 Claude Code 技能可扫描代码库并与用户共同提炼这份词汇表。 - **Deep Modules / Narrow Waist**(概念):架构模式(Ousterhout / 互联网协议):在小接口背后封装大量功能——Matt 在 AI 辅助代码库中偏好的架构形态。 - **mattpocock/skills**(软件):Matt 的开源 Claude Code 技能仓库;录制时约 1.3 万星。 - **Pydantic AI (Pi)**(软件):基于底层原语构建的 Python Agent 框架;被引用为 Claude Code 不透明框架的高控制度对立面。 - **Obsidian**(软件):据报道由四人团队运营的笔记应用;用作非工程领域 AI 杠杆效应叠加的示例。

#ai-engineering#software-design#typescript
我们为什么从 Claude Code 切换到 Codex
58:23
EN/ZH
点开看双语
Every16 天前

我们为什么从 Claude Code 切换到 Codex

Dan Shipper 与 Every 增长负责人 Austin Tedesco 探讨了为何 Codex 桌面应用已成为他们一切知识工作的首选界面——从起草上市计划到搭建实时 KPI 看板——在数月的并行使用后取代了 Claude Code。Dan 将这一转变定性为全新"Agent 管理界面"操作系统的崛起,Austin 则通过屏幕共享演示了他实际搭建的 Codex 工作环境,涵盖自动化方案、专用 Agent 矩阵以及招聘工作流。这期节目同时也是一份面向非工程师的实操指南,帮助他们复用同一套打法。 ## [00:00] 知识工作的新操作系统 Dan 开口就放话:三个月前 Codex 还是一坨垃圾。而现在 Austin 是那种每天早上第一件事就是打开 Codex、把 80% 工作时间塞进去的工程师。Dan 把这背后的结构性变化点出来:一个能伸手进你文件系统、浏览器、已接入应用的通用编程 Agent,正在变成知识工作的操作系统——所有主流实验室都在抢这块入口。 > *"有一个新的操作系统正在决定你如何工作、在哪里工作,它就是这种 Agent 管理界面。"* — Dan Shipper ## [00:57] Codex 如何从高级工程师专属工具演变为知识工作的日常利器 Dan 梳理了 Codex 的演变轨迹:从最初定位为面向高级工程师的沙箱结对编程工具——"它会和你争论,让你觉得自己很蠢"——到如今基于 GPT-5.5 构建的桌面应用。他将这一转型归因于 OpenAI 观察到 Anthropic 用 Claude Code 证明了一件事:一个具备情感智能、反应迅速、原生适配计算机的 Agent 能为程序员和知识工作者带来跨越式体验。现在各模型公司都在争夺 Agent 管理桌面的主导权:Anthropic 有 Claude Code 和 Claude.ai 桌面端,OpenAI 有 Codex,xAI 则实际上已将 Cursor 收入囊中。 ## [02:42] Claude Code 如何证明优秀的编程 Agent 同样适用于任何知识工作 Dan 解释了改变一切的洞见:如果 Agent 能自主编写软件,它就能自主完成任何知识工作。Claude Code 率先证明了这一点,将非工程师——包括 Austin——也带入了以 Agent 为核心的工作流。OpenAI 在过去三个月对 Codex 的大幅转型,正是对这一验证的直接回应。Dan 将新范式描述为:你的 Agent 是你与软件、互联网和日常任务的交互界面,而不仅仅是代码副驾驶。 > *"如果它能自主编写软件,它就能自主完成任何知识工作。"* — Dan Shipper ## [07:24] Austin 切换到 Codex 的历程 Austin 回忆了他的"Agent 觉醒时刻":12 月份花了整整一周时间深入使用 Claude Code CLI,将其接入工作和个人生活中的所有工具,发现它在战略思考、数据分析和营销文案起草上不可或缺。两个月后初次体验 Codex 时感到陌生——模型态度傲慢,当他要求给出更清晰的解释时,对方反问"为什么?"。于是他继续用 Claude Code 承担 80% 的知识工作,同时只将 Codex 用于工程任务。转折点是提前获得了 GPT-5.5 的访问权限:在模型能力旗鼓相当的情况下,决定性优势在于 Codex 桌面应用本身——速度更快、组织更清晰,子 Agent 也"开箱即用"。 > *"所以说 Codex 应用可能好出 30% 到 40%,这已经是很大的差距了。"* — Austin Tedesco ## [13:48] Austin 如何通过文件夹、密钥和审查 Agent 搭建 Codex 工作环境 Austin 共享屏幕,展示了他在 Codex 应用中创建的"Every Growth OS"文件夹:目录中包含公司所有工具(Gmail、Slack、Notion、Stripe)的 API 密钥、一份同步到 GitHub 的 CLAUDE.md 项目上下文文件,以及一套从 Kieran Classen 的 Compound Engineering 插件派生的自定义审查 Agent。标准 Compound Engineering 审查器专注于安全和前端设计,而 Austin 的派生版本——以"Compound Knowledge"公开发布——则审查与公司目标的战略一致性和数据准确性,使其适用于知识工作计划而非代码 PR 审查。这一文件夹架构让 Austin 无需切换应用,就能从起草上市方案无缝跳转到提交代码 PR。 > *"它连接了我们在 Every 使用的一切工具,还有一些项目说明文件,解释 Every 的业务是什么、我们关注什么、我们喜欢怎样协作。"* — Austin Tedesco ## [18:24] 用 Codex 在 Gmail、Slack 和 Notion 中头脑风暴自动化方案 Austin 演示了他为 Codex 新用户推荐的入门路径:在 Growth OS 文件夹中打开一个新对话,运行 Compound Engineering 的头脑风暴工作流,然后提示模型查看 Gmail、Slack 和 Notion 并提出自动化建议。Codex 据此呈现了一个"跟进雷达"——对跨平台收到的通讯进行分级处理、活动和营期的指挥中心视图,以及招聘流程自动化方案——全部根据 Austin 的实际工作场景量身定制。在会话过程中,Codex 编写了几乎不需要调整的自动化脚本并开始排期;Austin 重点展示了一个夜间草稿回复例程,它会汇总未回复的消息并准备好回复内容,等待一键点赞确认。 > *"它们几乎不需要任何调整,就能成为我每天都会用到的东西。它根据对我的了解生成了这套操作指令。"* — Austin Tedesco ## [22:42] Codex 起草通讯内容时 Austin 如何把控人工审核环节 观众 Margaret 的现场提问促使 Austin 详细介绍了他的人工介入审核规范。所有起草和编排工作都在 Codex 内部完成,但最终审核刻意在原生应用中进行:Slack 草稿回复在 Slack 的草稿标签中审核;邮件草稿在 Gmail 中审核;战略计划在 Notion 或 Proof Markdown 查看器中审核。走出 Agent 操作界面"让我的大脑重新清醒",然后再将内容发给真实的人。另一位提问者、音乐人 Alex 询问如何保护高价值客户邮件,由此引发了一段讨论:Austin 如何将 Every 的 Kora 邮件助手与 Codex 管理的规则结合使用,包括让 Agent 通过提问来推导邮件规则,而不是让用户手动指定。 > *"我就是喜欢在内容真正触达人类之前的最后一关,走出这个 Agent 空间,在另一个界面做最后的检查。"* — Austin Tedesco ## [28:54] 受产品高管 Claire Vo 启发,用 Codex 构建专用 Agent 矩阵 Austin 讲述了受 Claire Vo 与 Lenny Rachitsky 访谈启发的经历——Vo 在访谈中提到,六个专用 OpenClaw Agent 的组合(而非一个功能臃肿的主 Agent)是释放杠杆效应的关键。Austin 直接将那段访谈文字稿粘贴进 Codex,提示它提出六个针对 Every 增长职能的 Agent 方案,并部署到公司 Slack。这些 Agent 偶尔会出问题,但调试很简单:截图报错输出,或在 Codex 中 @-提及相关 Slack 讨论串,让它修复 Agent 的架构。最终形成了一个自我修正的闭环:Agent 故障变成 Codex 任务。 > *"我实际上就是把 Claire 与 Lenny 那期访谈的文字稿发给它,然后说:我也想这么做,结合你对我和我工作的了解,给我建议。"* — Austin Tedesco ## [31:09] 将会议记录和 Slack 讨论串整合为上市计划 Austin 演示了他最省时的工作流:用 Codex 对所有存储在 Notion 的会议记录和 Slack 讨论串运行 Compound Engineering 头脑风暴步骤,为 Every 即将推出的 Plus One 产品组装上市计划,全程无需切换工具。在会议间隙仅有五分钟的碎片时间里,Austin 提示 Codex 查看已排定的内容日历(这一步骤若不提醒会被跳过),生成一份 Proof 文档,并将最终计划推送到 Notion。结果达到了 80%–90% 的完成度。Dan 补充了一个规范性观点:他更倾向于阅读 AI 写的文档,因为这让同事更容易产出内容,而 Every 的标准是:无论 Agent 写了什么,你都要为其承担全部责任。 > *"我依赖这个模型去查看所有我们已经讨论过、思考过的上市策略内容,把它们整合在一起,然后审查,对吧?"* — Austin Tedesco ## [40:15] 在 Notion 中构建可供 Agent 读取的实时 KPI 追踪器 Austin 分享了一个更技术性的工作流:将 Every 的 KPI 追踪器重建为 Notion 数据库,通过 Notion 的 Workers 工具每六小时从 Stripe、社交平台和其他数据源拉取更新。这个追踪器被刻意设计为既对人类可读、也对 Agent 可读,这样任何团队成员的 Agent 都能查询它并采取自主行动——例如,当某个 SEO 关键词表现不佳时自动启动落地页搭建。挑战在于:模型无法一次性生成完整追踪器,因为 MRR 数字哪怕有 3%–5% 的误差对商业决策来说都是不可接受的,所以 Austin 在逐列验证。Dan 指出了一致定义收入指标这件事在哲学层面的复杂性。 > *"所以我一直在做这个在我看来相当复杂的工作流:让我们在 Codex 中一起搭建这张表,让它实时存在于 Notion 数据库里,供我们所有的 Agent 调用。"* — Austin Tedesco ## [44:54] 用 Codex 辅助招聘 Dan 分享了用 Codex 做出站招聘的经历:他让 Codex 整理 General Assembly 的校友名单,然后筛选出其中后来转向 AI 领域的人,目标是为 L&D 总监职位寻找候选人。名单上的第一个名字正是 Dan 认为最合适的人选,而且此人已经在 Twitter 上关注了他,可以直接发私信。这一段随后延伸为更广泛的 Q&A:Austin 讨论了何时应该派生 Compound Engineering、何时直接开箱使用,团队如何用一个共享的 Notion"compound"数据库积累每次会话的学习成果并将其转化为可复用的技能,以及 Every 的"思考周"——每半年一次暂停日常工作的整周——如何为深度 AI 探索创造组织空间。 > *"尤其是任何类型的出站工作,它真的能在干草堆里找到那根你要找的针。"* — Dan Shipper ## 实体 - **Dan Shipper**(人物):Every 联合创始人兼 CEO;AI & I 播客主持人;AI 与氛围编程主题文章作者 - **Austin Tedesco**(人物):Every 增长负责人;Codex 深度用户,负责管理 Growth OS 项目和专用 Agent 矩阵 - **Claire Vo**(人物):产品高管,其关于专用 Agent 矩阵的访谈启发了 Austin 在 Every 搭建多 Agent 体系 - **Kieran Classen**(人物):Every 工程师;Compound Engineering 插件创始人,该插件是 Austin 知识工作派生版的基础 - **Codex**(软件):OpenAI 的桌面 Agent 应用,本期讨论的核心工具;基于 GPT-5.5 运行,支持子 Agent、文件夹范围项目和插件集成 - **Claude Code**(软件):Anthropic 基于 CLI 的编程 Agent;Austin 切换到 Codex 之前的日常主力工具 - **Compound Engineering**(软件):Kieran Classen 开发的插件工作流框架;提供结构化的头脑风暴、规划和审查步骤,可跨 Claude Code 和 Codex 使用 - **Every**(组织):聚焦 AI 的媒体与软件公司,出版文章、课程和工具,运营 AI & I 播客 - **OpenAI**(组织):Codex 和 GPT-5.5 的创造者;向营地参与者提供 ChatGPT Pro 订阅积分 - **Notion**(软件):Every 的主要知识管理和文档平台;用于存储会议记录、KPI 追踪器和可供 Agent 读取的数据库 - **GPT-5.5**(软件):驱动当前 Codex 桌面应用的 OpenAI 模型;在 Austin 的知识工作任务中达到了与 Claude Opus 相当的水准

#codex#claude-code#ai-agents
FFmpeg:互联网视频背后的神奇技术 | Lex Fridman 播客 #496
4:18:22
EN/ZH
点开看双语
Lex Fridman16 天前

FFmpeg:互联网视频背后的神奇技术 | Lex Fridman 播客 #496

Lex Fridman 与 Jean-Baptiste Kempf(VideoLAN 主席、VLC 首席开发者)以及 Kieran Kunhya(资深 FFmpeg 贡献者、FFmpeg 在 X 平台官方账号的操盘手)进行了长达四小时的深度对话,探讨支撑互联网几乎所有视频的无形机器。他们完整追溯了从原始字节和 container 格式到手写汇编、codec 逆向工程的全过程,并正面审视了开源可持续性危机。这场对话既是一堂技术大师课,也是一次深刻的反思——那些才华横溢的志愿者(其中许多还是青少年)为何默默构建起每天为数十亿台设备提供动力的基础设施。 ## [00:00] 精彩片段 本集以一段快节奏的精彩集锦开场,凝练了后续内容的精华。Kempf 提炼出 FFmpeg 社区的核心价值观:代码质量是唯一的凭证——"也许你是一条狗,我无所谓。我只需要看你的代码。"Kunhya 补充了规模数据:FFmpeg 在任意时刻运行在约 1 亿个 CPU 上,30 亿台设备持续解码视频,而 FFmpeg 的 x86 汇编手工优化比等效 C 代码快 62 倍。本段还预告了 CIA-VLC 间谍故事、Kempf 断然拒绝情报机构后门请求的经过,以及 Kieran"无怨无悔"的 Twitter 哲学。 > *"我们在乎出色的代码,不在乎你是谁。也许你是一条狗,我无所谓,对吧?我只需要看你的代码。"* — Jean-Baptiste Kempf ## [02:17] 介绍 Lex 描绘了背景:FFmpeg 是 YouTube、Netflix、Chrome、VLC、Discord 以及几乎所有涉及视频或音频的平台背后那根看不见的脊梁。VLC 的下载量已超过 65 亿次。两个项目均完全由志愿者构建。Lex 将这期节目定位为不仅仅是一场技术讨论,更是对那些为了技艺本身而非名利而工作的工程师们的致敬——"这是人类悄然跨越国界协作、构建有用、耐久且优雅之物的最伟大范例之一。" > *"这是有史以来最令人难以置信的软件系统之一,而这一切都由志愿者完成。"* — Lex Fridman ## [05:35] VLC 能打开的最奇怪的东西 对话轻松起来,聊起了 VLC 对奇异格式的传奇兼容性。Kempf 描述了用户通过采集卡录制 VHS 磁带、支持自定义加密的 DVD-Audio,以及 FFmpeg 专门为卢卡斯影业《星球大战》游戏 codec 实现的解码器(仅用于一段 10 秒的开场动画)。在一次 VideoLAN 大会上,参赛者竞相创作史上最残破的文件——一个 MKV,每一帧的分辨率、宽高比和旋转方向都不同——而 VLC 完美播放了它。节目中还聊到了那个橙色交通锥的 logo:辨识度极高,以至于 VLC 网站 25% 的流量来自搜索"锥形播放器"的用户。 > *"有个文件同时是一个有效的 ZIP 又是一个有效的 MP3,诸如此类——VLC 打开了所有这些奇怪的文件。"* — Kieran Kunhya ## [09:59] 视频播放原理 Kempf 和 Kunhya 逐步讲解按下播放键后发生的一切:播放器从 URL 获取字节流,解复用器分离音频、视频和字幕轨道,熵解码消除数学压缩,帧内预测重建静态图像帧(I 帧),运动补偿处理时间冗余(P 帧和 B 帧),最终将原始像素交给 GPU 或声卡。视频压缩通过利用人眼对亮度与色彩感知差异——在 YUV 色彩空间而非 RGB 中处理,并跨帧复用不变的背景区域——实现 100 到 200 倍的压缩率。Kunhya 警告说,这条流水线中的每一句话背后,都是某人一生的工作。 > *"我们刚才在过去几分钟里说的一切,每一句话都是某人一生的工作。关于每一句话,都有专著论述。"* — Kieran Kunhya ## [19:20] 视频 codec 与 container 主持人厘清了经常被混淆的 container 与 codec 的区别。container(MP4、MKV、MOV)负责多路复用音频、视频和字幕轨道;codec(H.264、AV1)负责压缩内部内容。VLC 和 FFmpeg 刻意忽略文件扩展名,直接探测实际字节——因为在现实世界中,扩展名常常撒谎。本段还介绍了 AVI 是微软的格式、MOV 经由苹果演化为 MP4,以及 Matroska/MKV 格式如何从开源社区中诞生。AV1 等现代 codec 并非单一算法,而是一套适应不同内容类型的工具集合——屏幕共享、动画、直播视频各需不同的编码策略。 > *"我们丢弃文件格式,直接查看文件内部来理解其内容,因为太多人说'哦,这是视频,一定是 MP4',但从技术上看它可能是 MOV,也可能是 MKV。"* — Jean-Baptiste Kempf ## [30:07] FFmpeg 详解 FFmpeg 被描述为一套底层库——libavcodec、libavformat、libavfilter——加上一个 Kempf 称之为完整编程语言的命令行工具。每一个正在观看 YouTube 视频、用 OBS 录制或在专业广播设备上剪辑的人,都可能在使用 FFmpeg。Kunhya 指出,万亿美元级企业和在家录制家庭视频的祖母,使用的是完全相同的技术栈。本段深入探讨了开源许可证——MIT、GPL、LGPL、AGPL——作为定义社区规范的"社会契约"。Kempf 讲述了将 VLC 核心从 GPL 重新许可为 LGPL 的艰辛历程:他必须逐一联系超过 350 位贡献者,甚至登门拜访一位已故贡献者的工厂工人父亲,只为获得两行代码的授权许可。 > *"从哲学层面来看,令人叹为观止的是,你祖母的家庭录像和万亿美元级企业站在同一条起跑线上,使用着同样的技术栈。"* — Kieran Kunhya ## [51:07] Linus Torvalds Kempf 为 Linus Torvalds 著名的严苛风格进行了细致的辩护。Linux 内核的核心社区规模极小——FFmpeg 也一样(10 至 15 名活跃维护者)——而那少数几个人必须永远维护每一行代码。"我们不能在质量上妥协,因为 FFmpeg 的核心社区只有十到十五人,而我们就是将来要维护你代码的人。"Kunhya 补充说,言辞简短往往只是疲惫使然:志愿者在工作一整天后回到家,没有精力来手把手地指导贡献者。Kempf 还指出,大多数社区成员的母语不是英语,文化误读往往放大了感知到的敌意。 > *"我们不能在质量上妥协,因为 FFmpeg 的核心社区只有十到十五人,而我们就是将来要维护你代码的人。"* — Jean-Baptiste Kempf ## [55:46] 拒绝数千万美元,让 VLC 保持无广告 Kempf 追溯了 VLC 不寻常的起源:法国一所工程学校(École Centrale Paris)的学生在 1995 年——比 YouTube 早了整整十年——为了给视频游戏提供更快的网络,自行搭建了一套卫星视频流系统。从那个 Network 2000 项目中诞生了 VideoLAN,VLC 则是其客户端。Kempf 于 2003 年加入,彼时项目已濒临消亡,他将其从数十万次安装量发展到数十亿次,并在此过程中多次拒绝了捆绑工具栏、更换搜索引擎或植入广告的"天价"提议。他的理由是:"我需要在夜里睡个好觉,对自己所做的事感到满意。如果我出卖了它,我就背叛了那么多在这里工作的人。" > *"我拒绝了数千万美元,是的,不止一次。是的,我本可以成为千万富翁,在某个海滩上晒太阳。但我没有这样做,因为我认为这样做既不道德,也不是正确的事。"* — Jean-Baptiste Kempf ## [70:04] FFmpeg 与 Google 的风波 Kunhya 回顾了一场公开争议:Google 的安全团队用 AI 自动生成 FFmpeg 的 bug 报告,在严格的 90 天截止期限内提交——有些漏洞报告甚至在补丁尚未写出之前就发给了媒体——却未提供相应修复或有意义的资金支持。Kunhya 将其比作"对冷僻的 1990 年代游戏 codec 发起的 AI 生成 bug 报告式拒绝服务攻击"。这场风波经由火辣辣的 FFmpeg 推文(Kunhya 称之为"说唱对决")不断升级,但最终产生了实质性成果:Google 开始提交补丁,并建立了针对修复工作的财务奖励机制。另一段插曲是:微软 Teams 的工程师在志愿者 bug 跟踪系统上提交了一个高优先级 bug,特意提及他们产品的用户规模,并在 Kempf 要求长期支持合同时给出了区区数千美元的一次性付款回应。 > *"Google 使用 FFmpeg 的规模,可能你我都难以想象——数百万个 CPU 核心。是的,他们在主要涉及自家产品的领域有所贡献,但从更宏观的角度来看,贡献与使用极度不成比例。"* — Kieran Kunhya ## [89:18] FFmpeg 开发者们 是什么驱使着 FFmpeg 的志愿者工程师们?Kempf 归纳出三大动力:对主题本身的热情(许多贡献者是因为热爱动漫而加入的)、对技艺卓越性的追求("这是有史以来最好的编程学校"),以及对影响力的自豪感("你可以告诉你奶奶:我做这件事,就是为了让你能在笔记本上播放视频")。Kunhya 补充说,Zig 编程语言的创造者 Andrew Kelley 曾是一名 FFmpeg 开发者,并将在那里的经历称为自己真正的实战教育。还有青少年为 FFmpeg 编写了数千行手工优化的汇编代码。Kieran 最喜欢的一句话来自 John Collison:"这个世界是热情项目的博物馆。" > *"如果你精通 C,如果你知道如何为 FFmpeg 编写汇编,我向你保证,你将成为最优秀的程序员之一——即便你从事的是 TypeScript 的编写工作。"* — Jean-Baptiste Kempf ## [95:55] VLC 与 FFmpeg Kunhya 将 FFmpeg 与 VLC 的关系定义为"双星系统":VLC 之于 FFmpeg,如同 Android 之于 Linux——它们相互依存,因彼此而成功。约 80% 的 FFmpeg 流水线依赖至少一个 VideoLAN 项目(最常见的是 x264)。VLC 让 FFmpeg 接触到现实世界中形形色色的残损文件。在为 Windows 编译时,VLC 链接了约 1600 万行代码,其中仅 100 万行存在于 VLC 自身的代码库中。两个项目共享许多开发者,共同证明了复杂的软件生态可以完全由相互依存的开源组件构建而成。 > *"VLC 之于 FFmpeg,如同 Android 之于 Linux。它们相互依存,因彼此而共存。"* — Kieran Kunhya ## [100:29] FFmpeg 的历史 FFmpeg 的"时代之旅"从 Fabrice Bellard 创立初始概念开始,随后是 2000 年代初期 Michael Niedermayer 的时代——对 DivX、Xvid、Windows Media 和 RealMedia 的全面支持,彻底消除了对臃肿、充斥间谍软件的 codec 包的依赖。2000 年代末,H.264 日趋成熟,高清视频时代随之兴起。在整个历程中,VLC 充当了 FFmpeg 的实战试炼场:数百万用户暴露出任何实验室都无法预见的边界情况。 > *"那时候你需要一个新播放器来播放每种不同格式的文件。有一个快速且开源的单一库——那是一项伟大的成就。"* — Kieran Kunhya ## [103:46] 逆向工程 codec 本段展示了逆向工程专有 codec 的艺术。Kostya Shishkov——被誉为"天才边缘人"——将 20 至 30 MB 的二进制文件(每兆字节约相当于普通人一个月的工作量)当作消遣,为 Windows Media、RealMedia 和 GoToMeeting 格式编写解码器。Kunhya 解释了其方法论:钩入专有播放器以转储原始 YUV 数据,打开反汇编器,逐条指令步进机器码,推断熵编码、预测和 IDCT 阶段,然后用样本文件验证逐位精确性。数月之内,工作没有任何可见输出——纯粹在内存中调试。 > *"他把整个世界看作一份二进制规范。他不需要文档或任何东西。他会独自离去,回来时带着有趣的成果。"* — Kieran Kunhya ## [117:01] FFmpeg 测试 FFmpeg 的 FATE(FFmpeg 自动化测试环境)系统运行着一张测试组合的数据透视表:数十种编译器(GCC、Clang、MSVC、Apple Clang、Intel Compiler)、操作系统(Linux、macOS、Windows、BSD、Solaris)和 CPU 架构(x86、ARM、RISC-V、PowerPC)。所有测试机器均由志愿者托管。该系统能捕获编译器错误编译——罕见但具有毁灭性,因为帧依赖链中哪怕一个错误的比特都可能级联成严重的画面损坏。Kunhya 说,FATE 控制台顶部的那几台 Mac 就托管在他自己的办公室里。 > *"这已经不只是一个矩阵了,更像是一张不同组合的数据透视表——全部由志愿者运行。"* — Kieran Kunhya ## [121:08] 汇编代码(手写) 这一扩展章节是本集的技术核心。FFmpeg 和 x264 中手写的 x86/ARM SIMD 汇编代码比等效 C 代码快多达 62 倍——尽管多年来不断尝试,现代编译器和自动向量化仍无法弥合这一差距。VLC 仍然支持从 Windows XP 到 Windows 11、从 macOS 10.7 到 macOS 26、iOS 9 到最新版本,以及 BSD、Solaris,甚至 OS/2。理解汇编能迫使程序员内化 CPU 流水线阶段、SIMD 寄存器、L1/L2/L3 缓存和内存总线约束。Kempf 和 Kunhya 介绍了 Loren Merritt 为 x264 构建的 x86inc 框架,以及 JB 的《Assembly Lessons》系列教程——这些已吸引直接从源头学习的青少年贡献代码。 > *"我认为有必要理解汇编语言,即使你不常用它,也是为了理解计算机内部正在发生什么。这会让你成为一个更好的程序员。"* — Jean-Baptiste Kempf ## [145:26] Rust 编程语言 Kempf 和 Kunhya 对 Rust 持不同看法。Kunhya 尊重内存安全的目标,但觉得其社区过于自以为是——"它有一种很强烈的世界语气质"——并认为 Rust 的重写仅能达到 85-90% 的所需功能覆盖率是不够的;"最后的 1% 要花掉 99% 的时间。"Kempf 编写过 Rust 的 VLC 模块,并看到了真正的价值,但指出由于底层 SIMD 工作的训练数据匮乏,AI 工具目前还无法提供有意义的帮助。讨论进一步延伸到社区的两位汇编大师:Henrik Gramner,其对 Intel x86 时钟周期数的了解超过 Intel 自己的工程师;以及 Martin Storsjö,他在看孩子们在操场上玩耍时,用虚拟键盘编写 ARM Neon 汇编。 > *"Rust 让我想起了 Sinclair C5。要让人们迁移,你必须构建一些至少与现有之物一样好,甚至更好的东西。"* — Kieran Kunhya ## [154:42] FFmpeg 与 Libav 分叉 2011 年,FFmpeg 分裂为 FFmpeg 和 Libav,主要原因是治理和领导风格分歧,而非技术层面的争议。几个 Linux 发行版一度改为打包 Libav 而非 FFmpeg。Kempf 认为开源分叉是健康的——它迫使项目正视自身的结构性弱点。最终,Libav 的大多数开发者回归 FFmpeg,两个项目重新合并。Kempf 将其与 XZ Utils 攻击事件相类比:一位独立维护者在被持续社会工程学攻击拖垮后,向攻击者授予了提交权限——这凸显了精疲力竭如何在关键开源基础设施中制造出使其脆弱的单点故障。 > *"分叉很重要,因为它们改变了社区的现状。今天的 FFmpeg 比分叉之前更好。"* — Jean-Baptiste Kempf ## [163:04] 开源倦怠 Kempf 和 Kunhya 正面审视了开源维护者的心理健康危机。Kempf 收到过实质性的死亡威胁——包括一封内含粉末的信——起因是他决定放弃对 PowerPC 的支持。安全社区习惯于为业余项目的边界情况提交警告性的 CVE,在不提供补丁的同时增加了心理负担。Kempf 现在维护着多个原维护者已精疲力竭而放弃的库。对话进一步拓展到系统性问题:libxml 和 XZ 等关键基础设施仅由一两个人维护,而依赖它们的万亿美元级企业对此浑然不觉。 > *"开源维护者的心理健康问题,是大型企业既不在乎也看不见的。"* — Jean-Baptiste Kempf ## [170:51] x264 与互联网视频 H.264 恰逢 Intel Core 2/Nehalem CPU 使实时软件解码成为可能之际,彻底改变了互联网视频。x264 的关键创新是视觉心理率失真优化——编码决策由视觉质量指标而非均方误差驱动,产出更锐利、更自然的视频。这一创新来源于动漫社区对感知锐度的高标准。AV1 在相同画质下提供比 H.264 节省 40-60% 带宽的效果,但编码成本高出两个数量级。因此 YouTube 只对热门视频重新以 AV1 编码,将额外的算力成本分摊到数百万观众身上,使其物有所值。 > *"Netflix 现在有 30% 的视频采用 AV1,YouTube 则达到了 50%。"* — Jean-Baptiste Kempf ## [184:07] 视频压缩基础 本章澄清了 I/P/B 帧结构:I 帧是完整的静态图像,P 帧只引用前一帧,B 帧可以引用前后帧。ProRes 是一种仅含帧内编码的 codec,专为非线性剪辑设计——无时间依赖关系,快速定位。本段还涵盖了固定码率与固定质量编码、图像组(GOP)长度,以及 Netflix、YouTube 和 Meta 数以千计的工程师——他们的全部工作就是针对特定内容类型调优 FFmpeg 参数。一段历史趣闻:Google Video 最初在 Internet Explorer 中以 ActiveX 插件形式使用 VLC;如今 VLC 被编译为 WebAssembly,在浏览器 JavaScript 引擎中运行。 > *"有完整帧的 I 帧、只依赖 I 帧的 P 帧,以及可以依赖前后帧的 B 帧。"* — Jean-Baptiste Kempf ## [191:04] CIA 与伪造的 VLC 维基解密的 Vault 7 披露显示,CIA 构建了一个经过修改的 VLC 版本,其中附加了一个 DLL(psapi.dll),在受害者观看电影时静默加密并窃取文件,并以视频播放预期的高 CPU 负载作为掩护。VideoLAN 发出新闻稿,提示用户只从官方网站下载。另一事件涉及中国国家级黑客:他们使用合法签名的 VideoLAN DLL 分发伪造的 VLC,以印度用户为目标,导致印度封禁 VLC,直到 Kempf 打赢官司才使禁令撤销。本段还揭示了一个隐藏功能:VLC 可以在终端以 ASCII 艺术形式渲染电影,这在通过 SSH 诊断多播网络路径时非常实用。 > *"如果我们不得不破坏我们的软件,我们宁可关掉它。这一点是明确的。"* — Jean-Baptiste Kempf ## [201:39] 超低延迟流媒体 Kempf 解释了自适应流媒体(HLS、DASH):播放器下载分段,计时下载速度,并据此调整画质档位。真正的工程前沿是具有严格固定码率约束的直播广播——卫星上行链路连一秒的突发都承受不了。Kempf 介绍了他的公司 Kyber,这是一个开源(AGPL 双重授权)的超低延迟流媒体技术栈,面向机器人和 XR 领域,将压缩视频流传输给没有板载计算能力的设备。本段以对机器人远程操作的讨论收尾——在那个领域,延迟直接决定安全性。 > *"Kyber 是开源的。Kyber 上的一切都是开源的。如果你想在你的产品中使用它而不开源,你需要支付商业许可费用。"* — Jean-Baptiste Kempf ## [219:07] AV2 codec 与视频专利 AV2 是 Alliance for Open Media(VideoLAN 亦是成员之一)内部 AV1 的继任者,承诺进一步降低 30% 的带宽占用。VideoLAN 的 dav1d 解码器将由"dav2d"接力。Alliance for Open Media 的成立正是为了逃脱 HEVC/H.265 的专利泥潭:HEVC 的三个独立专利池要求的费用如此高昂,以至于 HP 将 HEVC 支持从新款笔记本中移除,流媒体巨头们算了一笔账——从头构建一个新的免版税 codec,成本低于每年的许可费用。法国对软件专利的拒绝态度意味着 Kempf 从未支付过 codec 许可费——如果他必须付的话,账单将超过每用户 200 欧元。 > *"以每年一亿美元的规模,你知道,我可以自己创建一个 codec——而他们正是这样做的。"* — Jean-Baptiste Kempf ## [228:59] VLC 后门 来自两个不同国家的情报机构联系 Kempf,要求他在 VLC 中植入后门。他两次都拒绝了,并且他形容自己的措辞"远没有礼貌到只是说一声不"。本章进一步延伸到欧洲创业文化的讨论:Kempf 认为法国创业文化在 15 年间已经大为改观——失败的污名化在消退,AI 公司在涌现——同时也承认过度监管仍是切实存在的阻力。他以反思自己在法律和政治压力下保持平静的策略作为结尾:始终问自己"我快死了吗?我伤害到别人了吗?"如果没有,就继续前进。 > *"如果我们不得不破坏我们的软件,我们宁可关掉它。也是因为我们所做的事情是好的,而且是为所有人做的。"* — Jean-Baptiste Kempf ## [239:14] 视频归档 Kieran 介绍了档案保存社区,这个社区部分由纽约市立大学(CUNY)的 Dave Rice 引领,他们依赖 FFmpeg 作为播放面向未来多媒体的"罗塞塔石碑"。社区资助了 FFV1——FFmpeg 的无损 codec——以确保归档素材不丢失任何信息,这至关重要,因为有损压缩可能毁掉只有在仔细检视时才可见的法证或历史细节。一个著名的警示案例:BBC 于 1986 年的新 Domesday Book 项目将内容归档在 BBC Micro 电脑上,不到 20 年就没有人有能正常工作的软件来读取它了。如今,档案馆中历史录像带的数量超过了世界上能够将其数字化的功能性磁带头的数量,迫使人们做出痛苦的优先级决策——究竟要保存哪些人类历史。 > *"C 语言将如同拉丁语。它会是你从过去学到的东西,但在某些语境中仍然可用。"* — Kieran Kunhya ## [245:51] FFmpeg 与 VLC 的未来 压轴章节展望了多媒体的走向:体积视频、用于机器人的点云 codec、RGBD 深度流、XR/VR 流媒体,以及——这只是推测——有朝一日可能需要为压缩大脑数据而设计 codec 的神经接口。Kempf 对 FFmpeg 百年后依然存在充满信心;对 VLC,他的评价是"也许"。他以自己的人生哲学作为收尾:"遗憾是对心灵的税赋。从错误中学习,但不要遗憾。"本集以 Lex 朗读 Linus Torvalds 的名言作结:"大多数优秀的程序员编程,不是因为他们期待获得报酬或公众的赞誉,而是因为编程本身就是一件有趣的事。" > *"遗憾是对心灵的税赋。从错误中学习,但不要遗憾。因为事情已经发生,除非你有时光机,否则别去遗憾。"* — Jean-Baptiste Kempf ## 实体 - **Jean-Baptiste Kempf**(人物):VideoLAN 主席、VLC 首席维护者、Kyber 及其他多家公司创始人;为保持 VLC 无广告而拒绝了数千万美元。 - **Kieran Kunhya**(人物):资深 FFmpeg 贡献者、codec 工程师、Open Broadcast Systems 创始人,FFmpeg 在 X 平台官方账号的操盘手。 - **Lex Fridman**(人物):Lex Fridman 播客主持人、AI 研究者、VLC 与 FFmpeg 的长期拥趸。 - **Fabrice Bellard**(人物):FFmpeg、QEMU 和 tcc 的创造者;项目的奠基性人物。 - **Michael Niedermayer**(人物):FFmpeg 长期维护者,在 2000 年代推动了对众多 codec 的全面支持。 - **Kostya Shishkov**(人物):传奇 FFmpeg 逆向工程师,为 Windows Media、RealMedia 和 GoToMeeting codec 破解了专有二进制文件。 - **Henrik Gramner**(人物):汇编大师,其对 Intel x86 时钟周期数的了解超过 Intel 自己的工程师。 - **Linus Torvalds**(人物):Linux 和 Git 的创造者;被引作开源社区中对代码质量毫不妥协的典范。 - **FFmpeg**(软件):开源多媒体框架,提供 codec、复用器、滤镜和命令行工具;几乎所有互联网视频的无形脊梁。 - **VLC**(软件):下载量超过 65 亿次的开源媒体播放器,基于 libVLC 和 FFmpeg 构建;在任何平台上均可播放几乎任何格式。 - **x264**(软件):VideoLAN 的开源 H.264 编码器;互联网视频领域占主导地位的软件编码器,以视觉心理优化著称。 - **dav1d**(软件):VideoLAN 高速开源 AV1 解码器;广泛部署于浏览器和流媒体客户端。 - **VideoLAN**(组织):负责管理 VLC、x264、dav1d 及相关开源多媒体库的法国非营利组织。 - **Alliance for Open Media**(组织):由 Google、Netflix、Apple、Amazon 和 VideoLAN 等组成的行业联盟,创建了 AV1 并正在开发 AV2 作为免版税 codec 标准。 - **FATE**(软件):FFmpeg 自动化测试环境;由志愿者托管的 CI 网格,测试数百种编译器/操作系统/架构组合。 - **Kyber**(组织):Jean-Baptiste Kempf 的初创公司,为机器人和 XR 构建超低延迟开源流媒体技术栈,采用 AGPL/商业双重授权。 - **H.264 / AVC**(概念):主流互联网视频 codec 标准;开源实现为 x264;蓝光光盘和大多数 MP4 文件的基础。 - **AV1 / AV2**(概念):Alliance for Open Media 推出的免版税下一代视频 codec 标准;AV1 比 H.264 节省 40-60% 带宽;AV2 再减少 30%。

#ffmpeg#vlc#open-source
什么是 Claude Code?
2:55
EN/ZH
点开看双语
ClaudeClaude Code 10117 天前

什么是 Claude Code?

Anthropic 官方对 Claude Code 的全面介绍——它是什么、与 Claude.ai 有何不同,以及在让 LLM 对代码库执行命令之前你需要了解的三件事。面向即将首次安装该终端工具的开发者。 ## [00:04] Claude Code 是什么以及在哪里运行 Claude Code 被定位为一款智能编程工具:它理解你的代码库、编辑文件、运行命令,并与你已在使用的开发者工具集成。它支持多种界面——终端、VS Code、JetBrains IDE、Claude 桌面应用以及网页端——但本次演示以终端作为标准体验。 > *Claude Code is an agentic coding tool that understands your code base, edits your files, run commands, and integrates with your existing developer tools to help you get things done faster.* ## [00:34] 它与 Claude.ai 有何不同 关键区别不在于模型能力,而在于访问方式:Claude Code 可直接深入你的终端和整个代码库,复制粘贴到聊天窗口的循环从此消失——该工具在原地完成工作。称其为"AI 智能体"正是对这种直接执行能力的概括。 > *Unlike Claude AI, Claude Code has direct access to your files in your terminal and your entire code base.* ## [00:51] AI 智能体与 Claude Code 能做什么 这里的 AI 智能体是指能与环境交互、采取行动以实现既定目标的软件——最基本的形式是一个在实时循环中运行、可访问工具、外部服务和其他智能体的 LLM。对于 Claude Code 而言,这意味着具体能力:读取并解释你的代码库、跨文件追踪 bug、运行构建脚本和测试、安装软件包,以及从网络获取最新的 API 文档来决定下一步操作。 > *An AI agent is a software that can interact with its environment and perform actions to complete a defined goal.* ## [01:45] 开始前需了解的三个概念 讲解者指出了三个影响日常使用的属性。第一,**上下文窗口**是 Claude 的工作记忆——容量大但有限——这就是为什么智能体需要战略性地浏览代码库而不是全部加载。第二,Claude Code 在运行命令或修改文件前会**请求许可**;无论你是想掌控每一步还是让它基本自主运行,控制权始终在你手中。第三,它**可能出错**:误解意图、引入 bug 或过度设计解决方案。像对待任何工具的输出一样对待它,而非奉为圭臬。 > *By default, Claude Code will ask you before running commands or making changes to your code base.* ## [02:34] 总结 Claude Code 是一款智能编程工具,可读取你的代码库、编辑文件、运行命令并连接外部工具,帮助你更快交付——现已支持终端、VS Code、JetBrains 和 Claude 桌面应用。 > *Claude Code is an agentic coding tool. It reads your code base, edits your files, runs commands, and connects to external tools to help you ship faster.* ## 实体 - **Anthropic Tutorial Narrator** (Person): Anthropic 为 Claude Code 101 系列教程录制的官方旁白配音员。 - **Claude Code** (Software): Anthropic 的智能终端编程助手,可直接对你的代码库进行操作。 - **Claude.ai** (Software): 基于聊天的 Claude 产品——与 Claude Code 的环境内执行方式形成对比。 - **AI agent** (Concept): 在实时循环中运行、可访问工具、外部服务和其他智能体以追求既定目标的 LLM。 - **Context window** (Concept): Claude 的工作记忆——有限,这就是智能体选择战略性导航而非加载完整代码库的原因。 - **VS Code / JetBrains IDEs** (Software): Claude Code 支持的编辑器集成,与终端和 Claude 桌面应用并列。

#claude-code#ai-agent#developer-tools
🔬GPT-5 如何在理论物理与量子引力领域推导出新成果 — Alex Lupsasca,OpenAI
1:31:51
EN/ZH
点开看双语
Latent Space17 天前

🔬GPT-5 如何在理论物理与量子引力领域推导出新成果 — Alex Lupsasca,OpenAI

Alex Lupsasca——2024 年新视野突破奖得主、OpenAI 驻场科学家——讲述了 GPT-5 如何破解量子场论中一个困扰研究者长达一年的开放难题:证明单负胶子树图振幅非零,并找到其紧凑的闭合形式。他随后介绍了公开版 GPT Pro 如何以胶子论文为起点,在不到三天的人类时钟时间内独立将结果推广至引力子振幅。对话中,Lupsasca 深入思考了这一轨迹对物理学研究方式、新一代物理学家培养模式的意义,以及现存的核心瓶颈——验证、创造力与出版基础设施。 ## [00:00] AI 对物理学研究的影响:开篇 Lupsasca 开门见山,在正式介绍前先阐明本期节目的核心论断:AI 已越过一个临界点,能够解决困扰人类专家超过一年的问题。他认为,这不仅是理论物理学家的个案,更是科学发现本质上的深刻变革——尽管这一变革尚未得到足够的重视。 > *"这是我们已经跨越的某个里程碑,对于普通大众来说也许不太显眼,但我认为这是一次极其深刻的变化,我们确实跨越了某种阈值。"* ## [00:43] 嘉宾介绍:Alex Lupsasca 主持人 Brandon(Atomic AI)和 RJ Honicky(Miro Omix)介绍了 Lupsasca:范德堡大学教授、OpenAI 研究员,同时持有 2024 年新视野物理学突破奖(常被称为"科学界的奥斯卡")和 IUPAP 青年科学家奖。Lupsasca 随即勾勒出叙事主线:一年前,AI 对他的科研毫无帮助;ChatGPT o3 是第一个真正助力数学研究的模型;而 GPT-5 在 30 分钟内重现了他最难的一篇已发表成果。 > *"GPT-5 问世时,它在大约 30 分钟内重现了我耗费大量心血才得出的最佳论文之一。就是从那一刻起,我真正被 AI 彻底说服了。"* ## [02:49] Alex 加入 OpenAI 及物理学研究的转变 GPT-5 发布后,Lupsasca 开始向持怀疑态度的同行宣传这一转变。他发现 OpenAI 同样对此充满热情,加之正值学术休假,便以驻场科学家身份加入——成为全球物理学家在发现惊人成果时第一个联系的人。他提到那周收到的一个案例:Codex 在 10 分钟内模拟了 Sachdev-Ye-Kitaev(SYK)模型,而这是许多研究团队因物理与编程技能交叉面窄而长期难以实现的壮举。 > *"我与 OpenAI 交流,他们也非常兴奋。我想,我必须参与其中,必须亲眼见证这一切。置身事外将是巨大的错误,所以我决定去 OpenAI。"* ## [04:08] GPT-5 的发布与能力跃迁 Lupsasca 将 Twitter 上对 GPT-5 的冷淡反应(抱怨写邮件没有更好)与他在科学前沿的亲身观察形成鲜明对比。他指出 GPT-5.4 又是一次重大跃升,并描述了自 o3 以来 AI 在物理领域的能力加速提升——o3 是第一个具备研究级数学水准的推理模型。他以此引出本期节目的核心技术故事:关于胶子和引力子散射振幅的两篇新论文。 > *"在科学前沿,AI 的能力正在真正腾飞。"* ## [10:05] 量子场论与振幅计算详解 Lupsasca 深入浅出地介绍了量子场论(QFT)——这一将狭义相对论与量子力学统一起来的理论框架。QFT 的核心对象是散射振幅:复值函数,编码了一组入射粒子(具有特定能量、动量和极化)散射为出射粒子的量子概率。这些振幅在 LHC 等粒子对撞机中得到计算,而 n 点振幅(对任意粒子数 n)几乎编码了理论的全部内容。 > *"如果你有一种特定的力,并且能够计算 n 点振幅……你就掌握了关于该理论的一切。"* ## [14:20] 胶子与强力概述 胶子是强核力的传播粒子——正是这种力克服了质子间的同性相斥,将原子核紧紧束缚在一起。胶子在量子场论中的地位类似于电磁力中的光子和引力中的引力子。与光子一样,胶子携带极化(螺旋度):正(右手)或负(左手)。这种螺旋度结构是下一篇论文的核心。 > *"强力通过交换强力粒子来传递,这些粒子被称为胶子,因为它们将原子核'粘合'在一起。"* ## [14:38] 第一篇研究论文:单负胶子树图振幅 Lupsasca 逐字拆解论文标题——"单负胶子树图振幅非零"。树图振幅是散射的领头阶(无圈)贡献。全正螺旋度振幅由对称性论证严格为零。单负振幅——除一个胶子外其余均为正螺旋度——在教科书中也被同样的论证假定为零。这篇论文证明了它们并非为零。相关工作由 Alfredo Guevara(IAS)、David Skinner(剑桥大学)、Andrew Strominger(哈佛大学)和 Kevin Wheel 合作完成。 > *"如果你查阅相关讲义和教科书,用于排除全正振幅的同一论证,表面上同样适用于单负振幅。"* ## [20:56] ChatGPT 如何破解困扰一年的物理难题 Strominger、Guevara 和 Skinner 已认识到教科书论证存在一个漏洞约一年:当粒子共线(动量方向完全对齐)时,标准量纲分析推理失效,单负振幅可以非零。但计算这些非零振幅的具体数值一直让他们一筹莫展。Lupsasca 邀请 Strominger 访问 OpenAI 并用 AI 攻克这一问题。在 Strominger 登机前一周,Lupsasca 开始使用 ChatGPT Pro。等 Strominger 落地时,答案已经找到。 > *"用 ChatGPT,我们在他下飞机前就解决了这个问题。"* ## [23:02] 物理学中手算的复杂性 Lupsasca 以一个具体例子向听众展示了难度所在:由 Alfredo Guevara 手工推导的六点单负振幅,是 32 项之和,每一项本身又是四个复杂因子的乘积。项数随粒子数 n 阶乘增长——超指数级爆炸。这正是团队一年来苦苦寻找 Parke-Taylor 公式类比物时面对的混乱表达式。 > *"等到六点时,它就在你面前爆炸了。"* ## [26:12] 费曼图的历史与原理 费曼图是 Richard Feynman 发明的一种视觉语言,用于组织微扰量子场论计算:图形代表散射过程的可能中间历史,完整振幅是所有图形的求和。图形按顶点数(相互作用点)分类;每增加一个顶点,贡献受耦合常数压低,因此树图(最少顶点)占主导。圈图——中间粒子产生后湮灭——贡献更小的修正。树图的组合爆炸正是阶乘增长的根源。 > *"原则上,需要对无穷多张图求和。"* ## [27:44] Parke-Taylor 公式与化简的追求 20 世纪 80 年代,Parke 和 Taylor 通过艰苦的费曼图展开计算了"最大螺旋度违反"(MHV,即双负)胶子振幅。尽管项数呈阶乘增长,一切相互抵消后只剩下一个紧凑公式——Parke-Taylor 公式——半行即可写下。Strominger、Guevara 和 Skinner 花了一年时间寻找单负情况下的类似公式,却一直困于混乱的费曼图表示。 > *"Andy、Alfredo 和 David 花了过去一年追寻 Parke-Taylor 公式的类比——那个 80 年代为双负振幅找到的极简答案。"* ## [31:26] 用 ChatGPT 在特殊相空间区域寻找化简形式 当五点单负振幅被输入 ChatGPT Pro 后,模型识别出相空间的一个特殊子区域(某粒子频率符号相反),在该区域振幅从八项化简为三项之积。这似乎是一个此前未知的事实;模型编写了 Python 代码并测试了数千种可能性,从中推断出这一规律。对于六点振幅(Guevara 的手算结果),ChatGPT 将 32 项化简为 4 项之积。随后它猜测了一般 n 点公式——项数仅线性增长,是可能达到的最优行为。GPT-5.2 Pro 猜出了公式,但无法给出证明。 > *"它提出的公式……项数不再阶乘增长,而是线性的。粒子数翻倍,项数也只是翻倍。"* ## [38:07] 从头证明公式以确保有效性 为了获得证明,Lupsasca 使用了 OpenAI 内部具有扩展推理能力的模型。他从零给出问题——没有提供猜测公式——让模型在特殊相空间区域寻找一般答案。经过 12 小时计算,模型独立重新发现了相同的公式,并给出了完整的三步证明。这一证明构成了已发表论文的主体。团队将 AI 的贡献压缩在一段文字中,将论文定位为一个独立成立的物理学成果。 > *"我们从头给出整个问题……它回来时给出了同一个公式——我们并未提供这个公式。它独立重新发现了正确答案,而且这次还找到了证明。"* ## [41:00] 评估科学影响与未来研究方向 被问及与 Parke-Taylor 公式的比较时,Lupsasca 坦言科学影响只有数十年后才能评估,但他认为这一结果确实出乎意料,并应为量子引力的深层问题开辟新的攻克路径。对话随之自然过渡到第二篇论文。 > *"我认为一篇论文的真正价值,只能在数十年后根据它引发了多少后续工作、开辟了哪些新方向才能评定。"* ## [42:27] 第二篇论文:引力子振幅概述 引力子是引力的假想量子——自旋为 2 的力传播粒子,类比于自旋为 1 的光子(电磁力)和胶子(强力)。与胶子不同,引力子从未被直接探测到,但它是量子引力理论的核心。第二篇论文"单负引力子树图振幅非零"表明,同样的漏洞适用于引力,紧凑公式也可推广至此——尽管引力子在数学上比胶子更为复杂。 > *"我们写了这篇论文,题目是'单负引力子树图振幅非零'。几乎与前一篇相同,只是将胶子换成了引力子。"* ## [45:41] 粒子、不可约表示与对称性的定义 Lupsasca 概述了量子场论对粒子的现代定义(Poincaré 群的不可约表示,由 Wigner 按质量、自旋和荷分类),并解释了为何引力子自旋为 2 而胶子和光子自旋为 1,使得引力子的极化数据比胶子丰富一倍。关键在于,第二篇论文在第一篇公开后三天内即告完成——大部分时间用于验证正确性,而非计算本身。 > *"大部分时间花在验证答案上,而非写作——如果退一步想,这实在令人震惊。"* ## [47:46] GPT Pro 如何将研究推广至引力 引力子论文无需使用内部模型——公开版 ChatGPT GPT-5.2 Pro 已足够。Lupsasca 提供了胶子论文作为上下文,加上两段描述关键数学变化的文字,然后说"加油,你是一位才华横溢的理论物理学家。"在长达 110 页的交流中,模型完成了引力子计算——应用了有向矩阵树定理(一个 Lupsasca 及合作者此前未曾想到援引的组合数学工具)——产出了正确的中间结果,并从第三节起写出了与最终 arXiv 版本高度接近的论文草稿。 > *"这是量子引力领域一个真实、扎实的成果,几乎完全由 AI 完成,由人类掌舵并提出正确的问题。"* ## [53:57] 认识论转变:这是做物理的新方式吗? 主持人提出核心认识论问题:如果一名具备领域知识、善于提示的本科生也能完成这项工作,研究生训练意义何在?Lupsasca 认为这是学术界面临的最难开放问题。他指出,艰苦的手算训练的不仅是技能,更是自信心;课程与研究前沿之间的鸿沟正在拉大;许多导师曾布置给学生的"简单"问题,AI 如今数分钟即可解决。他提出 AI 已改变他个人工作方式的两个具体例子:大幅缩短了步骤间的困惑时间,以及能够同时派出多个 AI 侦察兵探索不同研究方向。 > *"有了 AI,你可以同时开启 10 个对话,让每个对话尝试不同路径,作为快速深入未知领域的侦察兵。"* ## [59:27] AI 作为研究方向"侦察兵"的角色 Lupsasca 进一步阐释"侦察兵"比喻:研究者不必再谨慎地从 A 规划到 C 才开始行动,而是可以同时派出多个 AI"侦察兵",迅速获得各方向是否可行的反馈,并相应地重新分配人类注意力。即便侦察兵出错,其标记的路标也能降低后续人类探索的定向成本。这构成了一种质地全新的研究模式——瓶颈从计算转向了对哪个方向更重要的判断力。 > *"即使 ChatGPT 并不总是对所有事情都对,但拥有一个在关键步骤沿途标记路标的侦察兵,让你能够以此锚定自己的前进,是极其有用的。"* ## [61:44] "品味"的作用与 AI 的协作 主持人深入探讨"品味"问题——识别哪些问题处于知识边界的能力。Lupsasca 认为,有效使用 ChatGPT 需要与教授指导学生相同的技能:知道给出什么问题、细化到什么程度。"品味"——知道前沿在哪里、哪些问题在那里是可解决的——是最后才能养成的技能,也是 AI 目前尚不具备的能力。AI 就像一位技术能力极强的研究生:给定明确、表述清晰的问题,它能够正确完成极其艰难的计算,但它还不知道该问哪个问题。 > *"优秀物理学家与卓越物理学家的区别在于,知道什么是正确的问题——这才是成为科学家最难的部分。"* ## [70:23] 从 AI 怀疑者到驻场科学家的个人转变 Lupsasca 回顾了自己的个人历程:怀疑者→被 o3 说服(11 分钟内完成了他本人需要数天的计算)→被 GPT-5"彻底说服"(在 30 分钟内重现了他关于黑洞 Love 数与潮汐对称性的最佳发表成果——而该论文的 arXiv 发布时间晚于模型的训练截止日期)→现为 OpenAI 驻场科学家。他指出,当时没有任何竞争对手模型能在那项计算上与 GPT Pro 匹敌。 > *"不到 30 分钟,加上一个提示……它彻底解决了这个问题,而这是我做过的最精妙的计算之一。"* ## [72:46] 用 GPT-5 解决黑洞微扰问题 Lupsasca 详细讲述了让他彻底转变的"第 37 手"时刻:他的论文《为什么黑洞没有 Love?》建立了 Kerr 黑洞微扰的新对称生成元(解释了为何黑洞 Love 数——以数学家 Augustus Love 命名的潮汐响应系数——精确为零)。首次将完整问题直接提供给 GPT-5 Pro 时,模型失败了。但在用较简单的平直时空热身(一个有 200 年历史的已知结论)预热后,模型在 18 分钟内解决了完整的 Kerr 黑洞问题。 > *"GPT-5 能够重现我最艰难的计算之一——全世界能做到这件事的人,屈指可数。"* ## [76:34] AI 能否实现原创性的概念飞跃 主持人追问 AI 是在做真正的重新组合还是真正的创造性飞跃。Lupsasca 引用了陶哲轩的观点——他迄今尚未看到一个无法追溯到某篇冷僻文献的 AI 证明。但 Lupsasca 印象深刻,并将这一区别定性为程度而非性质之别——人类或许也只是重新组合机器。他相信持续的规模扩展将带来看起来像创造力的洞见,并指出 OpenAI 正积极致力于让模型实现更大、更超出分布的飞跃,以服务于科学发现。 > *"我不确定这里有什么质的区别。我认为这只是程度问题——随着我们持续扩大规模,我看不出有什么理由会停下来。"* ## [80:09] "AI 垃圾"的挑战与学术出版的未来 随着模型现在能够在适当引导下 30 分钟内产出一篇物理论文,arXiv 预印本服务器正被大量投稿淹没。Lupsasca 区分了合理使用(专家引导+仔细验证)与"AI 垃圾"——在没有充分检查的情况下提交的低质量提示输出。他提出的对策:提高标准而非增加数量。单负振幅论文为真正的量子引力问题开辟了清晰的攻克路径;目标应是追求更难的问题,而非增量式发表。 > *"相反,我认为既然我们拥有了这个赋予 AI 超能力的新工具,就应该提高撰写好论文的标准。"* ## [83:13] 撰写学术论文的瓶颈 被问及希望消除的单一瓶颈时,Lupsasca 选择了论文写作本身——他越来越觉得奇怪:研究者用 AI 做计算,将结果压缩进静态论文,然后读者再把论文输入 AI 来理解。他设想了可交互的、内嵌 LLM 的论文作为可能的未来。他还指出当前模型缺乏的两项能力:(1)识别下一个重要问题的创造力火花;(2)可靠的自我验证,使人类不必完全承担检查 AI 生成的长篇证明的责任。 > *"也许是某种活在某个 LLM 中的交互式论文。也许你的整篇论文就是某个 ChatGPT 页面……我认为我们正在朝那个方向前进。"* ## [90:19] 结语与展望未来一年 Lupsasca 的结语:请认真关注。从"写邮件有用"到"解决量子引力开放问题",这段轨迹大约历经 18 个月。模型正在解决专家群体花费数年之久的开放问题。向前推演,随着更多规模扩展已在路上,未来 6 到 12 个月将带来更多惊喜。正确的姿态是:保持兴奋、仔细验证,并致力于追求更难的问题。 > *"如果你把这一趋势外推到未来,想象一下 6 个月或一年后我们会在哪里——我认为活在这个时代有点超现实,但这一切确实正在发生。"* ## 实体 - **Alex Lupsasca**(人物):理论物理学家,范德堡大学教授,OpenAI 驻场科学家;2024 年新视野物理学突破奖和 IUPAP 青年科学家奖得主;黑洞物理与散射振幅领域专家。 - **Andrew Strominger**(人物):哈佛大学教授,Lupsasca 博士导师;天体全息学先驱;两篇单负振幅论文的共同作者。 - **Alfredo Guevara**(人物):普林斯顿高等研究院(IAS)博士后研究员;完成了 AI 辅助突破背后的基础手算工作。 - **David Skinner**(人物):剑桥大学教授;单负胶子振幅论文共同作者。 - **陶哲轩**(人物):菲尔兹奖得主,加州大学洛杉矶分校数学家;在 AI 证明是否具备真正创造力的问题上被引用。 - **散射振幅**(概念):量子场论中编码粒子散射概率的复值函数;两篇论文讨论的核心数学对象。 - **单负胶子/引力子振幅**(概念):除一个粒子外其余均为正螺旋度的树图散射振幅;教科书中曾被假定为零,但论文证明在共线相空间区域非零。 - **Parke-Taylor 公式**(概念):20 世纪 80 年代推导出的最大螺旋度违反(MHV,双负)胶子振幅紧凑闭合形式;单负振幅所寻求的类比公式的范本。 - **费曼图**(概念):组织微扰量子场论计算的图形技术;各图形代表不同中间粒子历史,振幅为所有图形之和。 - **Love 数**(概念):编码潮汐形变能力的系数;以数学家 Augustus Love 命名,对黑洞精确为零,这一事实与 Lupsasca 论文《为什么黑洞没有 Love?》所研究的隐藏对称性相关。 - **天体全息学**(概念):通过散射振幅结构探索量子引力对称性的研究纲领;是研究引力子振幅的动机之一。 - **OpenAI**(组织):Lupsasca 担任驻场科学家的 AI 研究公司;GPT-5 及用于振幅证明的内部扩展推理模型的开发者。 - **arXiv**(组织):物理与数学开放获取预印本服务器;在 AI 生成"垃圾"大量涌入投稿的背景下被提及。 - **GPT-5 / ChatGPT Pro**(软件):OpenAI 的前沿语言模型,两篇振幅论文中使用的主要 AI 工具;能够进行每次提示 20-34 分钟的扩展推理。

#theoretical-physics#quantum-field-theory#gpt-5
斯科特·加洛韦:AI 不是为你设计的,富人已不再需要你!
1:58:11
EN/ZH
点开看双语
The Diary Of A CEO18 天前

斯科特·加洛韦:AI 不是为你设计的,富人已不再需要你!

纽约大学斯特恩商学院教授、连续创业者斯科特·加洛韦(Scott Galloway)进行了长达两小时的人工智能现实检视:AI CEO们的末日预言在很大程度上是融资表演,但这项技术确实存在一种几乎无人讨论的阴险风险——孤独症流行。加洛韦认为,AI主要惠及已然富裕的人群,科技领袖不应被信任来自我监管,而AI时代最有价值的人类技能并非编程或普通话——而是承受拒绝的能力。对话穿越地缘政治、投资、男性危机以及寻找人生意义等议题,以一段关于悲恸与父亲身份的深情反思作结。 ## [00:00] 开场 主持人史蒂芬在AI快速发展的背景下介绍了斯科特·加洛韦,并引用了科技CEO们预测工作岗位将被全面取代的令人不安的言论。加洛韦以其核心论点开场:过去18个月两大品牌崩塌——美国的全球声誉与人工智能本身——两者都是过度承诺与糟糕信任管理的受害者。他表明自己在宏观层面是AI乐观主义者,但坚持认为构建AI的人并不将公众利益放在心上。 > *"这些科技人,他们根本没有把我们的最大利益放在心上。"* ## [02:45] 关于AI,哪些是真的? 加洛韦揭示了一个惊人数据:对AI的认可度与收入直接相关。只有年收入超过20万美元的家庭对这项技术持净正面态度,因为他们通过上涨的投资组合获益,且是最重度的用户。其他所有人则面对更高的电费账单、在公司中没有股权,还要承受Sam Altman这样的领袖叫他们别再抱怨能源成本的轻蔑言论。他认为,AI的品牌形象在18个月内已从"可怕但乐观"转变为"可怕且只对富人有利"。 > *"你对AI的看法与你的财富直接相关。唯一对AI持正面评价的群体是年收入超过20万美元的人。"* ## [05:00] AI CEO们是否在夸大未来以融到数十亿? 加洛韦阐述了AI灾难化言论背后的经济逻辑。这些公司拥有天文数字般的估值,只有当(a)AI驱动产品产生万亿美元增量收入,或(b)出现大规模劳动力成本节约时,这些估值才能被证明合理。由于方案(a)尚不可见——他认为目前没有任何AI驱动产品达到有意义的规模——CEO们就放大方案(b),描绘出生动的就业破坏图景,以此证明企业需要相信的效率提升。他称部分末日言论为"包着薄薄外衣的融资行为",并指出创始人们制造恐慌,然后套现离场去圣托里尼度假。 > *"这种灾难化不过是在隐晦地说:我的技术如此具有破坏性,将会重塑社会,你应该以这个疯狂的估值来投资它。"* ## [09:00] 什么能证明AI怀疑论者是错的? 被问及自己可能在哪里犯错时,加洛韦给出了具体答案:如果失业率哪怕暂时上升到20%,历史表明社会动荡将随之而来,无论最终就业是否恢复。他以放射科医师和程序员为例,说明AI带来的是增强而非消除——新的编程职位招聘数量同比上升了11%。他判断自己犯错的标准是:破坏持续超过创造的速度快到足以在另一侧到来之前触发社会崩溃的"V形"反弹。 > *"20%的失业率,尤其是年轻人中,尤其是年轻男性,往往会变得非常愤怒,走上街头。"* ## [11:05] AI的发展速度会快到社会无法承受吗? 对话转向变革速度。加洛韦以主持人24个月招募220名员工的媒体帝国为反例,驳斥了末日叙事。他指出一个结构性反转:数十年来首次,非大学学历群体的失业率低于大学学历群体,因为AI数据中心正在推动技工类职业的繁荣。他称赞AI工具解锁了创业浪潮,并以丹麦承诺将GDP的2%用于再培训、而美国的相应投入严重不足为例,指出这才是真正的政策失败。 > *"AI不会抢走你的工作。懂AI的人会抢走你的工作。"* ## [16:05] AI与机器人结合后会发生什么? 加洛韦谈到了埃隆·马斯克对Optimus机器人的预测,以及物理自动化与AI认知的融合。他2026年的选股是Amazon——这家公司已拥有比美国其余企业加总还多的工业机器人,并计划在不增加员工人数的情况下,通过机器人技术在2032年前将零售业务规模翻倍。他对家用人形机器人持怀疑态度,但对武器化自主系统的军事应用表示认真关注,认为这是一个真正黑暗的未知前沿。 > *"Amazon表示,他们将在2032年前将最大的业务——零售业务——翻倍,且不额外招募一名员工,依靠的是工业机器人。"* ## [19:05] 埃隆·马斯克卖的是愿景还是现实? 加洛韦将创新者马斯克与股票推销员马斯克区分开来。他称Starlink为过去几年最优秀的科技产品,并称赞马斯克激发了电动车竞赛。但Tesla应该以30倍市盈率交易,而非150倍;一旦SpaceX以预计90至110倍收入的估值IPO,资本将迁移至此。核心洞见:现代CEO的工作已经从"少承诺、多兑现"倒置为"多承诺、少兑现",以便获取廉价资本并将未来提前实现。 > *"创新者现在的关键属性是讲故事——确保承诺远超实际表现,从而获取廉价资本并将未来提前。"* ## [24:05] 在AI浪潮中,哪些工作最先消失? 长途卡车运输是加洛韦最明确的近期受害者:自动驾驶卡车可以承担晚10点至凌晨4点的运输任务,而卡车运输业是美国非高中学历男性群体中最大的单一雇主。初级律师层面的法律工作已经在被取代——他现在将合同交由两个竞争的大语言模型(LLM)审查,而非花400至2000美元请律师事务所审查,预计自己的年度法律支出将减少三分之一。他观察到的模式是倍增效应:一名熟悉AI的分析师取代五名,由此产生的EBITDA资金用于扩张,在生态系统其他地方创造新岗位。 > *"AI不会抢走你的工作。懂AI的人会抢走你的工作。所以要有第二块屏幕——始终保持一块只运行AI的第二屏幕。"* ## [30:05] 未来真正重要的技能是什么? 讲故事位居加洛韦榜单首位——看数据、构建叙事弧线、并通过各种媒介进行有说服力的传达的能力。他援引杰夫·贝索斯1997年的股东信、黄仁勋的体育馆级别发布会,以及Alex Karp边走边谈的财报电话会议作为典范。人际关系是第二支柱:随着技术趋同、产品商品化,差异化因素在于别人是否愿意与你共事。他坦诚地承认,预测具体技能是不可靠的——十年前私立学校押注计算机科学和普通话,两个赌注都未能如预期般兑现。 > *"持久的技能是讲故事——你看数据、创造叙事弧线,然后通过各种媒介以引人注目的方式传达故事的能力。"* ## [33:45] 年轻人正在失去承受拒绝的能力吗? 加洛韦将拒绝耐受力的侵蚀定位为年轻人面临的最被低估的威胁,尤其是年轻男性。无摩擦的线上关系提供了一种连接的拟像,却没有现实世界冒险所需的情感投入。他在指导年轻男性时,会布置刻意练习被拒绝的作业:主动与陌生人交朋友,邀请某人喝咖啡。目标不是得到"是";而是学会"不"是可以承受的。他认为,自己的超能力不过是愿意为失败哀悼,然后重新出发。 > *"我成功的秘诀是拒绝。我竞选高中二年级、三年级和四年级的班长,三次都落败了。"* ## [39:55] 你能信任那些构建AI的人吗? 一场犀利的文化批判:美国以科技崇拜取代了日益式微的宗教机构,将每位新晋CEO奉为世俗的耶稣基督。史蒂夫·乔布斯、扎克伯格、Sam Altman,如今是Dario Amodei——每人短暂地被定位为"好人",随后完成了反派的转变历程。加洛韦的观点不是这些人本质邪恶,而是他们正在做资本主义所要求的事:无论危害多广,最大化收益。答案不是寻找更值得信赖的科技创始人,而是培养能够监管他们的有能力的民选官员。 > *"我们能信任Sam Altman吗?不能。但我们不应该需要信任他。我们应该能够信任我们拥有能够监管这些公司的聪明民选官员。"* ## [44:50] 科技领袖们是否在悄悄为末日做准备? 加洛韦透露,大约三分之一的亿万富翁维持着一个"逃生包"——一套有完整资金的逃跑计划,通常是一架私人飞机飞往奥克兰和一个设防完备的新西兰地堡。他称之为虚无主义:超级富豪已将自己与普通基础设施彻底隔离——私人航空、私人医疗、私人安保、精英学校——以至于他们不再关心社会的健康状况。因此,他们不成比例的政治捐款并非为了让体制为所有人运转。 > *"问题在于,0.1%的人没有投入美国的健康。他们不用忍受安检排队,他们飞私人飞机。"* ## [52:00] 一些AI领袖认为风险值得承担吗? 一个来自二手渠道、却令人不寒而栗的描述:一位与某AI CEO有直接接触的消息人士描述了这样一个人——他真诚地认为自己的工作有大约7至10%的概率以灾难告终,但认为成为召唤这种新智能的人足够有意义,值得继续推进。加洛韦将此与加剧的不平等相联系——中产阶级与超级富豪在医疗、出行和安全方面的生活差距已扩大至如此之大,以至于0.1%的人的激励结构在结构上与其余社会相悖。 > *"西方社会底部99%的人本质上正在被优化和货币化,以使1%的人的生活变得令人难以置信的奢华。"* ## [58:04] 广告 LinkedIn Hiring Pro 和 Function Health 的赞助片段。 ## [60:05] AI能让我们更像人类吗? 加洛韦提供了一个令人意外的积极面:与将用户推向政治极端的社交媒体算法不同,AI模型似乎通过寻求统计中位数来温和地调节观点。他看到AI陪伴对孤立的老年用户有真实价值。但他回归到自己的核心担忧:AI最大的负面影响既不是武器,也不是选举污染,甚至不是收入不平等——而是孤独。20至30岁的男性在户外度过的时间少于囚犯,42%的18至24岁男性从未当面邀请过女性出去。 > *"在我看来,AI最大的负面影响是孤独。AI让人们相信,他们可以通过屏幕上的算法拥有一种差不多的生活替代品。"* ## [65:00] 当AI成为你最亲密的伴侣时会发生什么 对话转向伊朗冲突,将其作为战略失误遭遇战术卓越时会发生什么的案例研究。加洛韦认为最初的军事打击在战术上是可信的,但缺乏国会简报、海湾盟友协调以及明确退出目标,已造成僵局——并指出伊朗伊斯兰革命卫队(IRGC)制作的宣传内容在全球表情包战争中表现优于美国信息行动。 > *"战争的问题在于,敌人也有发言权。无论是越共、塔利班还是IRGC,敌人所需要做的只是活下去,然后他们就赢了。"* ## [70:00] 便利与真实关系之间隐藏的权衡 加洛韦将美国的伊朗战略诊断为外交团队被掏空的产物。当高级官员飞赴伊斯兰堡期望达成协议时,职业外交官通常会完成的97%的准备工作根本没有发生。IRGC更深谙此道:他们所需要做的只是活下去,冲突持续的每一天,他们都像是对抗超级大国的弱者英雄。他最乐观的情景是一支多国部队确保霍尔木兹海峡的航行自由。 > *"你知道美国对我们的外交团队做了什么吗?我们把它彻底掏空了。"* ## [75:00] 为何孤独感可能爆发 美股在中东冲突激烈之际创下历史新高——这表明富裕阶层已与地缘政治风险彻底隔绝,战争不再反映在资产价格上。前10%的人贡献了50%的消费者支出,而这个群体根本不在乎汽油价格是否涨到每加仑六美元。痛苦被转嫁给低收入家庭和高度依赖石油的国家。加洛韦将这种对共同风险的疏离,定格为当代不平等最危险的结构性特征之一。 > *"我们把战争的代价外包给了财富较少、高度依赖石油的国家,外包给了正在遭受损害的海湾地区。"* ## [79:26] 人类连接可能变得更有价值的真正原因 关于AI市场估值与基础设施过度建设历史规律的深入讨论。每一次伟大的基础设施繁荣——铁路、电气化、互联网——都以崩溃告终,而AI资本支出现在已构成美国GDP增长的重要份额。加洛韦认为,有三分之一的概率,AI最终会像喷气航空或疫苗一样:对人类具有变革性,但无法由少数公司独占货币化,因为开源的中国模型可能通过"AI倾销"将整个技术栈商品化。 > *"AI让AI自己失业。如果你看技术的融合,所有模型都在趋同。"* ## [85:00] 这对下一代意味着什么 加洛韦认为,市场修正实际上可能通过使资产再次变得可负担而使年轻一代受益。他将GLP-1药物列为在真实世界人类影响方面超越AI的技术选择。他61岁时的个人投资哲学:积极分散化,单一持仓不超过净资产的3%,将过热的美国市场资金轮换至欧洲和拉丁美洲。对于年轻人,他唯一信赖的财富积累路径是通过低成本指数基金的复利,且要在资金被花掉之前自动投入。 > *"我唯一的答案是慢慢来——找到一种方式从青少年时期开始储蓄,每月25美元,20多岁时100美元,然后500美元。"* ## [90:00] 权力、政治与AI如何相互交织 加洛韦以2008年自己在60天内损失70%《纽约时报》广告收入的亲身经历为例,警告年轻企业家从未经历过真正的衰退。他认为,政治阶层系统性地救助了拥有资产的婴儿潮一代——COVID救助、企业救市、持续的市场托底——同时剥夺了年轻一代以低廉价格购入资产的机会。衰退历史上创造了入市时机;而这一机制如今正被刻意压制。 > *"你们这一代人真的不知道衰退是什么样子的。就是,一切都停了。"* ## [95:00] 技术与监管之间的危险鸿沟 个人理财建议,以及对预测局限性的反思。加洛韦对年轻人的投资建议:先投资自己,再投资人际关系,然后是分散化指数基金。他坦诚地承认,挑选赢家行业在很大程度上是徒劳的,任何声称确定的人都不了解实情。他与儿子投资精灵宝可梦卡牌的经历说明:最好的投资以非财务的方式复利增长——关系与共同经历所积累的价值,是传统投资回报率无法衡量的。 > *"我唯一的答案是慢慢来,且需要一些自律。存钱、分散化、复利、投资人际关系,要趁早。"* ## [100:00] 如果政府跟不上AI的步伐会发生什么 被问及33岁的人应该知道61岁的人学到了什么,加洛韦给出了三条教训:成功时保持谦逊,因为很多成功靠的是运气;失败时原谅自己,因为很多失败也是环境使然;以及在30多岁时积极投资人际关系,因为他把黄金岁月都花在了职业上,差点陷入孤立。他将每一次重大失望都定格为:人们日后后悔的,不是那件事本身,而是他们当时允许自己有多沮丧。 > *"事情从来没有看上去那么好或那么坏。成功时保持谦逊,失败时原谅自己,意识到这也会过去。"* ## [105:00] 工作、权力与真正赢家的未来 父亲身份作为人生目的。加洛韦坦白,他曾经不想要孩子,儿子出生后也没有立刻爱上他们。改变他想法的,是发现父亲身份是唯一一种在结构上不可能获得正回报的投资——而这恰恰是它有意义的原因。同样的逻辑适用于任何足够宏大、大到你永远无法完全回收的事业:老兵服务、社会活动、照护工作。他以坦率的建议收尾,谈及伴侣选择、时机,以及别无选择地投入孩子兴趣中所带来的解脱。 > *"寻找你的人生目的,就是找到那件你永远无法从中获得真正正回报的事。我永远无法从我的孩子身上获得正回报。"* ## [110:00] AI最大的风险并非你所听说的那些 最后一章以加洛韦对两个儿子截然不同性格的深情描述开场——一个是他的镜像,一个是他着迷观察的"异类物种"。他谈到自己的著作《做一个男人的笔记》,将其定位为他希望儿子们在30年后读到的信件。压轴问题——人生最大的挫折及其教训——引出了全集最动情的回答:母亲的离世。他说他没有走出来,也不想走出来,因为悲痛是爱的收据,他希望儿子们有朝一日也能对失去他有同样的感受。 > *"我母亲的去世。你永远不会对父母说太多爱他们的话。爱的对立面是悲痛。"* ## 实体 - **Scott Galloway**(人物):纽约大学斯特恩商学院市场营销学教授,连续创业者,《四巨头》《幸福代数》和《做一个男人的笔记》作者;Prof G Pod 和 Pivot 播客主持人 - **Sam Altman**(人物):OpenAI CEO;作为科技领袖偶像化与幻灭循环的主要案例被反复提及 - **Elon Musk**(人物):Tesla、SpaceX 和 xAI CEO;被描述为富有远见的讲故事者,其真实产品(Starlink、SpaceX)具有变革性,但时间线屡屡超出预期 - **Dario Amodei**(人物):Anthropic CEO;被列为当前科技圈的"好人",但难逃必然的反派转变 - **Jensen Huang**(人物):NVIDIA CEO;以体育馆级别发布会作为讲故事驱动型CEO表现的典范被援引 - **OpenAI**(组织):ChatGPT 开发者;融资炒作与过度估值批评的主要对象 - **Anthropic**(组织):AI安全公司;作为"最新英雄"投资叙事的受益者被提及 - **SpaceX**(组织):马斯克的火箭公司;被列为Tesla IPO时资本迁移的可能目的地 - **Amazon**(组织):加洛韦2026年首选大盘股,原因是其机器人领先地位和仓储自动化规模 - **Tesla**(组织):优秀的汽车公司,但以不合理的估值倍数交易,SpaceX IPO后将出现修正 - **GLP-1药物**(概念):减重及代谢类药物(Ozempic/Wegovy类),加洛韦认为在真实世界人类影响和股东价值创造方面将超越AI - **AI倾销**(概念):加洛韦创造的术语,指中国以廉价开源AI模型涌入美国市场,以破坏美国AI估值并扰乱经济 - **逃生包/亿万富翁虚无主义**(概念):大约三分之一亿万富翁维持有资金保障逃跑计划的现象,是其与共同社会福祉脱离的症状 - **拒绝耐受力**(概念):加洛韦认为AI时代最被低估的技能——愿意听到"不"、短暂哀悼,然后再次尝试的能力

#ai#economics#future-of-work
机器人终局:英伟达 Jim Fan
20:03
EN/ZH
点开看双语
Sequoia Capital22 天前

机器人终局:英伟达 Jim Fan

英伟达具身 AI 研究负责人 Jim Fan 阐述了从以语言为中心的模型向世界动作模型(WAM)的转变——后者能够模拟物理现实。他描绘了一条通向"物理图灵测试"与 2040 年自动化工厂的路线图,核心驱动力是视频预训练与人类第一人称视角数据的规模化。 ## [00:00] 简介 主持人 Sonya Huang 介绍 Jim Fan,后者领导英伟达具身自主研究组。Fan 回忆起自己当年实习的经历,以及对机器人未来的无限期待。 > *机器人将是即将发生的最令人振奋的事情之一。* > *[0, 12]* ## [00:30] DGX One 的起源故事 Jim Fan 讲述了 2016 年 Jensen Huang 将第一台 DGX-1 亲手交付给 Elon Musk 和 OpenAI 团队的故事。他指出,这一时刻点燃了深度学习革命,最终催生了当今的 AI 突破。 > *如果你相信深度学习,深度学习也会相信你。* > *[1, 26]* ## [01:42] 伟大的平行 Fan 提出"伟大的平行"构想:将 LLM 成功的扩展范式移植到机器人领域。目标不再是预测字符串中的下一个 token,而是通过仿真与对齐来预测下一个物理世界状态。 > *我们能否从模拟字符串,转向模拟下一个物理世界状态?* > *[2, 56]* ## [03:31] 机器人终局的战略框架 实现机器人终局的策略分为两大支柱:模型策略与数据策略。Fan 指出,LLM 已进入最后的"终极关卡",而机器人领域的扩展之旅才刚刚开始。 > *归根结底是两件事:模型策略和数据策略。* > *[3, 32]* ## [03:39] VLA 的局限性 视觉语言动作(VLA)模型被批评为"语言头重脚轻",缺乏对物理规律和动作的根本理解。Fan 认为,VLA 更擅长编码静态知识,而非动态的物理交互。 > *VLA 擅长编码知识和名词,但对物理规律和动词的理解相当薄弱。* > *[4, 8]* ## [04:32] 视频世界模型 Fan 解释了 VEO3 等视频模型如何仅凭像素级预测就学会了重力、浮力等内在物理规律。这类模型充当仿真器,能够在内部求解迷宫并规划视觉序列。 > *在大规模预测下一批像素的过程中,物理规律自然涌现。* > *[5, 15]* ## [06:09] DreamZero 世界动作模型 英伟达推出"Dreamer"与世界动作模型(WAM),二者联合解码未来世界状态与运动动作。机器人得以通过"梦境推演"正确的动作序列来完成零样本任务,再付诸执行。 > *Dreamer 同时解码下一个世界状态和下一步动作。* > *[6, 29]* ## [07:46] 扩展数据采集 为突破远程操控的物理瓶颈,Fan 介绍了通用操作界面(UMI)和 Dex-UMI 等外骨骼设备。这些工具让人类无需借助机器人,就能直接采集高灵巧度操作数据。 > *我们打破了"每台机器人每天 24 小时"的诅咒。* > *[10, 6]* ## [11:06] EgoScale 与扩展定律 Fan 介绍了 Ego-Exo——一个基于 21000 小时人类第一人称视角视频训练的策略模型。这项研究发现了灵巧度的神经扩展定律,揭示了预训练数据量与机器人性能之间的数学关系。 > *我们发现了这条关于灵巧度的神经扩展定律。* > *[12, 39]* ## [15:39] DreamDojo 与路线图 Fan 描绘了通向 2040 年的路线图,包括物理图灵测试与"无人值守"工厂。他介绍了 Dream Dojo——一个用数据驱动的世界模型取代传统物理引擎的神经仿真器。 > *我有 95% 的把握——我们会在 2040 年前走到这场终局的终点。* > *[19, 19]* ## 实体 - **Jim Fan**(人物):英伟达具身自主研究组负责人。 - **英伟达**(机构):为机器人终局开发硬件与软件的科技公司。 - **Jensen Huang**(人物):英伟达 CEO,因将第一台 DGX-1 交付 OpenAI 而被提及。 - **OpenAI**(机构):接收第一台 DGX-1 用于深度学习研究的实验室。 - **DGX-1**(产品):2016 年交付的全球首台深度学习超级计算机。 - **VEO3**(模型):能够模拟物理规律与视觉规划的视频世界模型。 - **Dreamer**(模型):同时预测未来世界状态与动作的策略模型。 - **Ego-Exo**(项目):基于大规模人类第一人称视角视频数据的机器人预训练框架。

#robotics#nvidia#world-models
Andrej Karpathy:从氛围编程到智能体工程
29:49
EN/ZH
点开看双语
Sequoia Capital23 天前

Andrej Karpathy:从氛围编程到智能体工程

Andrej Karpathy 探讨了从传统编程到 Software 3.0 的范式转变——在这个新范式中,LLM 充当可编程的计算机,靠上下文窗口驱动。他梳理了从"氛围编程"到"智能体工程"的演进路径,并指出:AI 可以接管执行层,但人类的品味与理解力始终是无法绕过的瓶颈。 ## [00:00] 开场介绍 Stephanie Zhan 介绍 Andrej Karpathy,回顾他在 OpenAI 和 Tesla 的奠基性工作。她特别提到他有一种罕见的能力,能把最复杂的技术转变讲得既通俗又不可避免,并引出"氛围编程"这一概念。 > *He has a rare gift of making the most complex technical shifts feel both accessible and inevitable. [00:22]* ## [00:44] 感觉被代码落下了 Karpathy 描述了 2023 年 12 月的一个转折点:那时智能体工具已经能在无需人工干预的情况下生成完美的代码。这一变化让他转向氛围编程,开始放手让 AI 自主处理复杂工作流。 > *I just start to notice that with the latest models the chunks just came out fine. [01:29]* ## [02:28] Software 3.0 是什么 Karpathy 将 Software 3.0 定义为一种新范式:LLM 充当可编程计算机,上下文窗口成为主要的编程杠杆。这一阶段接续了 Software 1.0 的手写规则和 Software 2.0 的数据驱动权重训练。 > *Software 3.0 is kind of about your programming now turns to prompting and what's in the context window is your lever. [03:20]* ## [03:44] 智能体作为安装器 Karpathy 以安装 OpenClaw 为例,说明智能体如何用具备环境感知能力的智能执行取代刚性的 bash 脚本,让 AI 能自主调试并适配特定的系统环境。 > *The agent has its own intelligence that it packages up and then it kind of like follows the instructions. [04:29]* ## [04:49] 菜单生成应用 vs 原始提示词 Karpathy 对比了他自己写的 MenuGen 应用与直接向 Gemini 等模型发原始提示词的效果,结论是许多传统软件层已经多余。他强调,AI 现在能完成以前结构化代码根本做不到的通用信息处理任务。 > *The software 3.0 paradigm is a lot more kind of raw. It just your neural network is doing more and more of the work. [06:11]* ## [07:37] 2026 年已经显而易见的事 展望 2026 年,Karpathy 构想出能直接处理原始视频和音频的神经计算机。这类系统会用扩散模型动态生成用户界面,传统的 UI 代码可能因此走向过时。 > *You could imagine completely neural computers... a device that takes raw videos or audio into basically what's a neural net. [08:22]* ## [09:41] 可验证性与参差不齐的能力边界 AI 模型的能力呈"参差"分布——在数学和代码等可验证领域因强化学习奖励而格外突出。Karpathy 指出一个悖论:模型能重构一个庞大的代码库,却可能在简单逻辑上栽跟头。 > *state-of-the-art models today will tell you to walk [to a car wash] because it's so close... This is insane. [11:36]* ## [13:39] 给创业者的建议与自动化 模型表现在很大程度上取决于前沿实验室选择的具体数据分布。Karpathy 建议创业者深入研究这些模型的"电路",摸清其优势所在,或通过微调来补足短板。 > *we are slightly at the mercy of whatever the labs are doing, whatever they happen to put into the mix. [12:57]* ## [15:46] 从氛围编程到智能体工程 "氛围编程"拉低了上手门槛,而"智能体工程"的重心在于守住专业品质。这门新兴学科的核心是协调强大但随机的智能体,在加速开发节奏的同时不拉低工程标准。 > *agentic engineering is about preserving the quality bar of what existed before in professional software. [16:07]* ## [25:17] 无处不在的智能体与持续学习 Karpathy 力主构建原生适配智能体的基础设施,对以人为中心的文档设计颇有微词。他认为,思考可以外包给 AI,但理解力无法外包——人类的理解力仍是指挥智能体的关键瓶颈。 > *You can outsource your thinking, but you can't outsource your understanding. [28:10]* ## 实体 - **Andrej Karpathy**(人物):AI 研究员,曾任 Tesla AI 总监,OpenAI 创始成员。 - **Stephanie Zhan**(人物):Sequoia Capital 合伙人,本次对话主持人。 - **Software 3.0**(概念):以提示词和上下文驱动 LLM 充当可编程计算机的新范式。 - **Agentic Engineering**(概念):协调 AI 智能体以维护软件质量的专业工程学科。 - **MenuGen**(项目):Karpathy 自建的餐厅菜单 OCR 与可视化应用,用作案例研究。 - **OpenAI**(组织):Karpathy 共同创立的 AI 研究公司。 - **Gemini**(AI 模型):Google 的 LLM,出现在 Karpathy 的软件对比中。 - **Vercel**(组织):Karpathy 用于部署项目的云平台。

#vibe-coding#software-3-0#ai-agents
伊万卡·特朗普:我在9岁时学到了大多数人一辈子都学不到的东西!
1:36:12
EN/ZH
点开看双语
The Diary Of A CEO大约 1 个月前

伊万卡·特朗普:我在9岁时学到了大多数人一辈子都学不到的东西!

伊万卡·特朗普坦诚地回顾了自己的人生——从在名人父母和高强度媒体审视下度过的独特童年,到在商界和公共服务领域的深远影响力。她分享了从母亲身上学到的人生课题、建立信任的挑战,以及父母离婚和父亲遭遇暗杀未遂等关键经历如何铸就了她的韧性。她还谈到了自己关于"刻意而为"的人生哲学、被低估的力量,以及通过母亲身份和心理治疗实现个人成长的历程,最终归结到她以使命驱动的 Planet Harvest 项目。 ## [00:00] 为什么信任来之不易,这揭示了什么 伊万卡·特朗普很早就学会了保持警惕——尤其是在她九岁时经历了父母广受关注的离婚后,面对无处不在的媒体审视和咄咄逼人的狗仔队,她不得不对那些动机不纯的人际关系心存戒备。她的母亲教会了她被低估的力量,以及在压力下过滤外界"噪音"的重要性。虽然最初形成了对他人强烈的防御机制,但后来她有意识地培养了一种更加信任他人的态度,以建立更深层的联结,同时接受其中固有的风险。 > *我母亲教会我,被低估并不是一件坏事。实际上,这是一种非常强大的力量 [00:22]* > *我确实有意识地训练自己变得更加信任他人。 [05:48]* ## [03:32] 当你意识到自己与众不同,接下来会怎样 伊万卡·特朗普从很小的时候就意识到自己的生活并不寻常,因为始终伴随着媒体关注和公众审视——她将这一现象与如今社交媒体对孩子们更加放大的曝光程度进行了对比。她指出,父母曾努力保护她和兄弟姐妹免受这种强烈的公众注视。相比频繁的采访,她更喜欢深入的对话。 > *我觉得一直以来都有很多媒体关注和审视。你很早就能看到、感受到。 [06:24]* > *不是每个人都……我认为我们的孩子们所经历的,是无论走到哪里,人们手里都拿着录像设备 [06:40]* ## [05:44] 她的母亲私下里到底是什么样的人 伊万卡·特朗普形容她的母亲伊万娜是一位自律的前国家级滑雪运动员,她向伊万卡灌输了体育运动的价值观,这也引领伊万卡走向了芭蕾舞。她回忆起一段不寻常的童年记忆——迈克尔·杰克逊曾来观看她的《胡桃夹子》演出。尽管有这些非凡的经历,她的日常生活却因外祖母"Bubby"而有着脚踏实地的一面,外祖母给予了她无条件的爱,并通过烹饪来表达这份爱。 > *我妈妈……是一位出色的滑雪运动员……她非常相信体育对于培养自律精神的重要性 [07:07]* > *我的外祖母……真正把我们带大……她教会了我一种无条件的爱和温柔 [08:44]* ## [11:47] 塑造她成为今天这个人的关键差异 伊万卡·特朗普的成长深受两个人的影响:一位是给予她无条件的爱和日常照料的外祖母"Bubby",另一位是作为先驱榜样的母亲伊万娜。伊万娜展现了力量、雄心和韧性,示范了如何在追求职业目标的同时做一个充满爱的母亲。伊万卡澄清说,尽管父母事业繁忙,但他们始终在场,让她感到自己是他们的头等大事,而外祖母则承担了传统的日常照料角色。 > *我的母亲是一位了不起的先驱者……她是我力量、韧性、优雅、决心和雄心的绝佳榜样。 [11:57]* > *我从未怀疑过自己是他的头等大事,他随时都在我身边。 [14:42]* ## [15:43] 唐纳德和伊万娜·特朗普离婚对她究竟意味着什么 唐纳德和伊万娜·特朗普广受关注的离婚——伊万卡在九岁时从报纸上得知了这一消息——对她产生了深远的影响。她回忆起被铺天盖地的媒体审视吓到的经历,以及父母分离期间一个孩子正常会有的恐惧。这段艰难时期获得的媒体关注甚至超过了辛普森案,却也让她和兄弟姐妹之间形成了独特的纽带。后来在母亲去世后,伊万卡对伊万娜的复杂性格有了更深的理解——这种性格是在共产主义捷克斯洛伐克的成长环境中塑造的——她希望在母亲在世时能多问一些问题。 > *这场离婚获得的头条新闻显然比辛普森案还多。 [20:04]* > *对我和兄弟姐妹来说,积极的一面是我们真的以一种不同的方式建立了联结,因为我们一起经历了这一切。 [23:21]* ## [18:27] 作为特朗普的女儿,人们误解了什么 作为唐纳德·特朗普的女儿,意味着从小就要应对强烈的公众审视,尤其是在父母离婚期间——这教会了她对信任保持必要的谨慎。此后她学会了"在噪音中找到信号",避免参与好斗的社交媒体互动,以内心的平静为优先。伊万卡指出她的父母都极其真实,虽然她在沟通方式上更为细腻,但她始终保持着强烈的自我意识,以斯多葛哲学为指引,真实地生活并抵御外界压力。 > *如果没有那个教训,我不知道自己是否会这么坚强。它教会我不要信任任何人。 [18:53]* > *我不会反击,因为我不……相信把时间和精力花在好斗上,比如跳进那个特定的竞技场,投入社交媒体那种恶毒的漩涡中。 [26:19]* ## [23:36] 身处权力与名望的包围中,如何找到自我 身处权力与名望的包围中,伊万卡·特朗普通过刻意的个人成长和母亲身份这一蜕变性的经历找到了自我——母亲的角色"打开了她的心门",加深了她爱的能力。她强调自我认知至关重要,这样才能抵御外界压力、定义自己,而不是让"暴民赢了"。她将这一哲学运用到育儿中,培养孩子的个性,并感谢自己的父母允许尊重性的异议,使她能够忠于自我。 > *如果你不知道自己是谁,暴民就赢了。 [29:55]* > *他们创造了一种环境,异议是被允许的。 [32:44]* ## [30:57] 为什么被低估反而成了她最大的优势 伊万卡·特朗普从母亲那里学到,被低估可以成为一种强大的优势。在她早期的房地产职业生涯中,她经常被错误评判——既因为是成功父母的孩子,也因为是男性主导行业中的年轻女性。她利用了这种看法,将其作为更加努力工作和充分准备的动力,最终将这种被低估转化为对付那些轻视她的人的利器。 > *我母亲教会我,被低估并不是一件坏事。实际上,这是一种非常强大的力量 [00:22]* > *我利用了那种恐惧、那种情绪,用它来推动自己前进。 [35:06]* ## [32:59] 她在招聘时真正看重什么,以及为什么重要 在招聘时,伊万卡·特朗普优先考虑那些有强烈自我意识、主动性、良好判断力和"街头智慧"的人,因为这些天生的品质很难通过后天培养获得。她强调与"好人"共事的重要性——她信任和尊重的人——认为这些品质是成功的工作关系和整体团队协作的基础。 > *很难教会别人——你知道,一个人可能很聪明,但如果他没有良好的判断力,或者不是一个自我驱动的人,就很难给予他们这些品质。 [38:15]* > *我不想和我不喜欢的人、我认为不是好人的人一起工作,因为我不想把时间花在我不信任或不尊重的人身上。 [39:00]* ## [37:49] 为什么她放弃了时尚行业,转投政府工作 尽管从沃顿商学院毕业时安娜·温图尔向她发出了《Vogue》的高端职位邀请,伊万卡·特朗普还是追随了她对房地产的终生热情。后来她创建了成功的时尚品牌 Ivanka Trump.com,年销售额接近八亿美元。然而,当她接受父亲的邀请在政府任职时,她做出了关闭这个蒸蒸日上的事业的果断决定,以符合政府道德规范。她将这一机会视为不可推辞的特权和对国家的责任,尽管需要付出巨大的个人和职业牺牲。 > *我们关闭公司进入政府时,年销售额接近八亿美元。 [42:30]* > *他给了我们为深爱的国家服务的机会,我感到无比荣幸。 [43:30]* ## [41:06] 特朗普决定参选时到底发生了什么 唐纳德·特朗普 2015 年决定竞选总统的消息是在贝德明斯特的一次家庭会议上宣布的。尽管他自 1980 年代以来就怀有未曾明确表达的政治抱负,这一决定的迅速仍令伊万卡感到意外。她回忆起 16 岁时的一次惊慌——害怕父亲真的要参选,却被告知不会。他进入总统政坛对全家来说是一次"彻底的调整",深刻拓展了伊万卡超越纽约"泡沫"的世界观,开启了公共服务的"非凡之旅"。 > *我记得有一次我以为这是真的。那时我 16 岁,在寄宿学校,我打电话给他……"这会毁了我的人生。" [51:48]* > *他的竞选为我打开了一扇窗,我意识到自己一直活在一个泡沫里 [48:02]* ## [46:23] 特朗普竞选总统,什么改变了一切 唐纳德·特朗普决定竞选总统从根本上改变了伊万卡的一切,这对整个家庭来说是一次"彻底的调整"。他绕过传统的职业路径、以非常规方式进入政坛,就像"从消防水管里喝水"。竞选打碎了伊万卡在纽约所感知到的"泡沫",深刻拓展了她的世界观,引领她珍视为国家服务的荣幸。 > *对我们所有人来说,这就像从消防水管里喝水。 [47:08]* > *他的竞选为我打开了一扇窗,我意识到自己一直活在一个泡沫里 [48:02]* ## [48:52] 广告 这一环节插播了 Shopify 的广告——一个电子商务平台,可以简化在线商店搭建、社交媒体销售和运营管理(配备 AI 工具)。同时还推广了主持人使用的智能 CRM 工具 Pipe Drive,突出其可视化销售管道仪表盘,提供清晰的销售流程可见性。 > *Shopify 让你轻松上手,因为你可以搭建商店、在社交媒体上销售、接受支付、使用 AI 工具,并在一个平台上管理一切。 [49:22]* > *Pipe Drive 是一款易于使用的智能 CRM……它通过一个仪表盘让你的销售流程一目了然。 [50:17]* ## [51:04] 她是否曾想过父亲真的会这样做 虽然唐纳德·特朗普自 1980 年代起就曾考虑竞选总统,但伊万卡表示这一抱负在她的童年时期并未被明确讨论过。她生动地回忆起 16 岁时的一个瞬间——她慌乱地以为父亲要参选,却被告知这不会发生。她指出,他在贸易政策等议题上的观点在几十年间始终如一。 > *我记得有一次我以为这是真的。那时我 16 岁,在寄宿学校,我打电话给他……"这会毁了我的人生。" [51:48]* > *他的观点在这些年间始终如一,直到今天在贸易政策上依然如此 [52:35]* ## [54:26] 离开白宫是一种解脱,还是别的什么 离开白宫并非遗憾意义上的解脱——伊万卡·特朗普觉得自己在四年公共服务中"全力以赴",对自己的成就感到自豪。她视服务机会为"了不起的荣幸",但无意重返政坛,将孩子放在首位,不愿让他们为进一步的公共生活付出代价。她对自己的贡献感到满足,也认为父亲现在拥有一支强大的团队来支持他。 > *我全力以赴了,你知道吗?我不会回头说……我没有遗憾。 [53:33]* > *我的首要责任是做他们的妈妈。 [56:49]* ## [58:08] 是否有人真正为白宫生活做好了准备 伊万卡·特朗普坦言,没有什么能真正让一个人为高层政治和白宫生活的高强度体验做好准备。她观察到,权力就像财富一样,往往会放大人们固有的特质。她与全球领导人——从君主到民选官员——的互动,消除了对他们的神秘感,揭示出他们本质上"只是普通人",有着普通的困扰,这最终消除了她可能产生的任何畏惧感。 > *没有什么能训练你应对这种经历。 [58:26]* > *你最终会意识到,人终究是人。 [59:03]* ## [59:44] 暗杀未遂事件永远改变了什么 2024 年 7 月对她父亲的暗杀未遂事件彻底改变了伊万卡·特朗普的生活,加剧了安全顾虑,使她不得不接受美国特勤局的保护。和孩子们一起实时目睹了这一事件后,她的第一反应是保护他们,尽管她凭直觉感到父亲会没事。这次惊心动魄的经历,连同家庭中其他的健康惊吓,强化了她对生命珍贵的信念,以及选择积极态度、珍惜每一刻的决心——尽管公共服务与暴力之间令人不安的关联令她担忧。 > *我的第一反应是让他们转过身去。 [62:02]* > *在生活中,你唯一能选择的就是如何回应。而我选择看到积极的结果。 [66:05]* ## [1:07:20] 远离政坛后的生活是什么样的 2022 年远离政坛后,伊万卡·特朗普的生活如今以年幼的孩子和私人家庭生活为优先,因为她发现政治这个"黑暗世界"与她的本性格格不入。她用"鹰与乌鸦"的比喻来应对公众批评——选择高飞远离消极,而不是与之纠缠。这段经历高强度的公众审视——包括父亲的生死考验——成为她个人成长的"良药",教会她寻求内心的平静与和谐(这些在她的掌控之中),并对生命中的恩赐心存感激。 > *政治是一个相当黑暗的世界。有很多阴暗面、很多负面情绪,这真的与我作为人的本性格格不入。 [67:45]* > *鹰对此的回应……不是去扭来扭去把乌鸦甩掉或者自我防御……而是直接向上飞。 [69:28]* ## [1:11:04] 广告 这一章节是播客中的一段简短广告时间。 ## [1:14:24] 心理治疗如何改变了她看待一切的方式 伊万卡·特朗普开始成年后的心理治疗,将其视为一种"内在盘点"的工具——这源于她"成长导向的心态"和处理重大人生事件的需求。关键的催化事件包括丈夫贾里德第二次被诊断出甲状腺癌、她从华盛顿回归,以及母亲的意外离世。心理治疗帮助她学会关爱自己、处理情绪,而不是将其封存起来,最终改变了她对自我认知和向前迈进的看法。 > *我有一种非常成长导向的心态……我一直在寻求了解自己和了解这个世界 [74:35]* > *贾里德……第二次被诊断出甲状腺癌。然后……我的母亲去世了 [75:59]* ## [1:20:28] 失去母亲以及这件事教会她的 伊万卡·特朗普回忆了 2022 年母亲伊万娜·特朗普突然而悲剧性的去世,强调了父母意外离世所带来的独特冲击。她决定进行一个真正的悲伤过程——面对不适、处理自己的感受。作为母亲,她现在致力于将母亲的优秀品质传递给孩子们,同时有意识地避免传递母亲身上的困扰,以一种更加清醒的成年人视角重新认识了母亲的一生。 > *不过她的确过了美好的一生。 [81:07]* > *我真的花时间去思考她——不再通过一个完全崇拜她的孩子的眼睛,而是通过一个看清她的成年人的眼睛。 [83:15]* ## [1:26:28] 她认为定义成功与幸福的三条法则 伊万卡·特朗普认为,真正的成功与幸福由三条关键原则定义——尤其是对于创业者而言——这也是她会分享给女儿阿拉贝拉的。第一,你必须真正热爱自己所做的事,因为热情是全身心投入的基础。第二,真实至上;做自己、开辟自己的道路至关重要,因为模仿注定失败。第三,也是最根本的,你必须在世界相信你之前先相信自己,因为这是一切成就的起点。她还指出,传统的"工作与生活平衡"难以实现,她转而追求与优先事项的对齐。 > *我从未见过一个处于巅峰的人不是绝对热爱自己所做之事的。 [92:46]* > *你必须在世界相信你之前先相信自己。 [94:48]* ## [1:28:37] Planet Harvest 是什么,为什么它可能比你想象的更重要 Planet Harvest 是伊万卡·特朗普以使命驱动的创业项目,旨在减少食物浪费并支持美国农民。这一构想源于新冠疫情期间——她目睹大量易腐农产品因供应链问题被丢弃。Planet Harvest 解决的是一个持续存在的问题:完好的食物仅因不符合零售商严格的外观标准而被拒收。该项目为农民提供了额外收入,同时也有利于环境保护。 > *Planet Harvest 的诞生……是为了确保在人们需要食物时,田里的食物不会像疫情初期那样被犁掉白白浪费。 [89:18]* > *每年有四亿磅草莓被留在田里……不是因为它们有缺陷,只是因为它们不符合非常严格的外观标准。 [90:57]* ## 实体 - **Ivanka Trump(伊万卡·特朗普)**(人物):唐纳德和伊万娜·特朗普的女儿,商界人士,前政府官员。 - **The Diary Of A CEO**(组织):主持本次访谈的播客。 - **Donald Trump(唐纳德·特朗普)**(人物):伊万卡·特朗普的父亲,美国前总统。 - **Ivana Trump(伊万娜·特朗普)**(人物):伊万卡·特朗普的母亲,前捷克斯洛伐克滑雪运动员。 - **Michael Jackson(迈克尔·杰克逊)**(人物):美国著名歌手、词曲作者和舞者。 - **O.J. Simpson(辛普森)**(人物):前美国橄榄球运动员、播音员、演员和罪犯。 - **Marcus Aurelius(马可·奥勒留)**(人物):罗马皇帝,斯多葛派哲学家。 - **Shopify**(组织):用于搭建在线商店的电子商务平台。 - **Pipe Drive**(组织):智能客户关系管理(CRM)软件。 - **Anna Wintour(安娜·温图尔)**(人物):《Vogue》主编。 - **Vogue(《Vogue》)**(组织):时尚与生活方式杂志。 - **Wharton School of Business(沃顿商学院)**(组织):宾夕法尼亚大学商学院。 - **Office of Government Ethics(政府道德办公室)**(组织):负责防止利益冲突的美国政府机构。 - **Jared Kushner(贾里德·库什纳)**(人物):伊万卡·特朗普的丈夫,同样曾在政府任职。 - **US Secret Service(美国特勤局)**(组织):负责保护伊万卡·特朗普及其家人的政府机构。 - **Planet Harvest**(组织):伊万卡·特朗普联合创立的企业,致力于减少食物浪费和支持农民。 - **Arabella(阿拉贝拉)**(人物):伊万卡·特朗普的长女。 - **Stoicism(斯多葛主义)**(哲学):古希腊哲学流派。 - **Buddhism(佛教)**(哲学):东方哲学。 - **Daoism(道教)**(哲学):东方哲学。 - **Czechoslovakia(捷克斯洛伐克)**(地点):中欧的一个前国家。 - **New York City(纽约市)**(地点):美国主要城市。 - **Bedminster, New Jersey(新泽西州贝德明斯特)**(地点):伊万卡·特朗普得知父亲遭遇暗杀未遂时所在的地方。 - **Child Tax Credit(儿童税收抵免)**(政策):美国面向有子女家庭的税收抵免。 - **Great American Outdoors Act(伟大美国户外法案)**(政策):伊万卡·特朗普支持的立法。 - **Human Trafficking Legislation(反人口贩卖立法)**(政策):伊万卡·特朗普在公共服务期间参与推动的立法。 - **Vocational Education and Skills Training(职业教育与技能培训)**(倡议):伊万卡·特朗普推动的美国工人技能培训和再培训项目。 - **Meditations(《沉思录》)**(书籍):马可·奥勒留的个人著作集。

#ivanka-trump#family#childhood
Claude Code 中的探索→计划→编码→提交工作流
3:11
EN/ZH
点开看双语
ClaudeClaude Code 101大约 1 个月前

Claude Code 中的探索→计划→编码→提交工作流

Anthropic 三分钟演示了他们认为使用 Claude Code 时最重要的习惯:先在计划模式中调研,在触碰任何文件前明确"完成"的定义,然后在推送前让子代理审查差异。 ## [00:03] 为什么探索-计划-编码-提交优于直接动手 开场直截了当——如果你只从课程中养成一个习惯,就选这个工作流。它要对抗的失败模式是:把任务直接粘贴给 Claude,然后看它立刻生成代码——速度快,但后期纠错成本高。 > *Without this, most people jump straight to pasting in Claude to write code, which means more course correcting later on.* ## [00:21] 计划模式:编辑前的只读调研 计划模式将探索和计划合并为一步。Claude 可以读取文件、执行网页搜索,但不允许写入——在提示符处按 Shift+Tab 即可切换。演示者展示了一个真实需求(在图片上传流水线中添加 WebP 转换,找出它的位置、所需依赖和实现思路)。Claude 返回一个计划,你阅读后若发现遗漏可要求修改。这是整个周期中改变方向成本最低的地方,因为还没有写任何代码。 > *With plan mode, Claude can't edit files. It just reads files to gather research on how to tackle this implementation.* ## [01:11] 批准计划,然后在 Claude 编码时随时纠偏 计划确认后,批准操作将执行权交回给 Claude,逐一完成清单。你可以选择文件编辑自动接受还是每次都提示确认。Claude 会自行排查问题,但也要准备好干预——计划模式在这里发挥的价值是:代理携带了生成计划时的调研上下文,因此中途纠偏能落在正确位置,而不是从头开始。 > *This is the benefit of working with plan mode because after the plan is finished, we also have the context of how it got to the results to help it guide its next decision.* ## [01:39] 明确成功标准并为 Claude 提供真实工具 没有"正确"定义的计划会让 Claude 凭猜测行事。明确说明成功的样子,然后为代理配备真正能验证的工具:Claude+Chrome 扩展程序可以驱动浏览器标签页测试刚刚构建的 UI;测试套件为每次循环提供验证基准,Claude 也可以编写测试——但前提是你已经将其作为基准事实审核过。一个耐久性小技巧:当 Claude 反复遇到同一个问题时,让它把修复方案持久化到 CLAUDE.md 文件中,避免反复重新学习。 > *In order for Claude to be confident in its results, it has to be clear on what it deems correct.* ## [02:24] 子代理审查、提交与回顾 推送前,针对差异启动一个子代理代码审查者——第二轮审查对实现方式没有任何执念。然后让 Claude 按你的风格起草提交信息并提交。回顾阶段重新定义了每个步骤:探索提供上下文,计划定义成功,编码是向计划收敛的来回迭代,提交则是审查并推送,让你继续前进。 > *A tip before you commit, run a sub agent code reviewer to look at your code.* ## Entities - **Anthropic Tutorial Narrator** (Person): Anthropic Claude Code 101 课程的官方旁白。 - **Claude Code** (Software): 以本集为主题的、推荐日常使用工作流的代理终端编码工具。 - **Plan mode** (Feature): 通过 Shift+Tab 切换的只读模式——Claude 调研并提出计划,但不能编辑文件。 - **Claude + Chrome extension** (Software): 让 Claude Code 驱动 Chrome 标签页,在宣布任务完成前验证 UI 变更。 - **CLAUDE.md** (File): 项目记忆文件,在此用作持久化反复重学的修复方案的目标文件。 - **Subagent code reviewer** (Pattern): 提交前的 Claude 子代理,在人工推送前审查差异。

#claude-code#plan-mode#agentic-coding
Claude Code 中的上下文管理
3:51
EN/ZH
点开看双语
ClaudeClaude Code 101大约 1 个月前

Claude Code 中的上下文管理

Anthropic 的 Claude Code 101 系列视频关于上下文的讲解——什么会填满上下文窗口、自动压缩何时触发,以及保持会话精简所需的实用手段(/compact、/clear、/context、claude.md、MCP 开关、技能、子代理)。 ## [00:03] 为什么上下文是有限的,以及为何重要 上下文是 Claude 的工作记忆:每条提示词、每次文件读取、每次工具调用结果都落入同一个窗口。窗口虽大但有限,一旦开始运行多步骤会话,优化输入内容就是必须的。 > *Every file it reads, every command it runs, every message you send, it all takes up space in the context window.* ## [00:39] 自动压缩与 /compact 命令 接近限制时,Claude Code 会自动压缩:总结重要内容并丢弃嘈杂的工具调用结果以释放空间。你也可以手动触发 `/compact`——在想保留工作记忆但需要更多空间时很有用。权衡点:压缩可能丢失早期轮次的细节。 > *Compaction will summarize important details and remove the unnecessary tool call results and free up a lot of space in your context window.* ## [01:11] /clear 与 /context:重新开始与查看已用空间 如果想彻底重置、不保留任何先前会话记忆,`/clear` 会清空一切。要查看空间实际消耗在哪里,`/context` 会显示总大小、占用最多的类别以及分布图——在决定压缩还是清除之前,先用它来诊断。 > *To check the state of your context, run the /context command.* ## [01:35] 经验法则:功能进行中压缩,功能切换时清除 解说员给出了清晰的启发式规则:还在处理同一个功能、快触到上限了?压缩——你需要相关历史延续下去。计划已完成、要开始新内容了?清除——旧对话会对新工作产生偏差。 > *If you have finished the plan and want to start on a new feature, then clear. You don't want the previous conversation to present bias in anything new that you want to create.* ## [01:57] claude.md、提示词精确性与以多换少 Claude 应跨会话记住的内容都应放入 `claude.md`,避免每次重新发现相同事实。而反直觉的是,简短的提示词反而消耗更多上下文:问题模糊时,Claude 会在代码库中大量 grep 并进行更多推理,这些都会填满窗口。多写一两句具体说明,往后可节省大量空间。 > *The irony behind writing a smaller prompt is that it in the long run, it will take up more context.* ## [02:26] MCP 服务器、技能与子代理作为上下文管理工具 MCP 服务器默认将其暴露的所有工具加载到上下文中——与项目相关时没问题,无关时代价高昂,因此关闭与项目无关的服务器。技能的行为类似 MCP 服务器,但不会将整个工具面加载到上下文。子代理在并行中运行,拥有各自独立的窗口,因此对于事实查找任务("认证端点在哪里?"),可以派遣子代理,只取回答案而非整个探索过程。 > *Sub agents run in parallel with your main agent but has a complete separate context window.* ## [03:06] 回顾总结 在 Claude Code 中管理上下文,决定了一次会话是高效持久还是停滞不前。使用 `/compact` 压缩长会话,使用 `/clear` 重新开始,提示词要具体,用 `/context` 查看窗口消耗,将只需答案的工作委托给子代理。 > *Managing context within cloud code is crucial. Use slash compact to summarize long sessions and slashclear to start fresh.* ## 实体 - **Anthropic Tutorial Narrator** (Person): Anthropic 官方 Claude Code 101 教程系列的旁白配音。 - **Claude Code** (Software): Anthropic 的代理终端编程助手,本集主题即其上下文窗口。 - **Context window** (Concept): Claude 的工作记忆——有限,由提示词、文件读取与工具调用结果填充。 - **/compact** (Command): 用于总结历史并丢弃工具调用噪声以释放空间的斜杠命令(也可自动触发)。 - **/clear** (Command): 彻底清除会话的斜杠命令,用于在新工作上干净起步。 - **/context** (Command): 报告上下文总大小及各类别占用情况的斜杠命令。 - **claude.md** (File): 项目级记忆文件,Claude 跨会话读取,避免重复发现相同事实。 - **MCP servers** (Software): 工具提供者,默认将所有暴露的工具加载到上下文中——无关时应关闭。 - **Skills** (Feature): MCP 服务器的轻量替代方案,避免将整个工具面加载到上下文。 - **Sub agents** (Feature): 拥有独立上下文窗口的并行代理,用于回答范围明确的问题而不污染主窗口。

#claude-code#context-window#compact
AI 为何暂时取代不了数学家 —— 陶哲轩
4:12
EN/ZH
点开看双语
Dwarkesh Patel大约 2 个月前

AI 为何暂时取代不了数学家 —— 陶哲轩

陶哲轩讨论了 AI 在数学中不断演变的角色,认为 AI 虽然会自动化许多常规任务,但并不会完全取代人类数学家,而是推动他们转向新的研究前沿。他强调未来将是人机协作的时代,同时 AI 对科学发现的长期影响仍充满不确定性。 ## [00:10] AI 在前沿数学中的当下角色 陶哲轩指出,AI 已经在做人类无法完成的"前沿数学",只不过是另一种意义上的前沿。他把这种能力类比为计算器在过去如何扩展了数学的边界——以专门化的方式处理超出人类能力范围的任务。 > *从某种意义上说,它们已经在做人类做不到的、超级智能级别的前沿数学,只不过这种前沿和我们熟悉的不一样。* ## [00:52] AI 是自动化工具,而非替代者 陶预言,未来十年内 AI 将承担大量当前由数学家完成的常规工作,让人类可以聚焦于更复杂、更重要的问题。他以历史类比:计算机曾自动化了过去由"人肉计算者"完成的工作,基因测序也走向自动化,但遗传学这类领域却继续以新的尺度演化发展。 > *十年内,数学家现在做的很多事情……都可以由 AI 完成。但我们会发现,那其实并不是我们工作中最重要的部分。* ## [02:46] 数学领域人机协作的未来 Dwarkesh Patel 问到 AI 是否能自主解决千禧年奖难题。陶哲轩认为,"人类 + AI"的混合模式还将长期主导数学领域,因为当前的 AI 缺乏完全取代智力工作的全部要素,它更多扮演的是互补工具的角色。 > *我确实相信,人类与 AI 的混合模式会在数学领域主导相当长的一段时间。* ## [03:43] AI 对科学发现的影响难以预测 陶承认,AI 虽然会加速科学和新发现的诞生,但也有可能因"扼杀偶然性"而阻碍某些类型的进步。他总结道,AI 对科学发现的长期影响是高度不可预测的。 > *也有可能,AI 以某种方式破坏了偶然性,反而抑制了某些类型的进步。* ## 实体 - **陶哲轩(Terence Tao)**(人物):嘉宾,当代顶尖数学家。 - **Dwarkesh Patel**(人物):该播客主持人。 - **AI**(概念):人工智能,本集讨论其在数学与科学发现中的角色。 - **Mathematica / Wolfram Alpha**(软件):作为数学自动化例子被提到的计算工具。 - **千禧年奖难题(Millennium Prize Problems)**(概念):数学界的七大未解难题,每题悬赏一百万美元。

#ai#mathematics#terence-tao
高效使用子智能体
4:44
EN/ZH
点开看双语
ClaudeClaude Code subagents2 个月前

高效使用子智能体

子智能体在中间过程不需要留在主线程时最能发挥作用——但无差别地委派任务反而会让事情更糟。本教程划清了有效委派(调研、代码审查、领域专属系统提示词)与常见反模式(专家人设声称、顺序流水线、测试运行器)之间的边界,后者只会消耗上下文、丢失真正需要的信息。 ## [00:03] 引言:子智能体的适用场景与误用场景 本系列前几集讲了如何创建和设计子智能体。最后一集转向部署层面的问题:哪些任务真正值得派生独立智能体,哪些任务反而会因此受损? 判断标准归结为一个测试:中间过程对主线程重要吗?探索与执行分离时,子智能体物有所值;而当每一步都依赖上一步的发现时,交接代价恰好是你最需要的那些细节。 > *"Simply put, the difference comes down to whether the intermediate work matters to your main thread."* ## [00:32] 调研任务:让探索过程保持隔离 身份验证追踪是一个具体示例。主线程需要知道 JWT 验证发生在哪里——而不是沿途读过的十几个文件。调研子智能体可以扫描整个代码库、跨文件追踪函数调用,最终返回一个精确答案:JWT 验证位于 middleware/auth.js 第 42 行,由 route/api.js 调用。 所有探索过程都锁在子智能体的上下文里。主线程拿到结论就继续推进,搜索历史不会堆满它的窗口。 > *"Your main thread receives JWT validation happens in middleware/auth.js at line 42, called from the Express router and route/api.js, or something like that."* ## [01:15] 代码审查子智能体:以全新视角给出反馈 Claude 审查自己参与编写的代码时存在偏见——它经历了每一个决策,很难从外部视角发现问题。审查子智能体从根本上绕开了这一点:它只看到 diff 和修改后的文件,完全不知道代码是如何演化而来的。 这种"白板状态"还带来第二个好处。项目专属的审查标准——命名规范、安全模式、架构规则——可以一次性写进子智能体的系统提示词,持续稳定地应用,而无需主线程轮次内一遍遍记住它们。 > *"A reviewer sub agent sees the changes in a separate context. It runs get diff, reads the modified files, and applies its specialized review criteria without the history of how the code was written."* ## [01:59] 自定义系统提示词:文案撰写与样式定制 Claude Code 的默认提示词针对简洁、技术性输出做了优化——这对落地页或营销邮件来说恰恰是反效果。文案子智能体拥有完全不同的语气、受众和结构指令,能生成主线程默认设置绝对产出不了的内容。 同样的逻辑适用于 CSS。样式子智能体在提示词里引用设计系统文件,写第一行代码前就自动加载颜色变量、间距规范和组件模式,确保每个样式决策都反映真实的系统,而非合理猜测。 > *"Claude Code's default prompt tends towards concise, technical writing, which really isn't what you want for a landing page or email campaign, unless you want to put your customers to sleep."* ## [02:57] 反模式:专家声称、流水线与测试运行器 三种模式会稳定地让结果变差。第一,人设提示词——"你是 Python 专家"或"你是 Kubernetes 专家"——毫无用处,因为 Claude 本来就具备那些知识。单独派生子智能体只为贴一个专家标签,既承担了隔离开销,又没带来主线程自己做不到的任何东西。 第二,顺序流水线在步骤间并非真正独立时就会崩溃。三段式流程——复现 bug、调试、修复——听起来清晰,实际却行不通:调试智能体需要的是复现智能体的实时上下文,而不是它压缩后的摘要。 第三,测试运行器子智能体会主动隐藏信息。测试失败时,你需要原始输出来诊断问题。只返回"测试失败"的子智能体迫使你额外编写调试脚本,才能还原直接输出本来就会展示的细节。 > *"A sub-agent that returns a test failed forces you to create additional debug scripts to get details that would have been visible in direct output."* ## [04:10] 系列回顾与核心决策启发式 纵观本系列:子智能体是通过 /agents 创建的隔离线程,返回摘要,设计时采用结构化输出和具体描述。适合用于调研、代码审查,以及需要自定义系统提示词的任务;不适合用于专家人设声称、多步依赖流水线和测试执行。 整个框架浓缩为一个问题:中间过程重要吗?如果不重要,就委派出去。 > *"The key question, does the intermediate work matter? If not, then delegate it."* ## 实体 - **Anthropic Tutorial Narrator**(人物):Claude Code 子智能体教程系列主讲人,来自 Anthropic - **Claude Code**(软件):Anthropic 的 AI 编程助手;创建和编排子智能体的运行环境 - **Subagent**(概念):从主上下文派生的隔离 Claude 线程,返回压缩摘要,而非暴露完整的工作上下文 - **JWT(JSON Web Token)**(概念):作为调研子智能体在代码库中追踪身份验证逻辑的实操示例 - **System prompt**(概念):子智能体专属指令集,支持与 Claude Code 默认提示词不同的领域专属行为 - **Anthropic**(组织):Claude 和 Claude Code 子智能体教程系列的开发者

#claude-code#subagents#ai-agents
创建子代理
3:45
EN/ZH
点开看双语
ClaudeClaude Code subagents2 个月前

创建子代理

Claude Code 内置了若干子代理,而自定义子代理让你能针对特定任务接入专属行为。本教程从零开始创建一个代码审查子代理——演示 `/agents` 命令、工具选择、模型选取,以及决定 Claude 何时、如何进行任务委托的各个配置字段。 ## [00:03] 自定义子代理是什么 Claude Code 自带内置子代理,你也可以创建专注于特定任务的自定义子代理。自定义子代理本质上是一个带有 YAML frontmatter 的 Markdown 文件:frontmatter 告诉 Claude 何时路由到该代理以及它拥有哪些能力,Markdown 正文则是子代理运行时依赖的系统提示词。 > *"Custom sub aents are markdown files with YAML front matter. These markdown files contain configuration that helps claude understand when to use the sub aent and provides directions to the sub aent itself."* ## [00:28] 用 /agents 创建子代理 `/agents` 命令会打开代理管理面板。选择"创建新代理"后会依次询问两个问题:作用域(当前项目还是机器上所有项目共享)以及生成方式。推荐的做法是让 Claude 自动生成——教程中演示者用自然语言描述了一个"审查代码质量和安全问题"的需求,Claude 便会自动完成后续配置。 > *"Now, the easiest way to create a sub agent is with the / agents command. Next, you can create a sub agent manually, but we recommend using claw code to automatically generate it for you."* ## [00:56] 配置工具、模型与颜色 Claude 生成文件之前,你需要选择子代理可以使用哪些工具。代码审查代理其实不一定要开启编辑工具,但保留代码执行权限可以让它更方便地检视待提交的改动。工具选好之后,选择模型:haiku 主打速度,opus 追求深度,sonnet 居中。最后选一个颜色——它会显示在界面上,让你一眼认出是哪个子代理在运行。 > *"Now, given that our sub agent is only responsible for reviewing code, you might decide to disallow tools for editing, but I'll leave an execution to allow the sub agent to more easily identify pending changes."* ## [01:43] 读懂配置文件 生成的文件会保存到项目中,路径显示在摘要窗口里。有四个字段最为关键。`name` 是唯一标识符,在消息中输入 `@agent-code-quality-reviewer` 即可引用它。`description` 是 Claude 用来判断是否委托任务的依据,必须写在一行(转义的 `\n` 会被当作字面字符)。在描述里加上"proactively",Claude 会更主动地调用该代理;加入示例对话则能让路由更准确。`tools` 与生成时授权的工具一致,但可以直接在文件里修改。 > *"If you want Claude to use the sub agent automatically more often, add in the word proactively to the description."* ## [02:41] 系统提示词与 Claude 的使用方式 `model` 字段接受 `haiku`、`sonnet`、`opus` 或 `inherit`——`inherit` 让子代理沿用父会话所用的模型。frontmatter 以下的所有内容就是系统提示词:它引导子代理完成任务,并告知它如何将结果返回给主代理。 > *"The system prompt will provide guidance to the sub agent, helping it understand how to complete its task and how it should return information back to the main agent."* ## [03:15] 测试你的子代理 保存配置后,修改几处代码,然后让 Claude 进行审查。如果子代理没有在预期的时机触发,`description` 字段是第一个排查点——加入更具体的示例,能帮助 Claude 更准确地判断何时进行委托。 > *"If the sub agent isn't being used when you expect, check your description. Adding more specific examples helps Claude understand when to delegate."* ## 实体 - **Anthropic Tutorial Narrator**(人物):本集唯一主持人;在 Anthropic 官方 YouTube 频道主持 Claude Code 子代理系列教程 - **Claude Code**(软件):Anthropic 的 AI 编程助手;同时支持内置子代理和用户自定义子代理 - **Custom subagent**(概念):一个带有 YAML frontmatter 的 Markdown 文件,用于配置 Claude Code 将特定任务委托给专属代理实例 - **/agents command**(概念):Claude Code 中创建和管理子代理的 UI 入口;支持项目级或全局作用域 - **System prompt**(概念):子代理配置文件的 Markdown 正文;在运行时为子代理提供任务指引和输出格式说明 - **Anthropic**(组织):Claude 和 Claude Code 平台的创建者

#claude-code#subagents#ai-agents