LaiDub

播客

物理学最大谜题:反物质、暗能量与万有理论 — Don Lincoln | Lex Fridman Podcast #497
2:53:42
EN/ZH
点开看双语
Lex Fridman29 天前

物理学最大谜题:反物质、暗能量与万有理论 — Don Lincoln | Lex Fridman Podcast #497

Fermilab 物理学家 Don Lincoln 与 Lex Fridman 展开近三小时的对话,把物理学描绘成一个长达四个世纪的统一工程:牛顿把天体引力与地面引力归为同一方程,麦克斯韦把电与磁熔为一体,爱因斯坦弯曲时空,标准模型将四种基本力中的三种合并。Lincoln 随后转向标准模型无法回答的问题——为何宇宙中存在任何物质、暗能量究竟是什么、暗物质是否终将现身于探测器之中。贯穿全程,他始终在"已测量到的"与"仍是精彩猜测"之间划出清晰界线,让人类知识的边界变得异常具体。 ## [00:00] 介绍 Lex Fridman 开篇将 Don Lincoln 比作具有 Richard Feynman 天赋的人——能把复杂想法剥回最核心的本质,却不失去其中的深刻之处。本集以此为框架,由一位在学科前沿工作了数十年的实验物理学家带领听众游历物理学最深层的开放性问题。 ## [00:49] 统一自然法则 Lincoln 用一条主线贯穿整部物理学史:统一。牛顿证明,月球向地球下落与苹果从树上坠落遵循同一个方程——"普遍"正是他的万有引力定律的关键词。麦克斯韦在 1860 年代做了结构上完全相同的事:看似毫无关联的电与磁,原来是同一种力的两张面孔,而他的方程自动预言了光以固定速度传播。Lincoln 从这个抽象发现一路拉到现代技术的实际应用:"如果不能驾驭电,我们至今还是农民和鞋匠。" 对话进而展开基础研究为何在数百年后才有回报——Lincoln 认为,1900 年让人完全看不懂的核物理,如今已是人类文明可用的最强大能量来源。Lex 补充了更长远的想象:掌握反物质或暗能量,或许有朝一日能造出推进系统,让人类抵达其他星系。 > *"它有衍生成果。而且一个接一个。最大的衍生成果,就是我们整个科技社会。"* ## [15:20] 爱因斯坦、狭义相对论与广义相对论 Lincoln 梳理了爱因斯坦的 1905 奇迹年:狭义相对论建立在两个前提上——自然规律对所有人都一样,所有人测到的光速也一样,无论相对运动如何。第二个前提听来荒谬,但粒子加速器已直接证实:从高速衰变粒子发射出的光子,抵达探测器时速度仍精确等于 *c*。闵可夫斯基随后指出,爱因斯坦的方程意味着空间与时间是同一个对象的两个分量,即时空。 广义相对论再进一步:爱因斯坦注意到,在火箭中自由下落与在引力场中的感受完全相同,由此推出引力根本不是一种力,而是质量造成的时空弯曲。Lincoln 认可闵可夫斯基在数学表达上的功劳,但坚持那个概念上的飞跃——质量弯曲空间本身的几何——属于爱因斯坦一人。他也为爱因斯坦晚年对量子力学的质疑辩护:那不是固执,而是有成效的批判,逼出了后来被实验验证的具体预言。 > *"我们都同意你的想法是疯狂的,但它够不够疯狂?"* ## [32:27] 电弱力 到 1930 年代,物理学家已梳理出四种力:引力、电磁力、强核力和弱核力。后两种只在原子核内部起作用,这也是大多数人从未直接接触它们的原因。1950 年代末至 1960 年代,Glashow、Salam 和 Weinberg 证明,电磁力与弱力在高能量下是同一种力——电弱力。问题显而易见:电磁力穿越宇宙(我们能看到数十亿光年外星系的光),弱力却几乎不超出质子的范围,两者怎么可能是同一种力? Lincoln 用一支落下的笔来演示:1964 年由 Peter Higgs 等人提出的希格斯场弥漫于整个空间。与它耦合的粒子获得质量;不耦合的,比如光子,则保持无质量。在早期宇宙的高温中,希格斯场为零,一切粒子都没有质量,各种力归于统一。随着宇宙冷却,希格斯场开启,打破了这种对称性——赋予 W 和 Z 玻色子质量,把电弱力分裂成今天熟悉的两个分量。希格斯场本身的振动就是希格斯玻色子:一个原本隐形的场的可探测激发态。 > *"在希格斯场里,振动就是希格斯玻色子。所以我们能做的,不是直接看到场,而是激发它、让它振动,然后探测振动。"* ## [44:09] 粒子对撞机的工作原理 E=mc² 不只是一句口号:动能可以转化为质量。把两个粒子以足够的能量迎头相撞,碰撞区域便能凭空产生全新粒子,且总是以正反物质对的形式出现。这正是对撞机所做的事。Lincoln 描述了 Fermilab 的级联加速器——五台机器像手动变速箱的齿轮一样依次咬合——以及 LHC 的 CMS 探测器的规模:21 米长、14000 吨重,每秒拍摄 4000 万次碰撞。 数据缩减的挑战同样令人咋舌。LHC 每秒产生约十亿次质子碰撞。快速电子学将其筛到每秒 10 万次,商用处理器再削减至 1000 次,最后这 1000 条记录交给研究生,让他们从中寻找可能拿诺贝尔奖的极少数事件。Lincoln 对无缝调度全球 PB 级数据传输的工程师格外推崇,称他们是现代物理学中不为人知的英雄。 > *"在每秒 5000 万次可能的碰撞中,快速电子学和计算机挑出 1000 次,再通过分析软件交给研究生。"* ## [62:12] 希格斯玻色子的发现 Lincoln 当时同时在 Fermilab 的 Tevatron 工作并向 CERN 的 LHC 过渡——一个物理学家同时戴着两顶帽子,两边都想赢。Fermilab 已系统性地排除了大部分可能的希格斯质量范围;到 2012 年年中,他们已将其锁定在约 120 至 145 GeV 之间。就在 CERN 7 月 4 日宣布的两天前,Fermilab 确认:如果希格斯玻色子存在,它必定就在 Fermilab 尚未排除的那个区间里。CERN 率先抵达。 Lincoln 对 2012 年的公告措辞十分谨慎:那是一个与希格斯玻色子相符的粒子。超对称理论预测的是五个希格斯玻色子,而不是一个。此后多年,通过测量自旋(零)、衰变产物(底夸克、W 和 Z、光子)及其比率,证据才逐渐汇聚到 Peter Higgs 1964 年的原始预言上。Lincoln 认为,希格斯玻色子的发现不像爱因斯坦的工作那样是一场革命,但它是 50 年实验探索的最后一个句号——标准模型虽不完整,但在其适用范围内基本正确。 > *"这是一个句号,为大约 50 年的发现与探索画上了终点,我们终于能够说:标准模型虽不完整,但在其适用范围内基本是对的。"* ## [72:32] 万有理论 大统一理论旨在将电弱力与强力合并;万有理论则要进一步把引力也纳入其中。Lincoln 直言:他看不到快速进展。统一所需的能量尺度约为 LHC 能达到的 10¹⁵ 倍,而加速器能量每 20 年只增长约七倍。按这条曲线外推,需要 500 年——而且摩尔定律不会永远成立。 他对弦理论的批评不在于其错误,而在于目前无法验证。弦理论使用近似方程的近似解,其庞大的可能宇宙图景使其几乎无从预言。圈量子引力发展更为完善,并提出了可检验的预言——其最初关于光速应随波长变化的断言已被伽马射线暴观测所否定,理论随之修订。Lincoln 寻找万有理论的路径,不是从现有理论外推,而是对已经与预言不符的现象做精确测量。他的比喻:一个生活在肯尼亚的南方古猿,试图从眼前的稀树草原预测阿尔卑斯山、南极洲和抹香鲸——外推越远,预测与现实的偏差就越大。 > *"我认为,认为我们能做到——把预测推到比我们目前可见高出一千万亿倍的地方——这是人类傲慢的极致。"* ## [102:17] 真空的物理学 "真空"并不空。量子场论说,每一种粒子都对应一个充满整个空间的场,这些场始终在振动。以特定方式振动时,真实粒子出现;非共振振动则是虚粒子——短暂的激发态,却有可测量的效应。两个实验证实了这一点。卡西米尔效应:两块金属板相距微米时,被板间受约束的虚粒子与板外不受约束的虚粒子之间的压差推向彼此。反常磁矩:旧量子力学对电子磁矩给出一个预言值;把包围裸电子的虚粒子浴考虑进来,预言值偏移约 0.1%——而这个偏移后的预言与实验测量在 10 位有效数字上完全吻合。 > *"我们已将电子和μ子的磁性测到了 12 位——没错,12 位有效数字。理论与数据在前 10 位逐位吻合。"* ## [109:41] 反物质 Paul Dirac 在 1928 年尝试将量子力学与狭义相对论合并,得到的方程有两个解:+1 是电子,−1 是没人见过的东西。他坚持数学是对的。Carl Anderson 在 1932 年通过云室照片证实了正电子的存在。如今,CERN 能够制造并囚禁反物质氢,将其冷却到接近绝对零度,用激光激发并测量其谱线——结果与普通氢完全一致。2023 年的一项实验将反物质氢原子释放进一个容器,发现它们向下坠落,与正常引力一致,尽管测量精度尚不足以确认引力强度完全相同。 更深层的谜题是:宇宙为何全由物质构成。通过清点星系数量与宇宙微波背景光子数,物理学家推算出:在早期宇宙中,每 10 亿个反物质粒子对应 10 亿零一个物质粒子。那 10 亿对湮灭了,多出来的那一个就是我们所见的一切。Fermilab 目前正在测试中微子与反中微子是否以略微不同的速率在各味间振荡——轻子起源机制——作为可能的解释,与日本的平行研究展开竞赛。 > *"在宇宙中存在的每 10 亿个反物质粒子对应 10 亿零一个物质粒子。那 10 亿对相互湮灭、消亡,而那多出来的一个,就是我们。"* ## [130:31] 暗能量 1998 年,天文学家原本打算测量引力制动宇宙膨胀的速度,却发现膨胀正在加速。驱动力是暗能量——一种排斥性的引力。爱因斯坦早在 1917 年就在场方程中加入了这个项,以维持宇宙的静态,后来哈勃发现宇宙在膨胀后将其去掉。1998 年,它重新回来了。 暗能量究竟是什么,至今未知。最普遍的看法是,它是空间本身的能量密度。问题在于,量子场论预言的真空能量密度比观测值大约 10¹²⁰ 倍——物理学史上最糟糕的预言。Lincoln 指出,如果暗能量的密度在空间膨胀时保持恒定,那么宇宙总暗能量是在增长的,这倾向于支持空间是量子化的观点:随着宇宙扩张,新的空间量子不断涌现,每个量子携带固定能量,从而使密度作为一种涌现性质保持恒定。 > *"量子场论里显然有什么地方严重出错了。"* ## [134:20] 暗物质 星系转得太快。星系团运动得太快。遥远星系的引力透镜效应比可见物质所能解释的更强。三项独立观测指向同一个结论:宇宙中约有五倍于可见物质的质量我们看不见。Lincoln 回顾了自己的心路历程:25 年前他怀疑问题出在牛顿定律上,两项观测改变了他的看法。子弹星系团——两个穿越彼此的星系团——显示引力畸变跟随星系走,而不是跟随停在中间的气体云,正是暗物质的预言。蜻蜓星系(DF2 和 DF4)完全按牛顿定律旋转,因为它们的暗物质似乎已被剥离——一个没有暗物质的星系,恰恰是暗物质真实存在的有力证据。 尽管三十年来通过三种途径不断搜寻——地下直接探测、星系中心附近的伽马射线搜索,以及 LHC 的缺失动量信号——至今没有任何暗物质粒子得到证实。可能的质量范围从亚电子到小行星量级,跨度极大,而实验每次只能覆盖其中一小片,这也是 Lincoln 目前没有亲自参与暗物质实验的原因。 > *"我们已经排除了一些暗物质粒子候选,但问题在于可能质量的空间范围太广——从小行星质量到远轻于电子,以及这之间的一切。"* ## [162:56] 物理学的未来 Lincoln 成长于美国农村的贫困家庭,科幻小说和 Isaac Asimov、Carl Sagan、George Gamow 的科普书籍塑造了他。1980 年代中期,他选择粒子物理而非宇宙学,原因是粒子物理能让他真正测量东西。读研究生时,他从周一到周六早上八点工作到午夜,不是出于压力,而是因为他想不出还有什么更值得做的事。他在 YouTube 上发视频、写科普书,是一种刻意的努力,要触达那些身处爱荷华州或蒙大拿州、家里没有高学历长辈可以引路、却有着和他当年一样求知渴望的孩子。他已经收到消息,有 Fermilab 暑期实习生正是因为看了他的视频才来到这里。 Lex 以 Marie Curie 的话作结:*"生命中没有什么可怕的,只有等待理解的事物。"* > *"你的某位观众,也许就是那个能解答这些困扰无数聪明人数十年之谜的人。"* ## 实体 - **Don Lincoln**(人物):Fermilab 高级科学家;1995 年顶夸克发现论文的共同作者;LHC 的 CMS 合作成员;著有《爱因斯坦未竟之梦》等多部科普书籍。 - **Lex Fridman**(人物):MIT 研究员,Lex Fridman Podcast 主播,专注于科学、技术与哲学交汇处的长篇访谈。 - **Fermilab**(机构):美国能源部粒子物理实验室,位于芝加哥附近;曾运营 Tevatron 对撞机;目前是全球最强大的中微子束流设施。 - **CERN / LHC**(机构):欧洲粒子物理实验室,大型强子对撞机(LHC)的所在地;拥有 CMS 和 ATLAS 探测器;2012 年希格斯玻色子发现地。 - **标准模型**(概念):描述四种基本力中三种以及所有已知基本粒子的量子场论;已被验证到极高精度,但不包含引力,也无法解释暗物质、暗能量或物质-反物质不对称。 - **希格斯场 / 希格斯玻色子**(概念):一种标量量子场,其非零真空期望值赋予 W 和 Z 玻色子质量,同时保持光子无质量;希格斯玻色子是其可探测的激发态,于 2012 年 7 月 4 日在 CERN 被发现。 - **暗物质**(概念):不可见质量,约占宇宙全部物质的 85%,由星系旋转曲线、星系团动力学和引力透镜推断而来;搜寻三十年,候选粒子尚未得到证实。 - **暗能量**(概念):驱动宇宙加速膨胀的排斥性能量;量子场论对其量级的预言比观测值大 10¹²⁰ 倍——"物理学史上最糟糕的预言"。 - **重子起源 / 轻子起源**(概念):试图解释早期宇宙为何产生物质超量的理论框架;Fermilab 的中微子计划正在通过比较中微子与反中微子的振荡速率来检验轻子起源机制。 - **弦理论 / 圈量子引力**(概念):量子引力的主要候选理论;弦理论所需的验证能量比现有手段高出 10¹⁵ 倍;圈量子引力将空间本身量子化,已产生一些可证伪的预言。

#particle-physics#dark-matter#dark-energy
FFmpeg:互联网视频背后的神奇技术 | Lex Fridman 播客 #496
4:18:22
EN/ZH
点开看双语
Lex Fridman大约 2 个月前

FFmpeg:互联网视频背后的神奇技术 | Lex Fridman 播客 #496

Lex Fridman 与 Jean-Baptiste Kempf(VideoLAN 主席、VLC 首席开发者)以及 Kieran Kunhya(资深 FFmpeg 贡献者、FFmpeg 在 X 平台官方账号的操盘手)进行了长达四小时的深度对话,探讨支撑互联网几乎所有视频的无形机器。他们完整追溯了从原始字节和 container 格式到手写汇编、codec 逆向工程的全过程,并正面审视了开源可持续性危机。这场对话既是一堂技术大师课,也是一次深刻的反思——那些才华横溢的志愿者(其中许多还是青少年)为何默默构建起每天为数十亿台设备提供动力的基础设施。 ## [00:00] 精彩片段 本集以一段快节奏的精彩集锦开场,凝练了后续内容的精华。Kempf 提炼出 FFmpeg 社区的核心价值观:代码质量是唯一的凭证——"也许你是一条狗,我无所谓。我只需要看你的代码。"Kunhya 补充了规模数据:FFmpeg 在任意时刻运行在约 1 亿个 CPU 上,30 亿台设备持续解码视频,而 FFmpeg 的 x86 汇编手工优化比等效 C 代码快 62 倍。本段还预告了 CIA-VLC 间谍故事、Kempf 断然拒绝情报机构后门请求的经过,以及 Kieran"无怨无悔"的 Twitter 哲学。 > *"我们在乎出色的代码,不在乎你是谁。也许你是一条狗,我无所谓,对吧?我只需要看你的代码。"* — Jean-Baptiste Kempf ## [02:17] 介绍 Lex 描绘了背景:FFmpeg 是 YouTube、Netflix、Chrome、VLC、Discord 以及几乎所有涉及视频或音频的平台背后那根看不见的脊梁。VLC 的下载量已超过 65 亿次。两个项目均完全由志愿者构建。Lex 将这期节目定位为不仅仅是一场技术讨论,更是对那些为了技艺本身而非名利而工作的工程师们的致敬——"这是人类悄然跨越国界协作、构建有用、耐久且优雅之物的最伟大范例之一。" > *"这是有史以来最令人难以置信的软件系统之一,而这一切都由志愿者完成。"* — Lex Fridman ## [05:35] VLC 能打开的最奇怪的东西 对话轻松起来,聊起了 VLC 对奇异格式的传奇兼容性。Kempf 描述了用户通过采集卡录制 VHS 磁带、支持自定义加密的 DVD-Audio,以及 FFmpeg 专门为卢卡斯影业《星球大战》游戏 codec 实现的解码器(仅用于一段 10 秒的开场动画)。在一次 VideoLAN 大会上,参赛者竞相创作史上最残破的文件——一个 MKV,每一帧的分辨率、宽高比和旋转方向都不同——而 VLC 完美播放了它。节目中还聊到了那个橙色交通锥的 logo:辨识度极高,以至于 VLC 网站 25% 的流量来自搜索"锥形播放器"的用户。 > *"有个文件同时是一个有效的 ZIP 又是一个有效的 MP3,诸如此类——VLC 打开了所有这些奇怪的文件。"* — Kieran Kunhya ## [09:59] 视频播放原理 Kempf 和 Kunhya 逐步讲解按下播放键后发生的一切:播放器从 URL 获取字节流,解复用器分离音频、视频和字幕轨道,熵解码消除数学压缩,帧内预测重建静态图像帧(I 帧),运动补偿处理时间冗余(P 帧和 B 帧),最终将原始像素交给 GPU 或声卡。视频压缩通过利用人眼对亮度与色彩感知差异——在 YUV 色彩空间而非 RGB 中处理,并跨帧复用不变的背景区域——实现 100 到 200 倍的压缩率。Kunhya 警告说,这条流水线中的每一句话背后,都是某人一生的工作。 > *"我们刚才在过去几分钟里说的一切,每一句话都是某人一生的工作。关于每一句话,都有专著论述。"* — Kieran Kunhya ## [19:20] 视频 codec 与 container 主持人厘清了经常被混淆的 container 与 codec 的区别。container(MP4、MKV、MOV)负责多路复用音频、视频和字幕轨道;codec(H.264、AV1)负责压缩内部内容。VLC 和 FFmpeg 刻意忽略文件扩展名,直接探测实际字节——因为在现实世界中,扩展名常常撒谎。本段还介绍了 AVI 是微软的格式、MOV 经由苹果演化为 MP4,以及 Matroska/MKV 格式如何从开源社区中诞生。AV1 等现代 codec 并非单一算法,而是一套适应不同内容类型的工具集合——屏幕共享、动画、直播视频各需不同的编码策略。 > *"我们丢弃文件格式,直接查看文件内部来理解其内容,因为太多人说'哦,这是视频,一定是 MP4',但从技术上看它可能是 MOV,也可能是 MKV。"* — Jean-Baptiste Kempf ## [30:07] FFmpeg 详解 FFmpeg 被描述为一套底层库——libavcodec、libavformat、libavfilter——加上一个 Kempf 称之为完整编程语言的命令行工具。每一个正在观看 YouTube 视频、用 OBS 录制或在专业广播设备上剪辑的人,都可能在使用 FFmpeg。Kunhya 指出,万亿美元级企业和在家录制家庭视频的祖母,使用的是完全相同的技术栈。本段深入探讨了开源许可证——MIT、GPL、LGPL、AGPL——作为定义社区规范的"社会契约"。Kempf 讲述了将 VLC 核心从 GPL 重新许可为 LGPL 的艰辛历程:他必须逐一联系超过 350 位贡献者,甚至登门拜访一位已故贡献者的工厂工人父亲,只为获得两行代码的授权许可。 > *"从哲学层面来看,令人叹为观止的是,你祖母的家庭录像和万亿美元级企业站在同一条起跑线上,使用着同样的技术栈。"* — Kieran Kunhya ## [51:07] Linus Torvalds Kempf 为 Linus Torvalds 著名的严苛风格进行了细致的辩护。Linux 内核的核心社区规模极小——FFmpeg 也一样(10 至 15 名活跃维护者)——而那少数几个人必须永远维护每一行代码。"我们不能在质量上妥协,因为 FFmpeg 的核心社区只有十到十五人,而我们就是将来要维护你代码的人。"Kunhya 补充说,言辞简短往往只是疲惫使然:志愿者在工作一整天后回到家,没有精力来手把手地指导贡献者。Kempf 还指出,大多数社区成员的母语不是英语,文化误读往往放大了感知到的敌意。 > *"我们不能在质量上妥协,因为 FFmpeg 的核心社区只有十到十五人,而我们就是将来要维护你代码的人。"* — Jean-Baptiste Kempf ## [55:46] 拒绝数千万美元,让 VLC 保持无广告 Kempf 追溯了 VLC 不寻常的起源:法国一所工程学校(École Centrale Paris)的学生在 1995 年——比 YouTube 早了整整十年——为了给视频游戏提供更快的网络,自行搭建了一套卫星视频流系统。从那个 Network 2000 项目中诞生了 VideoLAN,VLC 则是其客户端。Kempf 于 2003 年加入,彼时项目已濒临消亡,他将其从数十万次安装量发展到数十亿次,并在此过程中多次拒绝了捆绑工具栏、更换搜索引擎或植入广告的"天价"提议。他的理由是:"我需要在夜里睡个好觉,对自己所做的事感到满意。如果我出卖了它,我就背叛了那么多在这里工作的人。" > *"我拒绝了数千万美元,是的,不止一次。是的,我本可以成为千万富翁,在某个海滩上晒太阳。但我没有这样做,因为我认为这样做既不道德,也不是正确的事。"* — Jean-Baptiste Kempf ## [70:04] FFmpeg 与 Google 的风波 Kunhya 回顾了一场公开争议:Google 的安全团队用 AI 自动生成 FFmpeg 的 bug 报告,在严格的 90 天截止期限内提交——有些漏洞报告甚至在补丁尚未写出之前就发给了媒体——却未提供相应修复或有意义的资金支持。Kunhya 将其比作"对冷僻的 1990 年代游戏 codec 发起的 AI 生成 bug 报告式拒绝服务攻击"。这场风波经由火辣辣的 FFmpeg 推文(Kunhya 称之为"说唱对决")不断升级,但最终产生了实质性成果:Google 开始提交补丁,并建立了针对修复工作的财务奖励机制。另一段插曲是:微软 Teams 的工程师在志愿者 bug 跟踪系统上提交了一个高优先级 bug,特意提及他们产品的用户规模,并在 Kempf 要求长期支持合同时给出了区区数千美元的一次性付款回应。 > *"Google 使用 FFmpeg 的规模,可能你我都难以想象——数百万个 CPU 核心。是的,他们在主要涉及自家产品的领域有所贡献,但从更宏观的角度来看,贡献与使用极度不成比例。"* — Kieran Kunhya ## [89:18] FFmpeg 开发者们 是什么驱使着 FFmpeg 的志愿者工程师们?Kempf 归纳出三大动力:对主题本身的热情(许多贡献者是因为热爱动漫而加入的)、对技艺卓越性的追求("这是有史以来最好的编程学校"),以及对影响力的自豪感("你可以告诉你奶奶:我做这件事,就是为了让你能在笔记本上播放视频")。Kunhya 补充说,Zig 编程语言的创造者 Andrew Kelley 曾是一名 FFmpeg 开发者,并将在那里的经历称为自己真正的实战教育。还有青少年为 FFmpeg 编写了数千行手工优化的汇编代码。Kieran 最喜欢的一句话来自 John Collison:"这个世界是热情项目的博物馆。" > *"如果你精通 C,如果你知道如何为 FFmpeg 编写汇编,我向你保证,你将成为最优秀的程序员之一——即便你从事的是 TypeScript 的编写工作。"* — Jean-Baptiste Kempf ## [95:55] VLC 与 FFmpeg Kunhya 将 FFmpeg 与 VLC 的关系定义为"双星系统":VLC 之于 FFmpeg,如同 Android 之于 Linux——它们相互依存,因彼此而成功。约 80% 的 FFmpeg 流水线依赖至少一个 VideoLAN 项目(最常见的是 x264)。VLC 让 FFmpeg 接触到现实世界中形形色色的残损文件。在为 Windows 编译时,VLC 链接了约 1600 万行代码,其中仅 100 万行存在于 VLC 自身的代码库中。两个项目共享许多开发者,共同证明了复杂的软件生态可以完全由相互依存的开源组件构建而成。 > *"VLC 之于 FFmpeg,如同 Android 之于 Linux。它们相互依存,因彼此而共存。"* — Kieran Kunhya ## [100:29] FFmpeg 的历史 FFmpeg 的"时代之旅"从 Fabrice Bellard 创立初始概念开始,随后是 2000 年代初期 Michael Niedermayer 的时代——对 DivX、Xvid、Windows Media 和 RealMedia 的全面支持,彻底消除了对臃肿、充斥间谍软件的 codec 包的依赖。2000 年代末,H.264 日趋成熟,高清视频时代随之兴起。在整个历程中,VLC 充当了 FFmpeg 的实战试炼场:数百万用户暴露出任何实验室都无法预见的边界情况。 > *"那时候你需要一个新播放器来播放每种不同格式的文件。有一个快速且开源的单一库——那是一项伟大的成就。"* — Kieran Kunhya ## [103:46] 逆向工程 codec 本段展示了逆向工程专有 codec 的艺术。Kostya Shishkov——被誉为"天才边缘人"——将 20 至 30 MB 的二进制文件(每兆字节约相当于普通人一个月的工作量)当作消遣,为 Windows Media、RealMedia 和 GoToMeeting 格式编写解码器。Kunhya 解释了其方法论:钩入专有播放器以转储原始 YUV 数据,打开反汇编器,逐条指令步进机器码,推断熵编码、预测和 IDCT 阶段,然后用样本文件验证逐位精确性。数月之内,工作没有任何可见输出——纯粹在内存中调试。 > *"他把整个世界看作一份二进制规范。他不需要文档或任何东西。他会独自离去,回来时带着有趣的成果。"* — Kieran Kunhya ## [117:01] FFmpeg 测试 FFmpeg 的 FATE(FFmpeg 自动化测试环境)系统运行着一张测试组合的数据透视表:数十种编译器(GCC、Clang、MSVC、Apple Clang、Intel Compiler)、操作系统(Linux、macOS、Windows、BSD、Solaris)和 CPU 架构(x86、ARM、RISC-V、PowerPC)。所有测试机器均由志愿者托管。该系统能捕获编译器错误编译——罕见但具有毁灭性,因为帧依赖链中哪怕一个错误的比特都可能级联成严重的画面损坏。Kunhya 说,FATE 控制台顶部的那几台 Mac 就托管在他自己的办公室里。 > *"这已经不只是一个矩阵了,更像是一张不同组合的数据透视表——全部由志愿者运行。"* — Kieran Kunhya ## [121:08] 汇编代码(手写) 这一扩展章节是本集的技术核心。FFmpeg 和 x264 中手写的 x86/ARM SIMD 汇编代码比等效 C 代码快多达 62 倍——尽管多年来不断尝试,现代编译器和自动向量化仍无法弥合这一差距。VLC 仍然支持从 Windows XP 到 Windows 11、从 macOS 10.7 到 macOS 26、iOS 9 到最新版本,以及 BSD、Solaris,甚至 OS/2。理解汇编能迫使程序员内化 CPU 流水线阶段、SIMD 寄存器、L1/L2/L3 缓存和内存总线约束。Kempf 和 Kunhya 介绍了 Loren Merritt 为 x264 构建的 x86inc 框架,以及 JB 的《Assembly Lessons》系列教程——这些已吸引直接从源头学习的青少年贡献代码。 > *"我认为有必要理解汇编语言,即使你不常用它,也是为了理解计算机内部正在发生什么。这会让你成为一个更好的程序员。"* — Jean-Baptiste Kempf ## [145:26] Rust 编程语言 Kempf 和 Kunhya 对 Rust 持不同看法。Kunhya 尊重内存安全的目标,但觉得其社区过于自以为是——"它有一种很强烈的世界语气质"——并认为 Rust 的重写仅能达到 85-90% 的所需功能覆盖率是不够的;"最后的 1% 要花掉 99% 的时间。"Kempf 编写过 Rust 的 VLC 模块,并看到了真正的价值,但指出由于底层 SIMD 工作的训练数据匮乏,AI 工具目前还无法提供有意义的帮助。讨论进一步延伸到社区的两位汇编大师:Henrik Gramner,其对 Intel x86 时钟周期数的了解超过 Intel 自己的工程师;以及 Martin Storsjö,他在看孩子们在操场上玩耍时,用虚拟键盘编写 ARM Neon 汇编。 > *"Rust 让我想起了 Sinclair C5。要让人们迁移,你必须构建一些至少与现有之物一样好,甚至更好的东西。"* — Kieran Kunhya ## [154:42] FFmpeg 与 Libav 分叉 2011 年,FFmpeg 分裂为 FFmpeg 和 Libav,主要原因是治理和领导风格分歧,而非技术层面的争议。几个 Linux 发行版一度改为打包 Libav 而非 FFmpeg。Kempf 认为开源分叉是健康的——它迫使项目正视自身的结构性弱点。最终,Libav 的大多数开发者回归 FFmpeg,两个项目重新合并。Kempf 将其与 XZ Utils 攻击事件相类比:一位独立维护者在被持续社会工程学攻击拖垮后,向攻击者授予了提交权限——这凸显了精疲力竭如何在关键开源基础设施中制造出使其脆弱的单点故障。 > *"分叉很重要,因为它们改变了社区的现状。今天的 FFmpeg 比分叉之前更好。"* — Jean-Baptiste Kempf ## [163:04] 开源倦怠 Kempf 和 Kunhya 正面审视了开源维护者的心理健康危机。Kempf 收到过实质性的死亡威胁——包括一封内含粉末的信——起因是他决定放弃对 PowerPC 的支持。安全社区习惯于为业余项目的边界情况提交警告性的 CVE,在不提供补丁的同时增加了心理负担。Kempf 现在维护着多个原维护者已精疲力竭而放弃的库。对话进一步拓展到系统性问题:libxml 和 XZ 等关键基础设施仅由一两个人维护,而依赖它们的万亿美元级企业对此浑然不觉。 > *"开源维护者的心理健康问题,是大型企业既不在乎也看不见的。"* — Jean-Baptiste Kempf ## [170:51] x264 与互联网视频 H.264 恰逢 Intel Core 2/Nehalem CPU 使实时软件解码成为可能之际,彻底改变了互联网视频。x264 的关键创新是视觉心理率失真优化——编码决策由视觉质量指标而非均方误差驱动,产出更锐利、更自然的视频。这一创新来源于动漫社区对感知锐度的高标准。AV1 在相同画质下提供比 H.264 节省 40-60% 带宽的效果,但编码成本高出两个数量级。因此 YouTube 只对热门视频重新以 AV1 编码,将额外的算力成本分摊到数百万观众身上,使其物有所值。 > *"Netflix 现在有 30% 的视频采用 AV1,YouTube 则达到了 50%。"* — Jean-Baptiste Kempf ## [184:07] 视频压缩基础 本章澄清了 I/P/B 帧结构:I 帧是完整的静态图像,P 帧只引用前一帧,B 帧可以引用前后帧。ProRes 是一种仅含帧内编码的 codec,专为非线性剪辑设计——无时间依赖关系,快速定位。本段还涵盖了固定码率与固定质量编码、图像组(GOP)长度,以及 Netflix、YouTube 和 Meta 数以千计的工程师——他们的全部工作就是针对特定内容类型调优 FFmpeg 参数。一段历史趣闻:Google Video 最初在 Internet Explorer 中以 ActiveX 插件形式使用 VLC;如今 VLC 被编译为 WebAssembly,在浏览器 JavaScript 引擎中运行。 > *"有完整帧的 I 帧、只依赖 I 帧的 P 帧,以及可以依赖前后帧的 B 帧。"* — Jean-Baptiste Kempf ## [191:04] CIA 与伪造的 VLC 维基解密的 Vault 7 披露显示,CIA 构建了一个经过修改的 VLC 版本,其中附加了一个 DLL(psapi.dll),在受害者观看电影时静默加密并窃取文件,并以视频播放预期的高 CPU 负载作为掩护。VideoLAN 发出新闻稿,提示用户只从官方网站下载。另一事件涉及中国国家级黑客:他们使用合法签名的 VideoLAN DLL 分发伪造的 VLC,以印度用户为目标,导致印度封禁 VLC,直到 Kempf 打赢官司才使禁令撤销。本段还揭示了一个隐藏功能:VLC 可以在终端以 ASCII 艺术形式渲染电影,这在通过 SSH 诊断多播网络路径时非常实用。 > *"如果我们不得不破坏我们的软件,我们宁可关掉它。这一点是明确的。"* — Jean-Baptiste Kempf ## [201:39] 超低延迟流媒体 Kempf 解释了自适应流媒体(HLS、DASH):播放器下载分段,计时下载速度,并据此调整画质档位。真正的工程前沿是具有严格固定码率约束的直播广播——卫星上行链路连一秒的突发都承受不了。Kempf 介绍了他的公司 Kyber,这是一个开源(AGPL 双重授权)的超低延迟流媒体技术栈,面向机器人和 XR 领域,将压缩视频流传输给没有板载计算能力的设备。本段以对机器人远程操作的讨论收尾——在那个领域,延迟直接决定安全性。 > *"Kyber 是开源的。Kyber 上的一切都是开源的。如果你想在你的产品中使用它而不开源,你需要支付商业许可费用。"* — Jean-Baptiste Kempf ## [219:07] AV2 codec 与视频专利 AV2 是 Alliance for Open Media(VideoLAN 亦是成员之一)内部 AV1 的继任者,承诺进一步降低 30% 的带宽占用。VideoLAN 的 dav1d 解码器将由"dav2d"接力。Alliance for Open Media 的成立正是为了逃脱 HEVC/H.265 的专利泥潭:HEVC 的三个独立专利池要求的费用如此高昂,以至于 HP 将 HEVC 支持从新款笔记本中移除,流媒体巨头们算了一笔账——从头构建一个新的免版税 codec,成本低于每年的许可费用。法国对软件专利的拒绝态度意味着 Kempf 从未支付过 codec 许可费——如果他必须付的话,账单将超过每用户 200 欧元。 > *"以每年一亿美元的规模,你知道,我可以自己创建一个 codec——而他们正是这样做的。"* — Jean-Baptiste Kempf ## [228:59] VLC 后门 来自两个不同国家的情报机构联系 Kempf,要求他在 VLC 中植入后门。他两次都拒绝了,并且他形容自己的措辞"远没有礼貌到只是说一声不"。本章进一步延伸到欧洲创业文化的讨论:Kempf 认为法国创业文化在 15 年间已经大为改观——失败的污名化在消退,AI 公司在涌现——同时也承认过度监管仍是切实存在的阻力。他以反思自己在法律和政治压力下保持平静的策略作为结尾:始终问自己"我快死了吗?我伤害到别人了吗?"如果没有,就继续前进。 > *"如果我们不得不破坏我们的软件,我们宁可关掉它。也是因为我们所做的事情是好的,而且是为所有人做的。"* — Jean-Baptiste Kempf ## [239:14] 视频归档 Kieran 介绍了档案保存社区,这个社区部分由纽约市立大学(CUNY)的 Dave Rice 引领,他们依赖 FFmpeg 作为播放面向未来多媒体的"罗塞塔石碑"。社区资助了 FFV1——FFmpeg 的无损 codec——以确保归档素材不丢失任何信息,这至关重要,因为有损压缩可能毁掉只有在仔细检视时才可见的法证或历史细节。一个著名的警示案例:BBC 于 1986 年的新 Domesday Book 项目将内容归档在 BBC Micro 电脑上,不到 20 年就没有人有能正常工作的软件来读取它了。如今,档案馆中历史录像带的数量超过了世界上能够将其数字化的功能性磁带头的数量,迫使人们做出痛苦的优先级决策——究竟要保存哪些人类历史。 > *"C 语言将如同拉丁语。它会是你从过去学到的东西,但在某些语境中仍然可用。"* — Kieran Kunhya ## [245:51] FFmpeg 与 VLC 的未来 压轴章节展望了多媒体的走向:体积视频、用于机器人的点云 codec、RGBD 深度流、XR/VR 流媒体,以及——这只是推测——有朝一日可能需要为压缩大脑数据而设计 codec 的神经接口。Kempf 对 FFmpeg 百年后依然存在充满信心;对 VLC,他的评价是"也许"。他以自己的人生哲学作为收尾:"遗憾是对心灵的税赋。从错误中学习,但不要遗憾。"本集以 Lex 朗读 Linus Torvalds 的名言作结:"大多数优秀的程序员编程,不是因为他们期待获得报酬或公众的赞誉,而是因为编程本身就是一件有趣的事。" > *"遗憾是对心灵的税赋。从错误中学习,但不要遗憾。因为事情已经发生,除非你有时光机,否则别去遗憾。"* — Jean-Baptiste Kempf ## 实体 - **Jean-Baptiste Kempf**(人物):VideoLAN 主席、VLC 首席维护者、Kyber 及其他多家公司创始人;为保持 VLC 无广告而拒绝了数千万美元。 - **Kieran Kunhya**(人物):资深 FFmpeg 贡献者、codec 工程师、Open Broadcast Systems 创始人,FFmpeg 在 X 平台官方账号的操盘手。 - **Lex Fridman**(人物):Lex Fridman 播客主持人、AI 研究者、VLC 与 FFmpeg 的长期拥趸。 - **Fabrice Bellard**(人物):FFmpeg、QEMU 和 tcc 的创造者;项目的奠基性人物。 - **Michael Niedermayer**(人物):FFmpeg 长期维护者,在 2000 年代推动了对众多 codec 的全面支持。 - **Kostya Shishkov**(人物):传奇 FFmpeg 逆向工程师,为 Windows Media、RealMedia 和 GoToMeeting codec 破解了专有二进制文件。 - **Henrik Gramner**(人物):汇编大师,其对 Intel x86 时钟周期数的了解超过 Intel 自己的工程师。 - **Linus Torvalds**(人物):Linux 和 Git 的创造者;被引作开源社区中对代码质量毫不妥协的典范。 - **FFmpeg**(软件):开源多媒体框架,提供 codec、复用器、滤镜和命令行工具;几乎所有互联网视频的无形脊梁。 - **VLC**(软件):下载量超过 65 亿次的开源媒体播放器,基于 libVLC 和 FFmpeg 构建;在任何平台上均可播放几乎任何格式。 - **x264**(软件):VideoLAN 的开源 H.264 编码器;互联网视频领域占主导地位的软件编码器,以视觉心理优化著称。 - **dav1d**(软件):VideoLAN 高速开源 AV1 解码器;广泛部署于浏览器和流媒体客户端。 - **VideoLAN**(组织):负责管理 VLC、x264、dav1d 及相关开源多媒体库的法国非营利组织。 - **Alliance for Open Media**(组织):由 Google、Netflix、Apple、Amazon 和 VideoLAN 等组成的行业联盟,创建了 AV1 并正在开发 AV2 作为免版税 codec 标准。 - **FATE**(软件):FFmpeg 自动化测试环境;由志愿者托管的 CI 网格,测试数百种编译器/操作系统/架构组合。 - **Kyber**(组织):Jean-Baptiste Kempf 的初创公司,为机器人和 XR 构建超低延迟开源流媒体技术栈,采用 AGPL/商业双重授权。 - **H.264 / AVC**(概念):主流互联网视频 codec 标准;开源实现为 x264;蓝光光盘和大多数 MP4 文件的基础。 - **AV1 / AV2**(概念):Alliance for Open Media 推出的免版税下一代视频 codec 标准;AV1 比 H.264 节省 40-60% 带宽;AV2 再减少 30%。

#ffmpeg#vlc#open-source