PodcastsHear the voice. See the shape of the thought.
Explorar Canales

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496
Lex Fridman sits down with Jean-Baptiste Kempf, president of VideoLAN and lead developer of VLC, and Kieran Kunhya, longtime FFmpeg contributor and the voice behind the infamous FFmpeg account on X, for a four-hour deep dive into the invisible machinery behind virtually all video on the internet. Together they trace the full arc from raw bytes and container formats through hand-written assembly and codec reverse-engineering, confronting the open-source sustainability crisis along the way. The conversation is both a technical masterclass and a meditation on why brilliant volunteers—many of them teenagers—quietly build infrastructure that powers billions of devices every day. ## [00:00] Episode highlight The episode opens with a rapid-fire highlight reel that captures the spirit of what follows. Kempf distills the FFmpeg community's core value: code quality is the only credential that matters—"Maybe you're a dog. I don't care. I need to look at your code." Kunhya adds the scale: FFmpeg is running on roughly 100 million CPUs at any moment, with three billion devices continuously decoding video, and FFmpeg's x86 assembly hand-optimization runs 62 times faster than equivalent C. The segment also previews the CIA-VLC spy story, the intelligence-agency backdoor request Kempf flatly refused, and Kieran's "no regrets" Twitter philosophy. > *"We care about excellent code. We don't care who you are. Like maybe you're a dog. I don't care, right? I need to look at your code."* — Jean-Baptiste Kempf ## [02:17] Introduction Lex sets the scene: FFmpeg is the invisible backbone behind YouTube, Netflix, Chrome, VLC, Discord, and nearly every platform that touches video or audio. VLC has been downloaded more than 6.5 billion times. Both projects are built entirely by volunteers. Lex frames the episode not merely as a technical discussion but as a tribute to engineers who work for the craft rather than for fame or money—"one of the great examples of human beings quietly collaborating across borders to build something useful, durable, and elegant." > *"It is one of the most incredible software systems ever developed, and it's all done by volunteers."* — Lex Fridman ## [05:35] Weirdest things VLC opens The conversation lightens up with playful examples of VLC's legendary tolerance for exotic formats. Kempf describes users capturing VHS tapes via capture cards, support for DVD-Audio with custom encryption, and the Lucasfilm Star Wars game codec that FFmpeg implemented for a single 10-second opening sequence. At a VideoLAN conference, a competition to create the most broken file ever—an MKV where every frame changed resolution, aspect ratio, and rotation—ended with VLC playing it perfectly. The orange traffic-cone logo is discussed: so recognizable that 25% of VLC's website traffic arrives from people searching "cone player." > *"There was a file that's a valid ZIP and a valid MP3 at the same time or something like that—and VLC opened all of the stupid files."* — Kieran Kunhya ## [09:59] How video playback works Kempf and Kunhya walk through what happens the moment you press play: the player fetches a byte stream from a URL, the demuxer separates audio, video, and subtitle tracks, entropy decoding removes mathematical compression, intra prediction reconstructs still-image frames (I-frames), motion-compensation handles temporal redundancy (P- and B-frames), and the final raw pixels are handed to the GPU or audio card. Video compression achieves 100x to 200x reduction by exploiting how human eyes perceive luminance versus color—working in YUV space rather than RGB—and by reusing unchanged background regions across frames. Kunhya warns that every single sentence in this pipeline represents someone's lifetime of work. > *"Everything we've just said in the past couple of minutes, every sentence is someone's lifetime's work. There are books about every sentence."* — Kieran Kunhya ## [19:20] Video codecs and containers The hosts clarify the often-confused distinction between containers and codecs. A container (MP4, MKV, MOV) multiplexes audio, video, and subtitle tracks; the codec (H.264, AV1) compresses the content inside. VLC and FFmpeg deliberately ignore the file extension and probe the actual bytes—because in the real world, extensions lie. The segment covers how AVI was Microsoft's format, MOV became MP4 via Apple, and the Matroska/MKV format emerged from the open-source community. Modern codecs like AV1 are not single algorithms but collections of tools that adapt to content type—screen share, animation, live video—each requiring different coding strategies. > *"We discard the file format. We look into the file to understand what's in it because so many people say, 'Oh, it's a video, it must be MP4,' but technically it's an MOV or maybe it's a MKV."* — Jean-Baptiste Kempf ## [30:07] FFmpeg explained FFmpeg is described as a low-level library suite—libavcodec, libavformat, libavfilter—plus a command-line tool so expressive that Kempf calls it a full programming language. Every person watching a YouTube video, recording with OBS, or editing in a professional broadcast box is likely touching FFmpeg. Kunhya notes that trillion-dollar corporations and grandmothers with home videos operate on exactly the same technology stack. The segment dives into open-source licensing—MIT, GPL, LGPL, AGPL—as "social contracts" that define community norms. Kempf recounts the painstaking process of re-licensing VLC's core from GPL to LGPL, requiring him to track down more than 350 contributors, including visiting the factory-worker father of a deceased contributor to obtain permission for two lines of code. > *"From a philosophical level, it's incredible that your grandmother's home videos and trillion-dollar corporations are on a level playing field using the same technology stack."* — Kieran Kunhya ## [51:07] Linus Torvalds Kempf offers a nuanced defense of Linus Torvalds's legendary harshness. The Linux kernel's core community is tiny—as is FFmpeg's (10–15 active maintainers)—and those few people must maintain every line of code forever. "We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code." Kunhya adds that terseness is often simply fatigue: volunteers arrive home after a full day of work and review patches without the bandwidth to hand-hold. Kempf also points out that most community members are non-native English speakers, and cultural misreadings amplify perceived hostility. > *"We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code."* — Jean-Baptiste Kempf ## [55:46] Turning down millions to keep VLC ad-free Kempf traces VLC's unlikely origin: a French engineering school (École Centrale Paris) whose student-run campus built a satellite video-streaming system in 1995—a decade before YouTube—just to enable faster networks for video games. From that Network 2000 project grew VideoLAN, and VLC emerged as its client. Kempf joined in 2003 when the project had nearly died, grew it from hundreds of thousands to billions of installs, and along the way repeatedly refused "obscene" offers to bundle toolbars, change search engines, or insert advertisements. His reasoning: "I need to go to bed at night and be happy about what I've done. If I had sold out, I would have betrayed so many other people who work here." > *"I refuse dozens of millions of dollars, yes, several times. Yes, I could be a multimillionaire and be somewhere on the beach. But I did not do it because I thought it was not moral and it was not the right thing to do."* — Jean-Baptiste Kempf ## [70:04] FFmpeg & Google drama Kunhya recounts a public controversy in which Google's security team used AI to auto-generate bug reports for FFmpeg, filing them under tight 90-day deadlines—with some vulnerability reports going to the press before patches could be written—without contributing corresponding fixes or meaningful funding. Kunhya compares it to "a denial of service by AI-generated bug reports" on obscure 1990s game codecs. The saga escalated via spicy FFmpeg tweets (a "rap battle" in Kunhya's words), but produced concrete results: Google began sending patches and established a financial reward system for fixes. A parallel incident saw Microsoft Teams engineers file a high-priority bug on the volunteer tracker, name-dropping their product's scale, and offering a one-time payment of a few thousand dollars in response to a request for a long-term support contract. > *"Google uses FFmpeg at a scale probably you or I couldn't even contemplate—millions of CPU cores. And yes, they contribute in areas mostly regarding their own products. But in a wider sense, there's a disproportionate level of contribution."* — Kieran Kunhya ## [89:18] FFmpeg developers What motivates FFmpeg's volunteer engineers? Kempf identifies three drivers: passion for the subject matter (many contributors arrived because they loved anime), excellence of the craft ("this is the best school ever of programming"), and pride in impact ("you can tell your grandma: I do this so you can play video on your laptop"). Kunhya adds that Andrew Kelley, creator of the Zig programming language, was an FFmpeg developer who credits his time there as his real-world education. Teenagers have written thousands of lines of hand-optimized assembly for FFmpeg. Kieran's favorite quote, from John Collison: "The world is a museum of passion projects." > *"If you're good in C, if you know how to write assembly in FFmpeg, I assure you you're going to be one of the best programmers ever—even if you're working on writing TypeScript."* — Jean-Baptiste Kempf ## [95:55] VLC and FFmpeg Kunhya frames the FFmpeg-VLC relationship as a "binary star system": VLC is to FFmpeg as Android is to Linux—they depend on each other and succeed because of each other. Roughly 80% of FFmpeg pipelines depend on at least one VideoLAN project (most often x264). VLC gives FFmpeg exposure to a vast zoo of real-world broken files. When compiled for Windows, VLC links against about 16 million lines of code, of which only 1 million live in the VLC repository itself. The two projects share many developers and collectively demonstrate that complex software ecosystems can be built entirely from interdependent open-source components. > *"VLC is to FFmpeg as Android is to Linux. They depend on each other, but they coexist because of each other."* — Kieran Kunhya ## [100:29] History of FFmpeg The "eras tour" of FFmpeg begins with Fabrice Bellard creating the initial concept, followed by the Michael Niedermayer era of the early 2000s—exhaustive support for DivX, Xvid, Windows Media, and RealMedia, eliminating the need for bloated, spyware-ridden codec packs. The late 2000s brought H.264 maturity and the rise of high-definition video. Throughout, VLC served as FFmpeg's field test: millions of users exposing edge cases that no lab could anticipate. > *"At the time you needed a new player to play every different type of file format. Having a single library that was fast and open source—that was a massive achievement."* — Kieran Kunhya ## [103:46] Reverse engineering codecs The segment showcases the art of reverse engineering proprietary codecs. Kostya Shishkov—described as "borderline genius"—reverse-engineered 20–30 megabyte binary blobs (each megabyte representing roughly a month of normal work) for fun, producing decoders for Windows Media, RealMedia, and GoToMeeting formats. Kunhya explains the methodology: hook into the proprietary player to dump raw YUV data, open a disassembler, step through machine code instruction by instruction to infer the entropy coding, prediction, and IDCT stages, then validate bit-exactness against sample files. For months, the work produces no visible output—pure debugging in memory. > *"He looked at the world as a binary specification. He didn't need documentation or anything. He would go away and come back and do interesting stuff."* — Kieran Kunhya ## [117:01] FFmpeg testing FFmpeg's FATE (FFmpeg Automated Testing Environment) system runs a pivot table of test combinations: dozens of compilers (GCC, Clang, MSVC, Apple Clang, Intel Compiler), operating systems (Linux, macOS, Windows, BSD, Solaris), and CPU architectures (x86, ARM, RISC-V, PowerPC). All test machines are volunteer-hosted. The system catches compiler miscompilations—rare but devastating, since even a single wrong bit in a frame dependency chain can cascade into major visual corruption. Kunhya notes that the Macs at the top of the FATE dashboard are hosted in his own office. > *"It's not just a matrix at this point. It's like a pivot table of different combinations—all run by volunteers."* — Kieran Kunhya ## [121:08] Assembly code (handwritten) This extended chapter is the technical heart of the episode. Handwritten x86/ARM SIMD assembly in FFmpeg and x264 runs up to 62 times faster than equivalent C—a gap that modern compilers and auto-vectorization cannot close despite years of trying. VLC still supports Windows XP through Windows 11, macOS 10.7 through macOS 26, iOS 9 through the latest, BSD, Solaris, and even OS/2. Understanding assembly forces programmers to internalize CPU pipeline stages, SIMD registers, L1/L2/L3 cache, and memory bus constraints. Kempf and Kunhya introduce the x86inc framework built by Loren Merritt for x264 and JB's Assembly Lessons tutorial series, which have attracted contributions from teenagers learning directly from the source. > *"I believe it's necessary to understand assembly language, even if you don't do it much, to understand what's going on inside your computer. That will make you a better programmer."* — Jean-Baptiste Kempf ## [145:26] Rust programming language Kempf and Kunhya hold divergent opinions on Rust. Kunhya respects the memory-safety goal but finds the community self-important—"It has a very big Esperanto vibe"—and argues that Rust rewrites reaching only 85–90% of required feature coverage are insufficient; "the last 1% takes 99% of the time." Kempf has written Rust VLC modules and sees genuine value, but notes that the lack of training data for low-level SIMD work means AI tools cannot yet assist meaningfully. The discussion broadens to the two assembly wizards of the community: Henrik Gramner, whose knowledge of Intel x86 cycle counts exceeds Intel's own engineers, and Martin Storsjö, who writes ARM Neon assembly on a virtual keyboard while watching his kids play in the playground. > *"Rust reminds me of the Sinclair C5. In order to get people to move, you have to build something as good as, if not better than, what you have now."* — Kieran Kunhya ## [154:42] FFmpeg and Libav fork In 2011, FFmpeg split into FFmpeg and Libav, primarily over governance and leadership style rather than technical disagreements. Several Linux distributions temporarily shipped Libav instead of FFmpeg. Kempf describes open-source forks as healthy—they force projects to confront structural weaknesses. Eventually most of Libav's developers returned to FFmpeg, and the projects merged back. Kempf draws a parallel to the XZ Utils attack, where a lone maintainer, exhausted by coordinated social engineering, granted commit access to an attacker—highlighting how burnout creates the very single-point-of-failure vulnerabilities that make critical open-source infrastructure fragile. > *"Forks are important because they change the status quo of a community. FFmpeg today is better than it was before the fork."* — Jean-Baptiste Kempf ## [163:04] Open source burnout Kempf and Kunhya confront the mental health crisis among open-source maintainers. Kempf has received physical death threats—including a letter containing powder—over decisions such as dropping PowerPC support. The security community's habit of filing alarming CVEs for hobby-project edge cases adds psychological load without providing patches. Kempf now maintains several libraries whose original maintainers burned out. The conversation broadens to the systemic problem: critical infrastructure like libxml and XZ is maintained by one or two people, unknown to the trillion-dollar enterprises that depend on them. > *"The mental health of the open source maintainers is something that large corporations don't care or don't see."* — Jean-Baptiste Kempf ## [170:51] x264 and internet video H.264 transformed internet video by arriving exactly when Intel Core 2/Nehalem CPUs made real-time software decoding practical. The key innovation of x264 was psychovisual rate-distortion optimization—encoding decisions driven by visual quality metrics rather than mean squared error, producing sharper, more natural-looking video. This was driven by the anime community's high standards for perceived sharpness. AV1 offers 40–60% bandwidth savings over H.264 at the same quality, but encoding costs two orders of magnitude more CPU. YouTube therefore re-encodes only popular videos in AV1, making the extra compute worthwhile by amortizing it over millions of viewers. > *"Thirty percent of the video from Netflix is now in AV1, fifty percent of YouTube."* — Jean-Baptiste Kempf ## [184:07] Video compression basics The chapter clarifies I/P/B frame structure: I-frames are complete still images, P-frames reference only previous frames, and B-frames can reference both past and future frames. ProRes is an intra-only codec designed for nonlinear editing—no temporal dependencies, fast seeking. The segment also covers constant-bitrate versus constant-quality encoding, group-of-pictures length, and the thousands of engineers at Netflix, YouTube, and Meta whose entire job is tuning FFmpeg parameters for specific content types. A historical curiosity: Google Video originally used VLC as an ActiveX plugin inside Internet Explorer; today VLC is compiled to WebAssembly to run inside browser JavaScript engines. > *"You have I-frames that are complete frames, P-frames that depend only on I-frames, and B-frames that can depend on frames in front."* — Jean-Baptiste Kempf ## [191:04] CIA and fake VLC WikiLeaks' Vault 7 release revealed that the CIA built a modified version of VLC with an additional DLL (psapi.dll) that silently encrypted and exfiltrated documents while the victim watched a movie, using the expected high CPU load of video playback as cover. VideoLAN issued a press release directing users to download only from the official website. A separate incident involved Chinese state hackers distributing a fake VLC using legitimate signed VideoLAN DLLs to target Indian users, causing India to ban VLC until Kempf fought a successful legal battle to reverse the ban. The segment also surfaces a hidden feature: VLC can render movies as ASCII art in a terminal, useful for diagnosing multicast network paths via SSH. > *"If we had to compromise our software, we would shut it down. This is clear."* — Jean-Baptiste Kempf ## [201:39] Ultra low latency streaming Kempf explains adaptive streaming (HLS, DASH): the player downloads segments, times the download, and adjusts quality tier accordingly. The real engineering frontier is live broadcasting with strict CBR constraints—satellite uplinks cannot burst even for one second. Kempf describes his company Kyber, an open-source (AGPL dual-licensed) ultra-low-latency streaming stack targeting robotics and XR, streaming compressed video feeds to devices without onboard compute. The segment ends with a discussion of teleop for robots, where latency directly determines safety. > *"Kyber is open source. Everything on Kyber is open source. If you want to use it in your product and not open source it, you pay the commercial license."* — Jean-Baptiste Kempf ## [219:07] AV2 codec and video patents AV2, the successor to AV1 within the Alliance for Open Media (of which VideoLAN is a member), promises a further 30% bandwidth reduction. VideoLAN's dav1d decoder will be followed by "dav2d." The Alliance exists specifically to escape the HEVC/H.265 patent thicket: HEVC's three separate patent pools demanded fees so large that HP removed HEVC support from new laptops, and streaming giants calculated they could build a new royalty-free codec for less than the annual licensing cost. France's rejection of software patents means Kempf has never paid codec licensing fees—if he had to, the bill would exceed 200 euros per user. > *"At a hundred million per year, you know, I could create my own codec—and this is what they did."* — Jean-Baptiste Kempf ## [228:59] VLC backdoors Intelligence agencies from two different countries approached Kempf asking him to insert backdoors into VLC. He declined both, in terms he describes as "a lot less polite" than a simple no. The chapter broadens into a discussion of European entrepreneurship: Kempf argues that French startup culture has transformed over 15 years—failure stigma has fallen, AI companies are proliferating—while acknowledging that over-regulation remains a real drag. He closes by reflecting on his strategy for remaining calm under legal and political pressure: always ask "am I dying? Am I hurting someone?" If not, move on. > *"If we had to compromise our software, we would shut it down. Also because what we do is good and it's done for everyone."* — Jean-Baptiste Kempf ## [239:14] Video archiving Kieran profiles the archiving preservation community, led in part by Dave Rice of CUNY, which relies on FFmpeg as a "Rosetta Stone" for playing future-proof multimedia. The community funded FFV1, FFmpeg's lossless codec, to guarantee that archived footage loses no information—critical because lossy compression could destroy forensic or historical details visible only on close inspection. A famous cautionary tale: the BBC's 1986 New Domesday Book project archived content on BBC Micros, and within 20 years no one had working software to read it. There are now more historical video tapes in archives than functional tape heads in the world to digitize them, forcing painful triage decisions about what human history to preserve. > *"C will be like Latin. It will be a thing you learn from the past, but it will still be usable in certain contexts."* — Kieran Kunhya ## [245:51] Future of FFmpeg and VLC The closing chapter surveys where multimedia is heading: volumetric video, point-cloud codecs for robotics, RGBD depth streams, XR/VR streaming, and—speculatively—neural interfaces that may one day require codecs for compressed brain data. Kempf is confident FFmpeg will exist in 100 years; VLC he rates as "maybe." He closes with his personal philosophy: "Regrets are a tax on your mind. Learn from your mistakes, but don't regret." The episode ends with Lex reading Linus Torvalds: "Most good programmers do programming not because they expect to get paid or get adulation by the public, but because it is fun to program." > *"Regrets are a tax on your mind. Learn from your mistakes, but don't regret. Because you've done it, so unless you have a time machine, don't regret."* — Jean-Baptiste Kempf ## Entities - **Jean-Baptiste Kempf** (Person): President of VideoLAN, primary maintainer of VLC, founder of Kyber and several other companies; declined tens of millions of dollars to keep VLC ad-free. - **Kieran Kunhya** (Person): Veteran FFmpeg contributor, codec engineer, founder of Open Broadcast Systems, the voice behind the FFmpeg account on X. - **Lex Fridman** (Person): Host of the Lex Fridman Podcast, AI researcher, longtime VLC and FFmpeg advocate. - **Fabrice Bellard** (Person): Creator of FFmpeg, QEMU, and tcc; foundational figure of the project. - **Michael Niedermayer** (Person): Long-time FFmpeg maintainer who drove exhaustive codec support through the 2000s. - **Kostya Shishkov** (Person): Legendary FFmpeg reverse engineer who decoded proprietary binary blobs for Windows Media, RealMedia, and GoToMeeting codecs. - **Henrik Gramner** (Person): Assembly wizard with deeper knowledge of Intel x86 cycle counts than Intel's own engineers. - **Linus Torvalds** (Person): Creator of Linux and Git; referenced as a model of uncompromising code quality standards in open-source communities. - **FFmpeg** (Software): Open-source multimedia framework providing codecs, muxers, filters, and command-line tools; the invisible backbone of nearly all internet video. - **VLC** (Software): Open-source media player with 6.5+ billion downloads, built on libVLC and FFmpeg; plays virtually any format on any platform. - **x264** (Software): VideoLAN's open-source H.264 encoder; the dominant software encoder for internet video, famous for psychovisual optimizations. - **dav1d** (Software): VideoLAN's fast open-source AV1 decoder; widely deployed in browsers and streaming clients. - **VideoLAN** (Organization): French nonprofit that stewards VLC, x264, dav1d, and related open-source multimedia libraries. - **Alliance for Open Media** (Organization): Industry consortium including Google, Netflix, Apple, Amazon, and VideoLAN that created AV1 and is developing AV2 as royalty-free codec standards. - **FATE** (Software): FFmpeg Automated Testing Environment; volunteer-hosted CI grid testing hundreds of compiler/OS/architecture combinations. - **Kyber** (Organization): JB Kempf's startup building an ultra-low-latency open-source streaming stack for robotics and XR, dual-licensed AGPL/commercial. - **H.264 / AVC** (Concept): The dominant internet video codec standard; open-source implementation is x264; basis of Blu-ray and most MP4 files. - **AV1 / AV2** (Concept): Royalty-free next-generation video codec standards from the Alliance for Open Media; AV1 saves 40-60% bandwidth vs H.264; AV2 adds another 30%.
¿Qué es Claude Code?
La guía oficial de Anthropic sobre Claude Code — qué es, cómo se diferencia de Claude.ai y las tres cosas que debes saber antes de dejar que un LLM ejecute comandos en tu base de código. Dirigido a desarrolladores que están a punto de instalar la herramienta de terminal por primera vez. ## [00:04] Qué es Claude Code y dónde se ejecuta Claude Code se posiciona como una herramienta de codificación agéntica: comprende tu base de código, edita archivos, ejecuta comandos y se integra con las herramientas de desarrollo que ya usas. Funciona en varias superficies — terminal, VS Code, JetBrains IDE, la aplicación de escritorio Claude y la web — pero esta guía se centra en el terminal como experiencia canónica. > *Claude Code is an agentic coding tool that understands your code base, edits your files, run commands, and integrates with your existing developer tools to help you get things done faster.* ## [00:34] En qué se diferencia de Claude.ai La distinción clave no es la capacidad del modelo sino el acceso: Claude Code llega directamente a tu terminal y a toda tu base de código, por lo que el ciclo de copiar y pegar en el chat desaparece — la herramienta hace el trabajo en su lugar. Llamarlo "agente de IA" es una forma abreviada de describir esa superficie de ejecución directa. > *Unlike Claude AI, Claude Code has direct access to your files in your terminal and your entire code base.* ## [00:51] Los agentes de IA y qué puede hacer Claude Code Un agente de IA aquí significa software que interactúa con su entorno y toma acciones para alcanzar un objetivo definido — en su forma más básica, un LLM en un bucle en tiempo real con acceso a herramientas, servicios externos y otros agentes. Para Claude Code, esto se traduce en capacidades concretas: leer y explicar tu base de código, rastrear bugs a través de archivos, ejecutar scripts de compilación y pruebas, instalar paquetes, y obtener la documentación de API más reciente de la web para decidir qué hacer a continuación. > *An AI agent is a software that can interact with its environment and perform actions to complete a defined goal.* ## [01:45] Tres conceptos que debes conocer antes de empezar El narrador señala tres propiedades que condicionan el uso diario. Primero, la **ventana de contexto** es la memoria de trabajo de Claude — amplia pero finita — por eso el agente debe navegar estratégicamente por una base de código en lugar de cargarla completa. Segundo, Claude Code **pide permiso** antes de ejecutar comandos o modificar archivos; mantienes el control tanto si quieres supervisar cada paso como si prefieres dejarlo funcionar de forma más autónoma. Tercero, **puede equivocarse**: malinterpretar la intención, introducir bugs o sobre-diseñar una solución. Trata los resultados como lo harías con los de cualquier herramienta, no como verdades absolutas. > *By default, Claude Code will ask you before running commands or making changes to your code base.* ## [02:34] Resumen Claude Code es una herramienta de codificación agéntica que lee tu base de código, edita archivos, ejecuta comandos y se conecta a herramientas externas para ayudarte a entregar más rápido — disponible hoy en terminal, VS Code, JetBrains y la aplicación de escritorio Claude. > *Claude Code is an agentic coding tool. It reads your code base, edits your files, runs commands, and connects to external tools to help you ship faster.* ## Entidades - **Anthropic Tutorial Narrator** (Person): El narrador oficial de Anthropic para la serie de tutoriales Claude Code 101. - **Claude Code** (Software): El asistente de codificación agéntico de Anthropic basado en terminal, que opera directamente sobre tu base de código. - **Claude.ai** (Software): El producto Claude basado en chat — en contraste con la ejecución en entorno de Claude Code. - **AI agent** (Concept): Un LLM que funciona en un bucle en tiempo real con acceso a herramientas, servicios externos y otros agentes para perseguir un objetivo definido. - **Context window** (Concept): La memoria de trabajo de Claude — finita, por eso el agente navega estratégicamente en lugar de cargar toda la base de código. - **VS Code / JetBrains IDEs** (Software): Integraciones de editores en las que Claude Code está disponible, junto con el terminal y la aplicación de escritorio Claude.

🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI
Alex Lupsasca — 2024 New Horizons Breakthrough Prize winner and OpenAI resident scientist — recounts how GPT-5 resolved a year-long open problem in quantum field theory: proving that single-minus gluon tree amplitudes are non-zero and finding their compact closed form. He then describes how the publicly available GPT Pro, given the gluon paper as a seed, independently generalized the result to graviton amplitudes in under three days of human clock time. Throughout the conversation, Lupsasca reflects on what this trajectory means for how physics is done, how the next generation of physicists will be trained, and where the remaining bottlenecks — verification, creativity, and publishing infrastructure — still lie. ## [00:00] Introduction to AI's impact on physics research Lupsasca opens in medias res, framing the episode's central claim before the formal introduction: AI has crossed a threshold where it can resolve questions that stumped human experts for over a year. He describes this not as a curiosity for theoretical physicists but as a profound, if underappreciated, change in the nature of scientific discovery itself. > *"That's a certain milestone that we've passed, and I think maybe for the average person on the street who doesn't care about theoretical physics, this is not very noticeable, but I think it's a very profound change and we've really passed some kind of a threshold."* ## [00:43] Guest introduction: Alex Luposka The hosts — Brandon (Atomic AI) and RJ Honicky (Miro Omix) — introduce Lupsasca as a Vanderbilt professor and OpenAI fellow who holds both the 2024 New Horizons in Physics Breakthrough Prize (often called the "Oscars for science") and the IUPAP Young Scientist Award. Lupsasca immediately sets the narrative arc: a year ago, AI was useful for email but not for his work; ChatGPT o3 was the first model that genuinely helped with research math; then GPT-5 reproduced one of his hardest published results in 30 minutes. > *"When GPT-5 came out it was able to reproduce one of my best papers that took me a very long time to come up with in like 30 minutes. And that's when I really became AI pilled."* ## [02:49] Alex joining OpenAI and the shift in physics research After GPT-5's release, Lupsasca began evangelizing the shift to colleagues who were skeptical. Finding OpenAI equally excited, and being on sabbatical, he joined as resident scientist — the person physicists around the world now email when something astonishing happens. He describes receiving an inbound that week about Codex simulating the Sachdev-Ye-Kitaev (SYK) model in 10 minutes, a feat that many research groups had struggled to achieve due to the narrow Venn diagram of physicists with strong coding skills. > *"I talked to OpenAI. They were also really excited and I thought I have to get in on this and to understand that this is happening and not be a part of it is a huge mistake so I have to go to OpenAI."* ## [04:08] The release of GPT-5 and the shift in capabilities Lupsasca contrasts the lukewarm Twitter reception of GPT-5 (complaints that it was not better at writing email) with what he observed at the science frontier. He notes GPT-5.4 is another significant jump, and describes how AI capabilities for physics have been accelerating rapidly since o3, the first reasoning model strong enough for research-grade mathematics. He uses this as a bridge to the central technical story of the episode: a pair of new papers on gluon and graviton scattering amplitudes. > *"At the science frontier the capabilities were really taking off."* ## [10:05] Explaining Quantum Field Theory and amplitude calculations Lupsasca gives an accessible primer on quantum field theory (QFT), the framework that reconciles special relativity and quantum mechanics. The key objects in QFT are scattering amplitudes — complex-valued functions that encode the quantum probability for a set of incoming particles (with given energies, momenta, and polarizations) to scatter into a set of outgoing particles. These amplitudes are computed at particle colliders like the LHC, and knowing the n-point amplitude (for any number n of particles) encodes essentially the full content of the theory. > *"If you have a particular force and you're able to compute the n-point amplitudes... you know everything about the theory."* ## [14:20] Overview of gluons and the strong force Gluons are the force-carrying particles of the strong nuclear force — the force that, despite like-charge repulsion between protons, holds the atomic nucleus together. They are the QFT analog of photons for electromagnetism and gravitons for gravity. Like photons, gluons carry a polarization (helicity): positive (right-handed) or negative (left-handed). This helicity structure is central to the paper discussed next. > *"The strong force is mediated by the exchange of the particles of the strong force, which are called gluons, because they're what glues together the nucleus of the atom."* ## [14:38] Discussing the first research paper on single-minus gluon tree amplitudes Lupsasca unpacks the paper's title — "Single-Minus Gluon Tree Amplitudes Are Non-Zero" — piece by piece. Tree amplitudes are the leading-order (no-loop) contributions to scattering. All-plus-helicity amplitudes are exactly zero by a symmetry argument. Single-minus amplitudes — where all but one gluon have positive helicity — were assumed in textbooks to also be zero by the same argument. The paper proves they are not. The result involves collaboration with Alfredo Guevara (IAS), David Skinner (Cambridge), Andrew Strominger (Harvard), and Kevin Wheel. > *"If you look at the lecture notes and textbooks that have been written on this, the same argument that rules out the all-plus amplitudes also appears to rule out the single-minus amplitudes."* ## [20:56] How ChatGPT helped solve a year-long physics puzzle Strominger, Guevara, and Skinner had understood for about a year that the textbook argument has a loophole: when particles are collinear (exactly aligned in momentum), the standard dimensional-analysis reasoning fails, and single-minus amplitudes can be non-zero. But computing what those non-zero amplitudes equal had eluded them. Lupsasca invited Strominger to visit OpenAI and work on it with AI. The week before Strominger's flight, Lupsasca began using ChatGPT Pro. By the time Strominger landed, they had the answer. > *"Using ChatGPT we solved the problem before he even got off the plane."* ## [23:02] Complexity of manual calculations in physics Lupsasca shows the audience a concrete illustration of the difficulty: the six-point single-minus amplitude, worked out by hand by Alfredo Guevara, is a sum of 32 terms each of which is itself a product of four complicated factors. The number of terms grows factorially with the number of particles n — super-exponential growth. This is the messy representation that the group had been staring at for a year, seeking the analog of the elegant Parke-Taylor formula. > *"By the time you get to six terms, it explodes in your face."* ## [26:12] The history and mechanics of Feynman diagrams Feynman diagrams are a visual language introduced by Richard Feynman to organize perturbative QFT calculations: diagrams represent possible intermediate histories of a scattering process, and the full amplitude is a sum over all of them. Diagrams are organized by number of vertices (interaction points); each additional vertex is suppressed by the coupling constant, so tree diagrams (fewest vertices) dominate. Loop diagrams — where intermediate particles are created and annihilated — contribute smaller corrections. The combinatorial explosion of tree diagrams is the root cause of factorial growth. > *"In principle, there are infinitely many pictures to sum over."* ## [27:44] The Parke-Taylor formula and the quest for simplification In the 1980s, Parke and Taylor computed the "maximally helicity violating" (MHV, or double-minus) gluon amplitudes through a heroic Feynman diagram expansion. Despite the factorial number of terms, everything canceled to leave a single compact formula — the Parke-Taylor formula — that fits in half a line. Strominger, Guevara, and Skinner spent a year looking for the analogous compact formula for the single-minus case. Their search stalled at the level of the messy Feynman representation. > *"Andy, Alfredo and David spent the last year chasing the analog of the Parke-Taylor formula, the very simple answer that was obtained in the '80s for the double minus amplitudes."* ## [31:26] Using ChatGPT to find the simplification in the special phase space region When the five-point single-minus amplitude was fed to ChatGPT Pro, the model identified a special subregion of phase space (where one particle's frequency has opposite sign) in which the amplitude simplifies from eight terms to a product of just three. This appears not to have been a known fact; the model wrote Python code and tested thousands of possibilities to deduce it. Moving to the six-point amplitude (Guevara's hand calculation), ChatGPT simplified 32 terms to a product of 4. It then conjectured the general n-point formula — with only linear growth in the number of terms, the best possible behavior. GPT-5.2 Pro guessed the formula but could not prove it. > *"The formula that it proposed, instead of having this factorial growth... here it's actually linear. So if you double the number of particles, you only double the number of terms."* ## [38:07] Proving the formula from scratch to ensure validity To obtain a proof, Lupsasca used an internal OpenAI model with extended reasoning. He gave it the problem cold — without the conjectured formula — and asked it to find the general answer in the special phase-space region. After 12 hours of computation, the model independently rediscovered the same formula and produced a complete three-step proof. The proof constitutes the bulk of the published paper. The team kept the AI attribution to one paragraph, framing the paper as a physics result that stands on its own merits. > *"We gave it the whole problem from scratch... and it came back with the same formula which we had not given it. So it rediscovered the correct formula. But this time it also found the proof."* ## [41:00] Determining the scientific impact and future research Asked to compare the result to the Parke-Taylor formula, Lupsasca is candid that scientific impact is only assessable decades later, but argues the result is genuinely surprising and should open a line of attack toward deeper questions in quantum gravity. The conversation pivots naturally to the second paper. > *"I think the true value of a paper can only be assessed decades into the future based on how much future work it leads to and what developments it opens up."* ## [42:27] Introduction to the second paper on graviton amplitudes Gravitons are the hypothetical quanta of gravity — the spin-2 force carrier analogous to the spin-1 photon (electromagnetism) and gluon (strong force). Unlike gluons, gravitons have never been directly detected, but they are central to quantum gravity theory. The second paper, "Single-Minus Graviton Tree Amplitudes Are Non-Zero," shows the same loophole applies to gravity and that a compact formula extends there too — despite gravitons being mathematically more complex than gluons. > *"We wrote this paper which is called single minus graviton tree amplitudes are non-zero. So it's the same title almost, except with graviton instead of gluon."* ## [45:41] Defining particles, irreducible representations, and symmetry Lupsasca sketches the modern QFT definition of a particle (an irreducible representation of the Poincaré group, classified by Wigner according to mass, spin, and charge) and explains why gravitons are spin-2 while gluons and photons are spin-1, making graviton polarization data twice as rich. Crucially, the second paper was complete within three days of the first going public — most elapsed time was spent verifying correctness, not computing. > *"Most of the time was spent verifying the answer, not writing, which is insane, actually, if you take a step back."* ## [47:46] How GPT Pro generalized the research to gravity For the graviton paper, no internal model was needed — the publicly available ChatGPT GPT-5.2 Pro sufficed. Lupsasca provided the gluon paper as context plus two paragraphs describing the key mathematical changes, then said "Good luck. You're a brilliant theoretical physicist." Over a 110-page exchange, the model worked through the graviton calculation — applying the directed matrix tree theorem, a piece of known combinatorics that neither Lupsasca nor collaborators had thought to invoke — produced correct intermediate results, and wrote a draft paper very close to the final arXiv version from section 3 onward. > *"It's a real solid result in quantum gravity that was done pretty much completely by an AI with human steering it and asking kind of the right questions."* ## [53:57] The epistemological shift: Is this a new way of doing physics? The hosts raise the central epistemological question: if an undergraduate with domain knowledge and good prompting could have done this, what does graduate training mean now? Lupsasca agrees this is the hardest open question facing academia. He notes that arduous calculation trains not just skill but self-confidence, that the gap between coursework and the research frontier is growing, and that many "easy" problems professors once assigned to students are now solvable by AI in minutes. He offers two concrete ways AI has already changed his own workflow: dramatically reducing time spent confused between steps, and enabling parallel AI scouts that explore multiple research directions simultaneously. > *"With AI, actually, you can launch 10 instances of chat and have each one try a different route and send it as a scout that moves very fast into the unknown."* ## [59:27] The use of AI as a 'scout' for research directions Lupsasca elaborates on the scout metaphor: rather than carefully mapping a route from A to C before committing to it, a researcher can now dispatch many AI "scouts" in parallel, get rapid feedback on which directions are promising, and redirect human attention accordingly. Even when a scout makes errors, its signposts reduce orientation cost for the human following. This constitutes a qualitatively new mode of research — one where the bottleneck shifts from calculation to judgment about which directions matter. > *"Even if ChatGPT doesn't always get everything right, just kind of having a scout that signposts some key steps along the way that you can use to anchor your own movement is extremely helpful."* ## [61:44] The role of 'taste' and collaboration with AI The hosts push on the problem of "taste" — the ability to identify which questions are at the productive edge of knowledge. Lupsasca argues that working effectively with ChatGPT requires the same skill a professor develops advising students: knowing what question to give, at what level of detail. "Taste" — knowing where the frontier is and which questions there are tractable — is the last skill to develop and the one AI currently lacks. AI is, he says, like an extremely technically skilled graduate student: given a sharp, well-posed question, it can do incredibly hard computations correctly, but it does not yet know which question to ask. > *"The difference between a good physicist and a great physicist is knowing what is the right question to ask — that is actually the hardest part of being a scientist."* ## [70:23] Personal evolution from AI skeptic to resident scientist Lupsasca recapitulates his personal arc: skeptic → converted by o3 (which solved in 11 minutes a calculation that would have taken him days) → "AI-pilled" by GPT-5 (which reproduced, in 30 minutes, his best published result on black hole Love numbers and tidal symmetries — a paper whose training cutoff predated its arXiv release) → now resident scientist at OpenAI. He notes that no competing model at the time could match GPT Pro on that calculation. > *"In under 30 minutes, with one hint... it completely solved this problem, which is one of the nicest calculations that I've ever done."* ## [72:46] Solving a black hole perturbation problem with GPT-5 Lupsasca details the "Move 37" moment that converted him: his paper "Why Is There No Love in Black Holes?" establishes new symmetry generators for perturbations of a Kerr black hole (explaining why black hole Love numbers — tidal response coefficients, named after mathematician Augustus Love — are exactly zero). When GPT-5 Pro was first given the full problem cold, it failed. But after being primed with the simpler flat-space warm-up (a 200-year-old known result), it then solved the full Kerr black hole problem in 18 minutes. > *"GPT-5 was able to reproduce one of my hardest calculations, which I think the number of people in the world that could do that you could count on your hands."* ## [76:34] Discussing whether AI can make original, conceptual leaps The hosts ask whether AI is doing genuine recombination versus true creative leaps. Lupsasca cites Terry Tao, who has not yet seen an AI proof that cannot be traced to an obscure reference. But Lupsasca has been impressed and frames the distinction as one of degree rather than kind — humans may also be recombination machines. He believes continued scaling will produce feats of insight that look like creativity, and notes OpenAI is actively working on enabling models to take bigger, more out-of-distribution leaps suited to scientific discovery. > *"I'm not sure there's a qualitative difference. I think it's just a matter of degree — as we continue scaling the capabilities, I don't see why it's going to stop."* ## [80:09] Challenges of 'AI slop' and the future of academic publishing With models now capable of turning out a physics paper in 30 minutes when properly steered, the arXiv preprint server is being flooded with submissions. Lupsasca distinguishes legitimate use (expert steering + careful verification) from "AI slop" — poorly prompted outputs submitted without adequate checking. His proposed response: raise the bar rather than increase volume. The single-minus amplitude papers open a clear line of attack toward genuine quantum gravity questions; the goal should be to pursue harder problems, not to publish incrementally. > *"Instead, I think now that we have this new tool that gives us AI superpowers, I think we should just raise the bar for what it means to write a good paper."* ## [83:13] The bottleneck of writing academic papers Asked what single bottleneck he would remove, Lupsasca nominates the paper-writing process itself — finding it increasingly strange that researchers use AI to do calculations, compress results into a static paper, and then readers feed that paper back into AI to understand it. He envisions interactive, LLM-embedded papers as a plausible future. He also identifies two missing capabilities in current models: (1) the spark of creativity to identify the next important question, and (2) reliable self-verification, so that the onus of checking long AI-generated proofs does not fall entirely on humans. > *"Maybe some kind of interactive paper which lives in some LLM. Maybe your whole paper is some ChatGPT page... I think we're going to head in that direction."* ## [90:19] Final takeaways and looking ahead to the next year Lupsasca's closing message: pay attention. The trajectory from "useful for email" to "solves open problems in quantum gravity" has taken roughly 18 months. Models are solving open problems that expert communities spent years on. Extrapolating forward, with more scaling already in the pipeline, the next 6 to 12 months should bring further surprises. The right posture is excitement, careful verification, and a commitment to pursuing harder problems. > *"If you just extrapolate that into the future, imagine where we're going to be in 6 months or a year — I think it's kind of surreal to live through this time, but it's really happening."* ## Entities - **Alex Lupsasca** (Person): Theoretical physicist, Vanderbilt University professor and OpenAI resident scientist; 2024 New Horizons Breakthrough Prize and IUPAP Young Scientist Award winner; expert in black hole physics and scattering amplitudes. - **Andrew Strominger** (Person): Harvard professor and Lupsasca's former PhD advisor; pioneer of celestial holography; co-author of both single-minus amplitude papers. - **Alfredo Guevara** (Person): Postdoctoral researcher at the Institute for Advanced Study (IAS); performed the foundational hand calculations underpinning the AI-assisted breakthrough. - **David Skinner** (Person): Professor at Cambridge University; co-author of the single-minus gluon amplitude paper. - **Terry Tao** (Person): Fields Medal-winning mathematician at UCLA; referenced regarding the question of whether AI proofs involve genuine creativity. - **Scattering Amplitudes** (Concept): Complex-valued functions in quantum field theory encoding probabilities for particles to scatter; the central mathematical objects of both papers discussed. - **Single-Minus Gluon/Graviton Amplitudes** (Concept): Tree-level scattering amplitudes where all but one particle have positive helicity; previously assumed zero in textbooks but shown non-zero in a collinear phase-space region. - **Parke-Taylor Formula** (Concept): Compact closed-form result for maximally helicity violating (MHV, double-minus) gluon amplitudes derived in the 1980s; the template whose analog was sought for single-minus amplitudes. - **Feynman Diagrams** (Concept): Diagrammatic technique to organize perturbative QFT calculations; individual diagrams represent distinct intermediate-particle histories whose amplitudes are summed. - **Love Numbers** (Concept): Coefficients encoding tidal deformability; famously vanish for black holes, a fact connected to hidden symmetries studied in Lupsasca's "Why Is There No Love in Black Holes?" paper. - **Celestial Holography** (Concept): Research program exploring symmetries of quantum gravity via scattering amplitude structure; motivates studying graviton amplitudes. - **OpenAI** (Organization): AI research company where Lupsasca serves as resident scientist; developer of GPT-5 and the internal extended-reasoning model used for the amplitude proof. - **arXiv** (Organization): Open-access physics and mathematics preprint server; mentioned in the context of AI-generated "slop" flooding submissions. - **GPT-5 / ChatGPT Pro** (Software): OpenAI's frontier language model used as the primary AI tool in both amplitude papers; capable of extended reasoning steps of 20-34 minutes per prompt.

Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!
NYU Stern professor and serial entrepreneur Scott Galloway delivers a two-hour reality check on artificial intelligence: the doom-and-gloom predictions from AI CEOs are largely fundraising theatre, yet the technology poses a genuinely insidious risk that almost nobody is discussing — an epidemic of loneliness. Galloway argues that AI primarily benefits the already-wealthy, that tech leaders should not be trusted to self-regulate, and that the most valuable human skill in the AI era is not coding or Mandarin — it is the ability to endure rejection. The conversation weaves through geopolitics, investing, the masculinity crisis, and what it means to find purpose, closing with a raw reflection on grief and fatherhood. ## [00:00] Intro Host Stephen introduces Scott Galloway against a backdrop of rapid AI development and unsettling quotes from tech CEOs predicting total job replacement. Galloway opens with his central thesis: the two greatest brand collapses of the past 18 months are the United States' global reputation and artificial intelligence itself — both victims of overpromising and poor trust management. He signals that he is an AI optimist at the macro level, but insists the people building it do not have the public's best interests at heart. > *"These techs, they do not have our best interests at heart."* ## [02:45] What's Actually True About AI Galloway reveals a striking data point: approval of AI is directly correlated with income. Only households earning over $200,000 per year hold a net-positive view of the technology, because they benefit through rising portfolios and are the heaviest users. Everyone else sees higher electricity bills, no equity stake in the companies, and dismissive comments from leaders like Sam Altman telling people to stop complaining about energy costs. The AI brand, he argues, has shifted in 18 months from "scary but optimistic" to "scary and only good for the already rich." > *"Your view of AI is directly correlated to your wealth. The only cohort that has a positive rating of AI is people making over $200,000."* ## [05:00] Are AI CEOs Exaggerating The Future To Raise Billions? Galloway lays out the economic logic behind AI catastrophizing. These companies sit on astronomical valuations that can only be justified if either (a) a trillion dollars in incremental revenue materialises from AI-powered products, or (b) there is a massive wave of labour cost savings. Because option (a) is not yet visible — he sees no AI-driven products at meaningful scale — the CEOs amplify option (b), painting vivid pictures of job destruction to justify the efficiency gains enterprises need to believe in. He calls some of the doom talk "thinly veiled fundraising," noting that founders catastrophize and then take secondaries and leave for Santorini. > *"The catastrophizing is nothing more than a thinly veiled attempt to say my technology is so devastating that it's going to shift society and you should invest at this crazy valuation."* ## [09:00] What Would Prove The AI Skeptics Wrong? Asked where he could be wrong, Galloway is specific: if unemployment rises to 20% even temporarily, history shows civil unrest follows regardless of eventual job recovery. He points to radiologists and coders as cases where AI has augmented rather than eliminated roles — new coder job listings are up 11% year-on-year. His benchmark for being wrong is sustained destruction outpacing creation fast enough that the recovery "V" triggers social breakdown before the other side is reached. > *"At 20% unemployment, especially among youth, especially young men tend to get very angry and take to the streets."* ## [11:05] Could AI Move Too Fast For Society To Handle? The conversation turns to pace of change. Galloway uses the host's own media empire — 220 hires in 24 months — as a live counter-example to the apocalypse narrative. He notes a structural inversion: for the first time in decades, unemployment among non-college graduates is lower than among college graduates because AI data centres are driving a boom in trades. He praises the entrepreneurial wave unlocked by AI tools and flags Denmark's 2% GDP commitment to retraining versus America's inadequate equivalent as the real policy failure. > *"AI is not going to take your job. Someone who understands AI is going to take your job."* ## [16:05] What Happens When AI Combines With Robots? Galloway addresses Elon Musk's Optimus robot predictions and the convergence of physical automation with AI cognition. His 2026 stock pick is Amazon, which already holds more industrialised robots than the rest of the US combined and plans to double its retail operation by 2032 without additional headcount. He is sceptical of domestic humanoid robots but takes seriously the military application of weaponised autonomous systems as a genuinely dark unknown frontier. > *"Amazon is saying they're going to double their largest business, which is their retail business by 2032 without an incremental hire using robotics, industrialised robots."* ## [19:05] Is Elon Musk Selling Vision or Reality? Galloway separates Musk the innovator from Musk the stock promoter. He calls Starlink the best tech product of the past several years and credits Musk with inspiring the EV race. But Tesla should trade at 30x earnings, not 150x, and capital will migrate to SpaceX when it IPOs at a projected 90–110x revenues. The core insight: the modern CEO's job has inverted from underpromise-and-overdeliver to overpromise-and-underdel in order to access cheap capital and pull the future forward. > *"The key attribute of an innovator right now is storytelling — to make sure the promise is way ahead of the performance such you can access cheap capital and pull the future forward."* ## [24:05] Which Jobs Are First To Disappear In The AI Shift? Long-haul trucking is Galloway's clearest near-term casualty: autonomous trucks can run the 10 pm to 4 am window and trucking is the largest single employer of non-high-school-graduate males in America. Legal work at the junior associate level is already being displaced — he now routes contracts through two competing LLMs rather than a $400–$2,000 law firm review, projecting a third reduction in his annual legal spend. The pattern he observes is multiplication: one AI-fluent analyst replaces five, yet the resulting EBITDA funds expansion that creates new jobs elsewhere in the ecosystem. > *"AI is not going to take your job. Someone who understands AI is going to take your job. So have a second screen — always have a second screen open that has nothing but AI on it."* ## [30:05] What Skills Will Actually Matter In The Future? Storytelling tops Galloway's list — the ability to look at data, construct a narrative arc, and communicate it compellingly across every medium. He holds up Jeff Bezos's 1997 shareholder letter, Jensen Huang's stadium keynotes, and Alex Karp's walk-and-talk earnings calls as models. Relationships are the second pillar: as technology converges and products commoditise, the differentiator is whether people want to work with you. He is honest that predicting specific skills is unreliable — private schools doubled down on computer science and Mandarin a decade ago, and neither bet has paid off as expected. > *"The enduring skill is storytelling — your ability to look at data, create a narrative arc and then communicate that story in a compelling way via all the different mediums."* ## [33:45] Are Young People Losing The Ability To Handle Rejection? Galloway identifies the erosion of rejection-tolerance as the most underrated threat facing young people, especially young men. Frictionless online relationships offer a simulacrum of connection without the emotional labour of real-world risk. He mentors young men by assigning deliberate rejection exercises: approach a stranger for friendship, ask someone out for coffee. The goal is not the yes; it is learning that a no is survivable. He argues his own superpower is simply the willingness to mourn failure and try again. > *"The secret to my success is rejection. I ran for sophomore, junior, and senior class president of my high school. I lost all three times."* ## [39:55] Can You Trust The People Building AI? A sharp cultural critique: America has replaced declining religious institutions with tech idolatry, crowning each new CEO as a secular Jesus Christ. Steve Jobs, then Zuckerberg, then Sam Altman, now Dario Amodei — each is briefly positioned as the good guy before completing the villain's journey. Galloway's argument is not that these people are evil but that they are doing exactly what capitalism demands: maximising earnings regardless of wider harm. The answer is not more trustworthy tech founders; it is competent elected officials who regulate them. > *"Can we trust Sam Altman? No. But we shouldn't need to trust him. We should be able to trust that we have smart elected officials that will regulate these companies."* ## [44:50] Are Tech Leaders Quietly Preparing For The End? Galloway reveals that roughly one in three billionaires maintain a "go bag" — a fully funded escape plan, typically a private jet to Auckland and a fortified New Zealand bunker. He calls this nihilism: the ultra-wealthy have sequestered themselves so completely from ordinary infrastructure — private aviation, concierge medicine, private security, elite schools — that they are no longer invested in the health of society. Their disproportionate political donations are therefore not directed at making the system work for everyone. > *"The problem is the 0.1% are not invested in the health of America. They don't have to put up with TSA lines. They fly private."* ## [52:00] Do Some AI Leaders Believe The Risk Is Worth It? A secondhand but chilling account: a source with direct access to an AI CEO described someone who genuinely believes there is a roughly 7–10% chance their work ends in catastrophe, but considers being the person who summoned this new intelligence consequential enough to proceed regardless. Galloway connects this to widening inequality — the delta between middle-class and ultra-wealthy life has expanded so dramatically across healthcare, travel, and security that the incentives of the 0.1% are structurally misaligned with the rest of society. > *"The bottom 99% of Western societies are essentially being optimised and monetised to make the life of the 1% just unbelievable."* ## [58:04] Ads Sponsored segments for LinkedIn Hiring Pro and Function Health. ## [60:05] Could AI Make Us More Human? Galloway offers a surprising positive: unlike social media algorithms that push users toward political extremes, AI models appear to moderate views by seeking statistical medians. He sees genuine value in AI companionship for isolated elderly users. But he returns to his central fear: the biggest downside of AI is not weapons, not election contamination, not even income inequality — it is loneliness. Men aged 20 to 30 are spending less time outdoors than prison inmates, and 42% of men aged 18 to 24 have never asked a woman out in person. > *"The biggest downside of AI in my view is loneliness. AI is convincing people they can have a reasonable facsimile of life on a screen with an algorithm."* ## [65:00] What Happens When AI Becomes Your Closest Companion The conversation shifts to the Iran conflict as a case study in what happens when strategic incompetence meets operational excellence. Galloway credits the initial military strike as tactically credible but argues the absence of Congressional briefing, Gulf ally coordination, and clear exit objectives has produced a quagmire — and notes Iran's IRGC-produced propaganda is outperforming US information operations in the global war of memes. > *"The problem with wars is that the enemy has a say. And all the enemy needs to do — whether it's the Viet Cong or the Taliban or the IRGC — is survive, and they win."* ## [70:00] The Hidden Trade-Off Between Convenience And Real Relationships Galloway diagnoses America's Iran strategy as a product of a gutted diplomatic corps. When senior officials fly to Islamabad expecting a deal, 97% of the preparatory work that career diplomats would normally complete simply has not happened. The IRGC understands the game better: all they need to do is survive, and every day the conflict continues they look like the underdog who stood up to the superpower. His most optimistic scenario is a multinational force enforcing freedom of navigation through the Strait of Hormuz. > *"Do you know what we have done in the US to our diplomatic corps? We've absolutely gutted it."* ## [75:00] Why Loneliness Could Explode US stock markets hit an all-time high during active Middle East conflict — a sign that the wealthy are so insulated from geopolitical risk that war no longer registers in asset prices. The top 10% account for 50% of consumer spending, and that cohort does not care if gasoline hits six dollars a gallon. The pain is outsourced to lower-income households and oil-dependent nations. Galloway frames this dissociation from shared risk as one of the most dangerous structural features of contemporary inequality. > *"We've outsourced the downside of war to less wealthy nations who are very oil dependent, to the Gulf, which is incurring damage here."* ## [79:26] The Real Reason Human Connection Might Become More Valuable Extended discussion of AI market valuations and the historical pattern of infrastructure overbuild. Every great infrastructure boom — railroads, electrification, the internet — ended in a crash, and AI capex now constitutes a significant share of US GDP growth. Galloway argues there is a one-in-three chance AI ends up like jet aviation or vaccines: transformative for humanity but impossible to monetise exclusively for a small group of companies, because open-weight Chinese models could commoditise the entire stack through "AI dumping." > *"AI puts AI out of business. And that is if you look at the convergence of the technologies, all the models are converging."* ## [85:00] What This Means For The Next Generation Galloway argues that a market correction might actually benefit younger generations by making assets affordable again. He flags GLP-1 drugs as his technology pick over AI in terms of real-world human impact. His personal investment philosophy at age 61: aggressive diversification, no single position above 3% of net worth, rotation out of overheated US markets into Europe and Latin America. For young people, the only wealth-building path he trusts is compound interest through low-cost index funds, with money automatically invested before it can be spent. > *"The only answer I have is slowly — find out a way to start saving when you're a teenager, 25 bucks a month, then in your 20s 100, then 500."* ## [90:00] How Power, Politics, And AI Are Becoming Intertwined Drawing on his experience losing 70% of New York Times ad revenue in 60 days during 2008, Galloway warns that younger entrepreneurs have never experienced a true recession. He argues that the political class has systematically bailed out asset-owning baby boomers — COVID relief, corporate bailouts, perpetual market support — while denying younger generations the chance to buy assets at distressed prices. Recessions historically created entry points; that mechanism is now deliberately suppressed. > *"Your generation really doesn't know what a recession looks like. Like, everything stops."* ## [95:00] The Dangerous Gap Between Technology And Regulation Personal finance advice combined with a reflection on the limits of prediction. Galloway's investment rule for young people: put money in yourself first, then in relationships, then in diversified index funds. He is honest that picking winning sectors is largely futile, and that anyone claiming certainty does not know. His own investment in Pokemon cards with his son illustrates that the best investments compound in non-financial ways — relationships and shared experience accrue value that conventional ROI cannot measure. > *"The only answer I have is slowly and it requires some discipline. Save money, diversify, compound interest, invest in relationships early."* ## [100:00] What Happens If Governments Can't Keep Up With AI Asked what a 33-year-old should know that a 61-year-old has learned, Galloway offers three lessons: be humble in success because much of it is luck; forgive yourself in failure because much of it is also circumstance; and invest aggressively in relationships in your 30s, because he spent his prime years professionally focused and nearly ended up isolated. He frames every major disappointment as something people later regret not the thing itself but how upset they allowed themselves to be. > *"Nothing's ever as good or as bad as it seems. Be humble when you're successful. And forgive yourself and realise this will pass."* ## [105:00] The Future Of Work, Power, And Who Really Wins Fatherhood as purpose. Galloway confesses he did not want children and did not fall in love with his sons immediately after birth. What changed his view was discovering that fatherhood is the one investment where a positive financial return is structurally impossible — and that is precisely what makes it purposeful. The same logic applies to any cause large enough to demand more than you can ever get back: veterans, activism, caregiving. He closes with frank advice on partnership, timing, and the liberation of having no choice but to lean into your children's interests. > *"Finding your purpose is finding that thing that you can never get a real positive return on. I will never get a positive return for my children."* ## [110:00] Why The Biggest AI Risks Aren't What You've Been Told The final chapter opens with Galloway's emotional description of his sons' contrasting personalities — one a mirror of himself, one a "different species" he observes with fascination. He discusses his book *Notes on Being a Man*, framing it as letters he hopes his boys will read in 30 years. The closing question — the biggest setback and its lesson — draws the most emotionally raw answer of the episode: his mother's death. He says he has not gotten over it and does not want to, because grief is the receipt for love, and he hopes his sons will one day feel the same about losing him. > *"My mother dying. And you can never tell your parents how much you love them too much. The reverse of love is grief."* ## Entities - **Scott Galloway** (Person): NYU Stern Professor of Marketing, serial entrepreneur, author of *The Four*, *The Algebra of Happiness*, and *Notes on Being a Man*; host of the Prof G Pod and Pivot podcast - **Sam Altman** (Person): CEO of OpenAI; used as the primary case study in the recurring tech-leader idolisation and disillusionment cycle - **Elon Musk** (Person): CEO of Tesla, SpaceX, and xAI; discussed as visionary storyteller whose real products (Starlink, SpaceX) are transformative but whose timelines consistently overshoot - **Dario Amodei** (Person): CEO of Anthropic; cited as the current tech industry "good guy" before the inevitable villain turn - **Jensen Huang** (Person): CEO of Nvidia; held up as a model of storytelling-driven CEO performance via stadium keynotes - **OpenAI** (Organization): Developer of ChatGPT; primary subject of fundraising-hype and overvaluation critique - **Anthropic** (Organization): AI safety company; referenced as beneficiary of the "latest hero" investor narrative - **SpaceX** (Organization): Musk's rocket company; flagged as likely destination for capital migrating away from Tesla at IPO - **Amazon** (Organization): Galloway's top large-cap stock pick for 2026 due to robotics leadership and warehouse automation scale - **Tesla** (Organization): Great car company trading at an unjustifiable multiple that will correct when SpaceX IPOs - **GLP-1 drugs** (Concept): Weight-loss and metabolic medications (Ozempic/Wegovy class) that Galloway argues will create more real-world human impact and shareholder value than AI - **AI dumping** (Concept): Galloway's term for China flooding the US with cheap open-weight AI models to undermine American AI valuations and destabilise the economy - **Go bag / billionaire nihilism** (Concept): The practice among roughly one-in-three billionaires of maintaining funded escape plans as a symptom of disengagement from shared societal wellbeing - **Rejection tolerance** (Concept): Galloway's candidate for the most underrated skill of the AI era — the willingness to hear no, mourn briefly, and try again
Robotics' End Game: Nvidia's Jim Fan
Jim Fan, lead of Nvidia's embodied AI research, outlines the transition from language-centric models to World Action Models (WAM) that simulate physical reality. He details a roadmap toward the 'Physical Turing Test' and autonomous factories by 2040, driven by video pre-training and human egocentric data scaling. ## [00:00] Introduction Host Sonya Huang introduces Jim Fan, who leads Nvidia's embodied autonomous research group. Fan reflects on his early days as an intern and the excitement surrounding the future of robotics. > *robots are just one of the most thrilling things that's going to happen.* > *[0, 12]* ## [00:30] DGX One Origin Story Jim Fan recounts the 2016 delivery of the first DGX-1 by Jensen Huang to Elon Musk and the OpenAI team. He highlights how this moment catalyzed the deep learning revolution that led to current AI breakthroughs. > *If you believe in deep learning, deep learning will believe in you.* > *[1, 26]* ## [01:42] The Great Parallel Fan proposes 'The Great Parallel,' applying the successful LLM scaling playbook to robotics. Instead of predicting the next token in a string, the goal is to predict the next physical world state through simulation and alignment. > *instead of simulating strings can we simulate next physical world state?* > *[2, 56]* ## [03:31] Robotics Endgame Setup The strategy for achieving the robotics end game is divided into two primary pillars: model strategy and data strategy. Fan notes that while LLMs are in their final 'boss fight,' robotics is just beginning its scaling journey. > *It boils down to two things, model strategy and data strategy.* > *[3, 32]* ## [03:39] Why VLA Falls Short Visual Language Action (VLA) models are criticized for being 'head-heavy' on language while lacking a fundamental grasp of physics and verbs. Fan argues they are better at encoding static knowledge than dynamic physical interaction. > *VLAs are great at encoding knowledge and nouns, but not so much at physics and verbs.* > *[4, 8]* ## [04:32] Video World Models Fan explains how video models like VEO3 learn internal physics—such as gravity and buoyancy—simply by predicting pixels at scale. These models act as simulators that can solve mazes and plan visual sequences internally. > *Physics emerge by predicting the next blob of pixels at scale.* > *[5, 15]* ## [06:09] DreamZero World Action Nvidia introduces 'Dreamer' and World Action Models (WAM), which jointly decode future world states and motor actions. This allows robots to perform zero-shot tasks by 'dreaming' the correct motion sequence before executing it. > *Dreamer jointly decodes the next world states and next actions.* > *[6, 29]* ## [07:46] Scaling Data Collection To overcome the physical limits of teleoperation, Fan discusses Universal Manipulation Interfaces (UMI) and exoskeletons like Dex-UMI. These tools allow humans to collect high-dexterity data directly without the robot being in the loop. > *we're able to break the curse of 24 hours per robot per day* > *[10, 6]* ## [11:06] EgoScale And Scaling Laws Fan introduces Ego-Exo, a policy trained on 21,000 hours of human egocentric video. This research uncovered a neural scaling law for dexterity, showing a mathematical relationship between pre-training volume and robot performance. > *we discovered this neural scaling law for dexterity.* > *[12, 39]* ## [15:39] DreamDojo And The Roadmap Fan outlines the roadmap to 2040, including the Physical Turing Test and 'lights-out' factories. He introduces Dream Dojo, a neural simulator that replaces classical physics engines with data-driven world models. > *I can say with 95% certainty that we'll get to the end of the end game... by 2040.* > *[19, 19]* ## Entities - **Jim Fan** (person): Lead of the embodied autonomous research group at Nvidia. - **Nvidia** (organization): The technology company developing the hardware and software for the robotics end game. - **Jensen Huang** (person): CEO of Nvidia, mentioned for delivering the first DGX-1 to OpenAI. - **OpenAI** (organization): The research lab that received the first DGX-1 for deep learning development. - **DGX-1** (product): The world's first deep learning supercomputer delivered in 2016. - **VEO3** (model): A video world model capable of simulating physics and visual planning. - **Dreamer** (model): A policy model that predicts future world states and actions simultaneously. - **Ego-Exo** (project): A robotics pre-training framework using large-scale human egocentric video data.
Andrej Karpathy: From Vibe Coding to Agentic Engineering
Andrej Karpathy explores the paradigm shift from traditional programming to Software 3.0, where LLMs act as programmable computers driven by context. He details the transition from 'vibe coding' to 'agentic engineering,' emphasizing that while AI handles execution, human taste and understanding remain the ultimate bottlenecks. ## [00:00] Introduction Stephanie Zhan introduces Andrej Karpathy, highlighting his foundational work at OpenAI and Tesla. She notes his unique ability to simplify complex AI shifts and introduces the concept of vibe coding. > *He has a rare gift of making the most complex technical shifts feel both accessible and inevitable. [00:22]* ## [00:44] Feeling Behind as a Coder Karpathy describes a turning point in December 2023 when agentic tools began producing perfect code without manual intervention. This shift led him to adopt vibe coding, trusting the AI to handle complex workflows autonomously. > *I just start to notice that with the latest models the chunks just came out fine. [01:29]* ## [02:28] Software 3.0 Explained Karpathy defines Software 3.0 as a paradigm where the LLM acts as a programmable computer and the context window serves as the primary programming lever. This follows Software 1.0's manual rules and Software 2.0's data-driven weight training. > *Software 3.0 is kind of about your programming now turns to prompting and what's in the context window is your lever. [03:20]* ## [03:44] Agents as the Installer Using the installation of OpenClaw as an example, Karpathy explains how agents replace rigid bash scripts with intelligent, environment-aware execution. This approach allows the AI to debug and adapt to specific system requirements autonomously. > *The agent has its own intelligence that it packages up and then it kind of like follows the instructions. [04:29]* ## [04:49] Menu Gen vs Raw Prompts Karpathy contrasts his custom-coded MenuGen app with raw prompts to models like Gemini, concluding that many traditional software layers are now redundant. He emphasizes that AI can now perform general information processing that was previously impossible with structured code. > *The software 3.0 paradigm is a lot more kind of raw. It just your neural network is doing more and more of the work. [06:11]* ## [07:37] What’s Obvious by 2026 Looking toward 2026, Karpathy envisions neural computers that process raw video and audio directly. These systems would use diffusion models to generate dynamic user interfaces, potentially making traditional UI code obsolete. > *You could imagine completely neural computers... a device that takes raw videos or audio into basically what's a neural net. [08:22]* ## [09:41] Verifiability and Jagged Skills AI models develop 'jagged' capabilities, peaking in verifiable domains like math and code due to reinforcement learning rewards. Karpathy notes the paradox where a model can refactor a massive codebase yet fail simple logic. > *state-of-the-art models today will tell you to walk [to a car wash] because it's so close... This is insane. [11:36]* ## [13:39] Founder Advice and Automation Model performance is heavily dictated by the specific data distributions chosen by frontier labs. Karpathy advises founders to explore the 'circuits' of these models to understand their strengths or use fine-tuning to fill gaps. > *we are slightly at the mercy of whatever the labs are doing, whatever they happen to put into the mix. [12:57]* ## [15:46] From Vibe Coding to Agent Engineering While 'vibe coding' raises the accessibility floor, 'agentic engineering' focuses on maintaining professional quality. This discipline involves coordinating powerful but stochastic agents to accelerate development without sacrificing the engineering bar. > *agentic engineering is about preserving the quality bar of what existed before in professional software. [16:07]* ## [25:17] Agents Everywhere and Learning Karpathy advocates for agent-native infrastructure, expressing frustration with human-centric documentation. He argues that while thinking can be outsourced to AI, human understanding remains a critical bottleneck for directing agents. > *You can outsource your thinking, but you can't outsource your understanding. [28:10]* ## Entities - **Andrej Karpathy** (person): AI researcher and former Director of AI at Tesla and founding member of OpenAI. - **Stephanie Zhan** (person): Partner at Sequoia Capital and host of the discussion. - **Software 3.0** (concept): A paradigm where LLMs act as programmable computers via prompting and context. - **Agentic Engineering** (concept): The professional discipline of coordinating AI agents to maintain software quality. - **MenuGen** (project): An app Karpathy built to OCR and visualize restaurant menus, used as a case study. - **OpenAI** (organization): AI research company co-founded by Karpathy. - **Gemini** (ai-model): Google's LLM used in Karpathy's software comparison. - **Vercel** (organization): A cloud platform used by Karpathy to deploy projects.

Ivanka Trump: Lo que aprendí a los 9 años que la mayoría nunca aprende
Ivanka Trump ofrece una mirada sincera a su vida, desde una infancia singular moldeada por padres famosos y un intenso escrutinio mediático, hasta su influyente carrera en los negocios y el servicio público. Comparte las lecciones aprendidas de su madre, los desafíos de construir confianza, y cómo experiencias cruciales como el divorcio de sus padres y el intento de asesinato de su padre forjaron su resiliencia. Trump también habla de su filosofía sobre la intencionalidad, el poder de ser subestimada, y su camino de crecimiento personal a través de la maternidad y la terapia, culminando en su trabajo con propósito en Planet Harvest. ## [00:00] Por qué la confianza no es fácil y qué revela eso Ivanka Trump aprendió desde temprana edad, particularmente durante el muy publicitado divorcio de sus padres cuando tenía nueve años, a protegerse de relaciones poco sinceras debido al constante escrutinio mediático y los agresivos paparazzi. Su madre le enseñó el poder de ser subestimada y la importancia de filtrar el "ruido" externo bajo presión. Aunque inicialmente desarrolló un fuerte mecanismo de defensa contra la confianza en los demás, desde entonces ha cultivado intencionalmente un enfoque más confiado para lograr conexiones más profundas, aceptando los riesgos inherentes. > *mi madre me enseñó que ser subestimada no es algo malo. En realidad es algo muy poderoso [00:22]* > *De hecho, me he enseñado a mí misma a ser más confiada. [05:48]* ## [03:32] Cuando te das cuenta de que eres diferente qué pasa después Ivanka Trump se dio cuenta desde muy joven de que su vida era atípica debido a la constante atención mediática y el escrutinio público, un fenómeno que ella contrasta con la exposición amplificada que las redes sociales generan hoy en día para los niños. Señala que sus padres hicieron esfuerzos por protegerla a ella y a sus hermanos de esa intensa mirada pública. Prefiere las conversaciones en profundidad a las entrevistas frecuentes. > *Creo que siempre hubo mucha atención mediática y escrutinio. Lo ves, lo experimentas desde muy temprano. [06:24]* > *no todos creo que la experiencia que nuestros hijos tienen donde adonde van la gente tiene un dispositivo de grabación en las manos [06:40]* ## [05:44] Cómo era realmente su madre en la intimidad Ivanka Trump describe a su madre, Ivana, como una disciplinada exesquiadora nacional que le inculcó el valor del deporte, llevando a Ivanka al ballet. Recuerda un recuerdo inusual de su infancia: Michael Jackson asistiendo a su función de El Cascanueces. A pesar de estas experiencias extraordinarias, su vida cotidiana estaba anclada por su abuela materna, "Bubby", quien le brindó amor incondicional y lo expresaba a través de la cocina. > *mi mamá era una esquiadora increíble... realmente creía en la importancia del deporte para cultivar la disciplina [07:07]* > *Mi abuela... realmente nos crió... me enseñó un tipo de amor incondicional y ternura [08:44]* ## [11:47] La diferencia clave que definió quién llegó a ser La crianza de Ivanka Trump fue profundamente moldeada tanto por su cariñosa abuela, "Bubby", quien le brindó amor incondicional y cuidado diario, como por su madre, Ivana, quien fue un modelo a seguir pionero. Ivana ejemplificó la fuerza, la ambición y la resiliencia, demostrando cómo perseguir metas profesionales mientras se es una madre amorosa. Ivanka aclara que, a pesar de las ocupadas carreras de sus padres, estuvieron presentes y la hicieron sentir una prioridad, con su abuela cumpliendo el rol tradicional de cuidadora. > *Mi madre fue una pionera increíble... un ejemplo asombroso para mí de fuerza y resiliencia y glamour y determinación y ambición. [11:57]* > *Nunca tuve duda de que yo era su máxima prioridad y de que estaba disponible para mí. [14:42]* ## [15:43] Qué significó realmente el divorcio de Donald e Ivana Trump para ella El muy publicitado divorcio de Donald e Ivana Trump, del cual Ivanka se enteró por un periódico a los nueve años, la impactó profundamente. Recuerda sentirse asustada por el intenso escrutinio mediático y experimentar los miedos normales de un niño durante la separación de sus padres. Este período difícil, que generó más titulares que el juicio de O.J. Simpson, forjó un vínculo único entre ella y sus hermanos. Más adelante en su vida, tras el fallecimiento de su madre, Ivanka comprendió más profundamente el complejo carácter de Ivana, moldeado por su crianza en la Checoslovaquia comunista, deseando haberle hecho más preguntas mientras estaba viva. > *este divorcio aparentemente generó más titulares que el juicio de OJ Simpson. [20:04]* > *lo positivo para mí y mis hermanos fue que realmente nos unimos de una manera diferente porque lo estábamos atravesando juntos. [23:21]* ## [18:27] La realidad de ser la hija de Trump lo que la gente no entiende Ser la hija de Donald Trump significó navegar un intenso escrutinio público desde muy joven, particularmente durante el divorcio de sus padres, lo que le enseñó una necesaria cautela respecto a la confianza. Desde entonces ha aprendido a "encontrar la señal en el ruido" y evitar las redes sociales combativas, priorizando la paz interior. Ivanka destaca la profunda autenticidad de sus padres, y aunque ella aborda la comunicación con más delicadeza, mantiene un fuerte sentido de identidad, guiada por la filosofía estoica, para vivir auténticamente y resistir las presiones externas. > *Si no hubiera tenido esa lección, no sé si sería fuerte. Me enseñó a no confiar en nadie. [18:53]* > *No devuelvo los golpes porque no... creo en gastar mi tiempo y energía siendo combativa, metiéndome en esa arena particular y el remolino desagradable de las redes sociales. [26:19]* ## [23:36] Cómo encontrarte a ti misma rodeada de poder y fama Rodeada de poder y fama, Ivanka Trump encontró su sentido de identidad a través del crecimiento personal intencional y la experiencia transformadora de la maternidad, que la "abrió por completo" y profundizó su capacidad de amar. Enfatiza la importancia crítica de la autoconciencia para resistir las presiones externas y definirse a una misma, en lugar de dejar que "la turba gane". Aplica esta filosofía a su crianza, fomentando la individualidad en sus hijos, y reconoce a sus propios padres por permitir el disenso respetuoso, permitiéndole ser fiel a sí misma. > *Si no sabes quién eres, la turba gana. [29:55]* > *Crearon un ambiente donde el disenso estaba bien. [32:44]* ## [30:57] Por qué ser subestimada se convirtió en su mayor ventaja Ivanka Trump aprendió de su madre que ser subestimada puede ser una ventaja poderosa. Al inicio de su carrera inmobiliaria, frecuentemente la juzgaban mal tanto por ser hija de padres exitosos como por ser una mujer joven en una industria dominada por hombres. Canalizó esa percepción, usándola como motivación para trabajar más duro y estar mejor preparada, aprovechándola finalmente a su favor frente a quienes la subestimaban. > *mi madre me enseñó que ser subestimada no es algo malo. En realidad es algo muy poderoso [00:22]* > *Canalicé ese miedo, ese sentimiento, y lo usé para impulsarme. [35:06]* ## [32:59] Qué busca realmente al contratar y por qué importa Al contratar, Ivanka Trump prioriza a personas con un fuerte sentido de identidad, iniciativa propia, buen juicio y "astucia callejera", ya que estas cualidades innatas son difíciles de enseñar. Enfatiza la importancia de trabajar con "buenas personas" en quienes confía y respeta, considerando estos atributos fundamentales para relaciones laborales exitosas y la dinámica general del equipo. > *Es muy difícil enseñar a la gente, sabes, puedes tener a una persona brillante, pero si no tiene buen juicio o si no tiene iniciativa propia, es muy difícil darle eso. [38:15]* > *No quiero trabajar con personas que no disfruto, que no creo que sean buenas personas, porque no quiero pasar mi tiempo con alguien en quien no confío o a quien no respeto. [39:00]* ## [37:49] Por qué dejó la moda por el gobierno A pesar de una prestigiosa oferta de trabajo de Anna Wintour en Vogue al graduarse de Wharton, Ivanka Trump siguió su pasión de toda la vida por los bienes raíces. Posteriormente construyó una exitosa marca de moda, Ivanka Trump.com, que creció hasta casi 800 millones de dólares en ventas anuales. Sin embargo, tomó la decisión deliberada de cerrar este próspero negocio para cumplir con las normas éticas del gobierno cuando aceptó la solicitud de su padre de servir en su administración. Consideró esta oportunidad como un privilegio innegable y un deber hacia su país, a pesar de los significativos sacrificios personales y profesionales. > *Estábamos haciendo cerca de 800 millones de dólares en ventas anuales cuando lo cerré al entrar al gobierno. [42:30]* > *Me siento increíblemente privilegiada de que nos diera la oportunidad de servir a un país que amamos tanto. [43:30]* ## [41:06] Qué pasó realmente cuando Trump decidió postularse La decisión de Donald Trump de postularse a la presidencia en 2015 fue anunciada en una reunión familiar en Bedminster, sorprendiendo a Ivanka por su rapidez, a pesar de sus ambiciones políticas de larga data, aunque no articuladas, desde los años 80. Ella recuerda un momento de pánico a los 16 años, temiendo que se postulara, solo para ser tranquilizada de que no lo haría. Su entrada en la política presidencial fue un "ajuste radical" para la familia, expandiendo profundamente la visión del mundo de Ivanka más allá de su "burbuja" de Nueva York e iniciando un "viaje extraordinario" hacia el servicio público. > *Recuerdo una vez que pensé que era real. Tenía 16 años y estaba en un internado y lo llamé... 'Esto va a arruinar mi vida.' [51:48]* > *su campaña me la abrió de golpe y me di cuenta de la burbuja en la que estaba [48:02]* ## [46:23] Trump se postula a presidente lo que cambió todo La decisión de Donald Trump de postularse a la presidencia cambió todo fundamentalmente para Ivanka, marcando un "ajuste radical" para toda la familia. Su entrada no convencional en la política, evitando las trayectorias profesionales tradicionales, fue como "beber agua de una manguera contra incendios". La campaña rompió la "burbuja" percibida de Ivanka en la ciudad de Nueva York, expandiendo profundamente su visión del mundo y llevándola a abrazar el privilegio de servir a su país. > *Fue como beber agua de una manguera contra incendios para todos nosotros. [47:08]* > *su campaña me la abrió de golpe y me di cuenta de la burbuja en la que estaba [48:02]* ## [48:52] Anuncios Este segmento presenta un anuncio de Shopify, una plataforma de comercio electrónico que simplifica la creación de tiendas en línea, la venta en redes sociales y la gestión de operaciones con herramientas de inteligencia artificial. También promociona Pipe Drive, un CRM inteligente utilizado por el presentador, destacando su panel visual de embudo para una visibilidad clara del proceso de ventas. > *Shopify hace que sea fácil empezar porque puedes construir tu tienda, vender en redes sociales, aceptar pagos, usar herramientas de IA y gestionar todo en un solo lugar. [49:22]* > *Pipe Drive es un CRM inteligente y fácil de usar... hace que tu proceso de ventas sea visible a través de un solo panel. [50:17]* ## [51:04] Alguna vez pensó que su padre realmente lo haría Aunque Donald Trump había considerado postularse a la presidencia desde los años 80, Ivanka afirma que esta ambición no se discutió explícitamente durante su infancia. Recuerda vívidamente un momento a los 16 años cuando entró en pánico, creyendo que su padre se postulaba, solo para ser tranquilizada de que no estaba sucediendo. Señala que sus puntos de vista consistentes sobre temas como la política comercial se mantuvieron inalterados durante décadas. > *Recuerdo una vez que pensé que era real. Tenía 16 años y estaba en un internado y lo llamé... 'Esto va a arruinar mi vida.' [51:48]* > *su punto de vista se mantuvo constante a lo largo del tiempo y se mantiene constante hasta hoy exactamente sobre política comercial [52:35]* ## [54:26] Dejar la Casa Blanca fue un alivio o algo más Dejar la Casa Blanca no fue un alivio en el sentido de arrepentimiento, ya que Ivanka Trump siente que "lo dejó todo en el campo" y está orgullosa de sus logros durante sus cuatro años de servicio público. Considera la oportunidad de servir como un "privilegio increíble", pero no tiene deseos de regresar a la política, priorizando a sus hijos y sin estar dispuesta a que ellos paguen el precio de una mayor vida pública. Está satisfecha con sus contribuciones y siente que su padre ahora tiene un equipo sólido que lo apoya. > *Lo dejé todo en el campo, ¿sabes? No miro atrás y digo... no tengo arrepentimientos. [53:33]* > *Mi primera responsabilidad es ser su mamá. [56:49]* ## [58:08] Alguien estaba realmente preparado para la vida dentro de la Casa Blanca Ivanka Trump admite que nada prepara realmente a una persona para la intensa experiencia de la política de alto nivel y la vida dentro de la Casa Blanca. Observó que el poder, al igual que la riqueza, tiende a amplificar los rasgos inherentes de las personas. Sus interacciones con líderes mundiales, desde monarcas hasta funcionarios electos, los desmitificaron, revelando que en el fondo son "simplemente personas" con luchas ordinarias, lo que finalmente disipó cualquier intimidación que pudiera haber sentido. > *No hay nada que te prepare para la experiencia. [58:26]* > *Te das cuenta de que al final del día las personas son personas. [59:03]* ## [59:44] Lo que el intento de asesinato cambió para siempre El intento de asesinato contra su padre en julio de 2024 cambió radicalmente la vida de Ivanka Trump, intensificando las preocupaciones de seguridad y haciendo necesaria la protección del Servicio Secreto de EE.UU. Al presenciar el evento en tiempo real con sus hijos, su reacción inmediata fue protegerlos, aunque tuvo un presentimiento intuitivo de que su padre estaría bien. Esta experiencia desgarradora, junto con otros sustos de salud familiares, reforzó su creencia en lo precioso de la vida y su compromiso de elegir la positividad y valorar cada momento, a pesar de la preocupante correlación entre el servicio público y la violencia. > *Mi primera reacción fue alejarlos. [62:02]* > *En la vida, solo tienes elección en cómo respondes. Y yo elijo ver el resultado positivo. [66:05]* ## [1:07:20] Cómo es la vida después de alejarse de la política Después de alejarse de la política en 2022, la vida de Ivanka Trump ahora prioriza a sus hijos pequeños y la vida familiar privada, ya que encontró que el "mundo oscuro" de la política estaba en conflicto con su naturaleza. Enfrenta las críticas públicas usando la metáfora del "águila y el cuervo", eligiendo elevarse por encima de la negatividad en lugar de enfrentarla. Este período de intenso escrutinio público, incluyendo la experiencia cercana a la muerte de su padre, ha sido una "medicina" para el crecimiento personal, enseñándole a buscar la paz interior y la armonía dentro de lo que puede controlar, y a enfocarse en la gratitud por las bendiciones de la vida. > *La política es un mundo bastante oscuro. Hay mucha oscuridad, mucha negatividad, y simplemente está en conflicto con lo que me hace sentir bien como ser humano. [67:45]* > *La respuesta del águila a esto... no es retorcerse y girar y sacarse al cuervo de encima ni defenderse... Simplemente vuela más alto. [69:28]* ## [1:11:04] Anuncios Este capítulo representa una breve pausa publicitaria dentro del pódcast. ## [1:14:24] Cómo la terapia cambió su forma de ver todo Ivanka Trump comenzó terapia en la adultez, viéndola como una herramienta de "inventario interno", impulsada por su "mentalidad orientada al crecimiento" y un deseo de procesar eventos significativos de su vida. Los catalizadores clave incluyeron el segundo diagnóstico de cáncer de tiroides de su esposo Jared, su salida de Washington y el inesperado fallecimiento de su madre. La terapia le ayudó a cuidarse a sí misma y a procesar las emociones en lugar de compartimentalizarlas, cambiando finalmente su perspectiva sobre el autoconocimiento y el avance. > *Tengo una mentalidad muy orientada al crecimiento... siempre estoy buscando aprender sobre mí misma y sobre el mundo [74:35]* > *Jared fue diagnosticado con cáncer de tiroides por segunda vez. Y luego mi madre falleció [75:59]* ## [1:20:28] La pérdida de su madre y lo que le enseñó Ivanka Trump reflexiona sobre la repentina y trágica muerte de su madre, Ivana Trump, en 2022, destacando el impacto único de una pérdida parental inesperada. Se comprometió con un proceso de duelo adecuado, enfrentando la incomodidad y procesando sus sentimientos. Como madre, ahora busca exponer a sus hijos a las cualidades positivas de su madre mientras evita conscientemente transmitirles sus desafíos, obteniendo una perspectiva adulta más clara de la vida de su madre. > *Vivió una buena vida. [81:07]* > *Realmente me tomé el tiempo para pensar en ella no a través de los ojos de la niña que la idolatraba por completo, sino a través de los ojos de una adulta que la veía con claridad. [83:15]* ## [1:26:28] Las 3 reglas que según ella definen el éxito y la felicidad Ivanka Trump cree que el verdadero éxito y la felicidad se definen por tres principios clave, particularmente para el emprendimiento, que compartiría con su hija Arabella. Primero, uno debe amar genuinamente lo que hace, ya que la pasión es esencial para la dedicación. Segundo, la autenticidad es primordial; ser uno mismo y trazar su propio camino es crucial, ya que la imitación lleva al fracaso. Tercero, y lo más fundamental, uno debe cultivar la confianza en sí mismo antes de que el mundo crea en uno, ya que este es el punto de partida para cualquier logro. También señala que el "equilibrio entre vida y trabajo" tradicional es esquivo, y en su lugar busca la alineación con sus prioridades. > *Nunca he visto a alguien en la cima de su juego que no ame absolutamente lo que hace. [92:46]* > *vas a tener que creer en ti misma antes de que el mundo crea en ti. [94:48]* ## [1:28:37] Qué es Planet Harvest y por qué podría importar más de lo que crees Planet Harvest es la iniciativa con propósito de Ivanka Trump orientada a reducir el desperdicio de alimentos y apoyar a los agricultores estadounidenses. La iniciativa se inspiró durante la pandemia de COVID-19 cuando observó grandes cantidades de productos perecederos siendo descartados debido a problemas en la cadena de suministro. Planet Harvest aborda el problema continuo de alimentos en perfecto estado que son rechazados por los minoristas por no cumplir con estrictos estándares cosméticos, proporcionando así ingresos adicionales para los agricultores y beneficiando al medio ambiente. > *Planet Harvest nació... asegurando que cuando la gente necesitara comida, los alimentos en los campos no se desperdiciaran al ser arados como vimos en los primeros días de la pandemia. [89:18]* > *400 millones de libras de fresas cada año se quedan en los campos... No porque sean imperfectas. Simplemente no cumplen con una especificación cosmética muy rígida. [90:57]* ## Entidades - **Ivanka Trump** (Persona): Hija de Donald e Ivana Trump, empresaria y exfuncionaria del gobierno. - **The Diary Of A CEO** (Organización): El pódcast que aloja la entrevista. - **Donald Trump** (Persona): Padre de Ivanka Trump, expresidente de los Estados Unidos. - **Ivana Trump** (Persona): Madre de Ivanka Trump, exesquiadora de Checoslovaquia. - **Michael Jackson** (Persona): Famoso cantante, compositor y bailarín estadounidense. - **O.J. Simpson** (Persona): Exjugador de fútbol americano, locutor, actor y convicto. - **Marcus Aurelius** (Persona): Emperador romano y filósofo estoico. - **Shopify** (Organización): Plataforma de comercio electrónico para crear tiendas en línea. - **Pipe Drive** (Organización): Software inteligente de CRM (gestión de relaciones con clientes). - **Anna Wintour** (Persona): Editora en jefe de Vogue. - **Vogue** (Organización): Revista de moda y estilo de vida. - **Wharton School of Business** (Organización): Escuela de negocios de la Universidad de Pensilvania. - **Office of Government Ethics** (Organización): Agencia del gobierno de EE.UU. responsable de prevenir conflictos de interés. - **Jared Kushner** (Persona): Esposo de Ivanka Trump, quien también sirvió en el gobierno. - **US Secret Service** (Organización): Agencia del gobierno responsable de proteger a Ivanka Trump y su familia. - **Planet Harvest** (Organización): Empresa cofundada por Ivanka Trump enfocada en reducir el desperdicio de alimentos y apoyar a los agricultores. - **Arabella** (Persona): La hija mayor de Ivanka Trump. - **Estoicismo** (Filosofía): Escuela de filosofía de la antigua Grecia. - **Budismo** (Filosofía): Filosofía oriental. - **Daoísmo** (Filosofía): Filosofía oriental. - **Checoslovaquia** (Ubicación): Antiguo país de Europa Central. - **Nueva York** (Ubicación): Ciudad principal de los Estados Unidos. - **Bedminster, Nueva Jersey** (Ubicación): Lugar donde se encontraba Ivanka Trump cuando se enteró del intento de asesinato contra su padre. - **Child Tax Credit** (Política): Crédito fiscal estadounidense para familias con hijos. - **Great American Outdoors Act** (Política): Legislación apoyada por Ivanka Trump. - **Legislación contra la Trata de Personas** (Política): Legislación en la que Ivanka Trump trabajó durante su servicio público. - **Educación Vocacional y Capacitación Laboral** (Iniciativa): Programas promovidos por Ivanka Trump para capacitar y recapacitar a los trabajadores estadounidenses. - **Meditaciones** (Libro): Serie de escritos personales de Marcus Aurelius.
El flujo de trabajo Explorar→Planificar→Codificar→Confirmar en Claude Code
Presentación de tres minutos de Anthropic sobre el bucle que consideran el hábito más importante al trabajar con Claude Code: investigar primero en modo plan, definir qué significa "listo" antes de tocar cualquier archivo y, luego, hacer que un subagente revise el diff antes de hacer push. ## [00:03] Por qué explorar-planificar-codificar-confirmar supera empezar de inmediato La apertura es directa: si solo adoptas un hábito del curso, que sea este flujo de trabajo. El modo de fallo que combate es el reflejo de pegar una tarea en Claude y ver cómo genera código de inmediato, lo que adelanta la velocidad pero acumula el costo de corrección al final. > *Without this, most people jump straight to pasting in Claude to write code, which means more course correcting later on.* ## [00:21] Modo plan: investigación de solo lectura antes de cualquier edición El modo plan comprime exploración y planificación en un solo movimiento. Claude puede leer archivos y ejecutar búsquedas web, pero no puede escribir — Shift+Tab lo activa desde el prompt. El narrador hace una demo con una solicitud real (añadir conversión WebP a un pipeline de carga de imágenes, determinar dónde encaja, qué dependencias se necesitan y cómo abordarlo). Claude devuelve un plan; lo lees y pides revisiones si falta algo. Este es el punto más barato de todo el ciclo para cambiar de dirección, porque aún no se ha escrito nada. > *With plan mode, Claude can't edit files. It just reads files to gather research on how to tackle this implementation.* ## [01:11] Aprobar el plan y corregir el rumbo mientras Claude codifica Una vez que el plan parece correcto, Aprobar devuelve la ejecución a Claude para que avance por la lista. Eliges si las ediciones de archivos se aceptan automáticamente o te piden confirmación cada vez. Claude resolverá problemas por su cuenta, pero espera tener que intervenir — y la razón por la que el modo plan paga aquí es que el agente lleva el contexto de investigación que produjo el plan, por lo que las correcciones en vuelo aterrizan en el lugar correcto en vez de empezar desde cero. > *This is the benefit of working with plan mode because after the plan is finished, we also have the context of how it got to the results to help it guide its next decision.* ## [01:39] Hacer explícitos los criterios de éxito y dar herramientas reales a Claude Un plan sin definición de "correcto" deja a Claude adivinando. Especifica cómo luce el éxito y equipa al agente para verificarlo realmente: la extensión Claude+Chrome le permite manejar una pestaña del navegador para probar una interfaz que acaba de construir; una suite de pruebas le da algo con qué validar en cada bucle, y Claude también puede escribir los tests — pero solo si ya los has revisado como verdad de referencia. Un consejo de durabilidad: cuando Claude sigue topándose con el mismo problema, haz que persista la solución en el archivo CLAUDE.md para que deje de reaprender. > *In order for Claude to be confident in its results, it has to be clear on what it deems correct.* ## [02:24] Revisión por subagente, commit y recapitulación Antes de hacer push, lanza un revisor de código subagente sobre el diff — una segunda pasada sin apego a la implementación. Luego pide a Claude que redacte el mensaje de commit en tu estilo y lo envíe. La recapitulación reformula cada paso: Explorar aporta contexto, Planificar define el éxito, Codificar es el ida y vuelta que converge en el plan, Confirmar revisa y hace push para que puedas avanzar. > *A tip before you commit, run a sub agent code reviewer to look at your code.* ## Entities - **Anthropic Tutorial Narrator** (Person): La voz oficial de Anthropic para el curso Claude Code 101. - **Claude Code** (Software): Herramienta agentiva de codificación en terminal cuyo bucle diario recomendado es el tema de este episodio. - **Plan mode** (Feature): Modo de solo lectura activado con Shift+Tab — Claude investiga y propone un plan pero no puede editar archivos. - **Claude + Chrome extension** (Software): Permite a Claude Code manejar una pestaña de Chrome para verificar cambios en la interfaz antes de declarar una tarea completa. - **CLAUDE.md** (File): Archivo de memoria del proyecto usado aquí como destino de persistencia para las correcciones que Claude sigue reaprendiendo. - **Subagent code reviewer** (Pattern): Subagente Claude pre-commit que revisa el diff antes de que el humano haga push.
Gestión del contexto en Claude Code
El tutorial Claude Code 101 de Anthropic sobre el contexto — qué llena la ventana, cuándo se activa la compactación automática y los controles prácticos (/compact, /clear, /context, claude.md, toggles de MCP, skills, subagentes) para mantener una sesión ágil. ## [00:03] Por qué el contexto es finito y por qué importa El contexto es la memoria de trabajo de Claude: cada prompt, cada lectura de archivo, cada resultado de llamada a herramienta aterriza en la misma ventana. La ventana es grande pero finita, por lo que optimizar lo que entra es imprescindible en cuanto se comienzan sesiones de varios pasos. > *Every file it reads, every command it runs, every message you send, it all takes up space in the context window.* ## [00:39] La compactación automática y el comando /compact Al acercarse al límite, Claude Code compacta automáticamente: resume los puntos importantes y elimina los resultados ruidosos de llamadas a herramientas para liberar espacio. También puede activarse `/compact` manualmente — útil cuando se quiere margen pero se desea conservar el hilo del trabajo. Contrapartida: la compactación puede perder detalles de turnos anteriores. > *Compaction will summarize important details and remove the unnecessary tool call results and free up a lot of space in your context window.* ## [01:11] /clear y /context: empezar de nuevo y ver qué se usa Si se quiere un reinicio total sin memoria de la sesión anterior, `/clear` borra todo. Para ver dónde va realmente el espacio, `/context` muestra el tamaño total, las categorías que más consumen y un gráfico del desglose — el diagnóstico antes de decidir entre compact y clear. > *To check the state of your context, run the /context command.* ## [01:35] La regla general: compact a mitad de tarea, clear entre tareas El narrador ofrece una heurística clara: ¿aún trabajando en una funcionalidad y rozando el techo? Compact — se quiere que el historial relevante continúe. ¿Plan completado y empezando algo nuevo? Clear — la conversación anterior puede sesgar el trabajo nuevo. > *If you have finished the plan and want to start on a new feature, then clear. You don't want the previous conversation to present bias in anything new that you want to create.* ## [01:57] claude.md, especificidad del prompt y escribir menos escribiendo más Todo lo que Claude debe recordar entre sesiones pertenece a `claude.md` para que no redescubra los mismos hechos cada vez. Y paradójicamente, los prompts cortos cuestan más contexto: ante una pregunta vaga, Claude recorre el codebase con grep y razona más, lo que llena la ventana. Una o dos oraciones de especificidad recuperan mucho espacio después. > *The irony behind writing a smaller prompt is that it in the long run, it will take up more context.* ## [02:26] Servidores MCP, skills y subagentes como herramientas de contexto Los servidores MCP cargan por defecto todas las herramientas que exponen en el contexto — bien si son relevantes, caro si no, así que desactive los que no estén relacionados con el proyecto. Los skills se comportan como servidores MCP pero no vuelcan toda su superficie en el contexto. Los subagentes corren en paralelo con su propia ventana separada; para tareas de búsqueda de información ("¿dónde están los endpoints de autenticación?") puede enviar un subagente y recibir solo la respuesta, no todo el recorrido. > *Sub agents run in parallel with your main agent but has a complete separate context window.* ## [03:06] Resumen Gestionar el contexto en Claude Code marca la diferencia entre una sesión larga y productiva y una bloqueada. Use `/compact` para resumir sesiones largas, `/clear` para empezar de cero, sea específico en los prompts, compruebe `/context` para ver qué consume la ventana y delegue el trabajo de solo-respuesta a los subagentes. > *Managing context within cloud code is crucial. Use slash compact to summarize long sessions and slashclear to start fresh.* ## Entidades - **Anthropic Tutorial Narrator** (Person): La voz oficial de Anthropic para la serie de tutoriales Claude Code 101. - **Claude Code** (Software): El asistente de codificación agéntico en terminal de Anthropic cuya ventana de contexto es el tema de este episodio. - **Context window** (Concept): La memoria de trabajo de Claude — finita, llenada por prompts, lecturas de archivos y resultados de llamadas a herramientas. - **/compact** (Command): Comando slash (y disparador automático) que resume el historial y elimina el ruido de llamadas a herramientas para liberar espacio. - **/clear** (Command): Comando slash que borra la sesión por completo para un comienzo limpio en trabajo nuevo. - **/context** (Command): Comando slash que informa el tamaño total del contexto y qué categorías lo consumen. - **claude.md** (File): Archivo de memoria a nivel de proyecto que Claude lee entre sesiones para no redescubrir los mismos hechos. - **MCP servers** (Software): Proveedores de herramientas que cargan por defecto todas las herramientas expuestas en el contexto — desactivar cuando no sean relevantes. - **Skills** (Feature): Alternativa más ligera a los servidores MCP que evita cargar toda la superficie de herramientas en el contexto. - **Sub agents** (Feature): Agentes paralelos con su propia ventana de contexto usados para responder preguntas acotadas sin contaminar la ventana principal.

Por qué la IA todavía no reemplazará a los matemáticos – Terence Tao
Terence Tao reflexiona sobre el papel cambiante de la IA en las matemáticas y sostiene que, aunque automatizará muchas tareas rutinarias, no reemplazará por completo a los matemáticos humanos, sino que desplazará su enfoque hacia nuevas fronteras. Subraya el futuro de la colaboración humano-IA y la naturaleza impredecible del impacto a largo plazo de la IA en el descubrimiento científico. ## [00:10] El papel actual de la IA en las matemáticas de frontera Terence Tao explica que la IA ya está haciendo «matemáticas de frontera» que los humanos no pueden realizar, aunque se trata de un tipo distinto de frontera. Lo compara con cómo las calculadoras expandieron las capacidades matemáticas en el pasado: asumieron tareas más allá del alcance humano, pero de un modo especializado. > *En cierto modo, ya están haciendo matemáticas de frontera superinteligentes que los humanos no pueden hacer, pero es una frontera distinta a la que estamos acostumbrados.* ## [00:52] La IA como herramienta de automatización, no de reemplazo Tao predice que, en una década, la IA se ocupará de muchas tareas rutinarias que hoy realizan los matemáticos, permitiendo a los humanos concentrarse en problemas más complejos e importantes. Traza paralelismos con cambios históricos: los ordenadores automatizaron trabajos antes realizados por «computadoras humanas», y la secuenciación del genoma se automatizó sin que la genética dejara de evolucionar a nuevas escalas. > *En una década, muchas cosas que los matemáticos hacen actualmente… podrán hacerse con IA. Pero descubriremos que eso no era, en realidad, la parte más importante de lo que hacemos.* ## [02:46] El futuro de la colaboración humano-IA en matemáticas Dwarkesh Patel pregunta sobre la posibilidad de que la IA resuelva de forma autónoma los Problemas del Milenio. Terence Tao cree que el «híbrido humano más IA» dominará las matemáticas durante mucho más tiempo, pues la IA actual aún carece de todos los ingredientes necesarios para reemplazar por completo las tareas intelectuales y funciona más bien como una herramienta complementaria. > *Creo, de verdad, que ese híbrido humano más IA va a dominar las matemáticas durante mucho más tiempo.* ## [03:43] Impacto impredecible en el descubrimiento científico Tao reconoce que, si bien la IA acelerará la ciencia y los nuevos descubrimientos, también existe la posibilidad de que inhiba ciertos tipos de progreso al «destruir la serendipia». Concluye que el impacto futuro de la IA en el descubrimiento científico es altamente impredecible. > *Es posible que, al destruir de algún modo la serendipia, acabemos inhibiendo ciertos tipos de progreso.* ## Entidades - **Terence Tao** (Persona): invitado, matemático destacado de nuestra época. - **Dwarkesh Patel** (Persona): presentador del pódcast. - **IA (AI)** (Concepto): inteligencia artificial, discutida en su papel en las matemáticas y el descubrimiento científico. - **Mathematica / Wolfram Alpha** (Software): herramientas de cálculo mencionadas como ejemplos de automatización en matemáticas. - **Problemas del Milenio (Millennium Prize Problems)** (Concepto): siete problemas matemáticos no resueltos, con un premio de un millón de dólares por cada solución.
Uso eficaz de los subagentes
Los subagentes son poderosos cuando el trabajo intermedio no pertenece al hilo principal, pero delegar sin criterio empeora las cosas. Este tutorial traza la línea entre la delegación útil (investigación, revisión de código, prompts de sistema especializados) y los antipatrones habituales (afirmaciones de persona experta, pipelines secuenciales, test runners) que consumen contexto y hacen perder información realmente necesaria. ## [00:03] Introducción: cuándo los subagentes ayudan o perjudican La serie ha cubierto hasta aquí la creación y el diseño de subagentes. Este último episodio pasa a la pregunta del despliegue: ¿qué tareas se benefician genuinamente de lanzar un agente separado y cuáles salen perdiendo? La respuesta se reduce a una sola prueba: ¿el trabajo intermedio importa al hilo principal? Cuando la exploración está separada de la ejecución, los subagentes valen la pena. Cuando cada paso depende de lo que descubrió el anterior, el coste del traspaso te cobra exactamente los detalles que necesitas. > *"Simply put, the difference comes down to whether the intermediate work matters to your main thread."* ## [00:32] Tareas de investigación: mantener la exploración aislada El rastreo de autenticación es un ejemplo concreto. El hilo principal necesita saber dónde ocurre la validación JWT, no los doce archivos leídos por el camino. Un subagente de investigación puede escanear todo el repositorio, seguir las llamadas a funciones entre archivos y devolver una respuesta única y precisa: la validación JWT está en middleware/auth.js en la línea 42, llamada desde route/api.js. Toda esa exploración queda encerrada en el contexto del subagente. El hilo principal recibe la conclusión y avanza sin que el historial de búsqueda llene su ventana. > *"Your main thread receives JWT validation happens in middleware/auth.js at line 42, called from the Express router and route/api.js, or something like that."* ## [01:15] Subagentes de revisión de código: retroalimentación con ojos frescos Claude revisando código que ayudó a escribir tiene un problema de sesgo: estuvo presente en cada decisión y no puede detectar fácilmente lo que parece incorrecto desde fuera. Un subagente revisor esquiva esto por completo: solo ve el diff y los archivos modificados, sin ningún historial de cómo evolucionó el código. Ese estado en blanco crea un segundo beneficio. Los criterios de revisión propios del proyecto —convenciones de nombres, patrones de seguridad, reglas arquitectónicas— pueden codificarse una vez en el prompt de sistema del subagente y aplicarse de forma consistente, sin que el hilo principal tenga que recordarlos turno a turno. > *"A reviewer sub agent sees the changes in a separate context. It runs get diff, reads the modified files, and applies its specialized review criteria without the history of how the code was written."* ## [01:59] Prompts de sistema personalizados: redacción y estilos El prompt por defecto de Claude Code está optimizado para una salida concisa y técnica, exactamente lo contrario de lo que se necesita para una landing page o un email de marketing. Un subagente de redacción recibe instrucciones completamente distintas sobre tono, audiencia y estructura, produciendo un resultado que los ajustes por defecto del hilo principal nunca generarían. La misma lógica aplica al CSS. Un subagente de estilos que menciona los archivos de tu design system carga automáticamente variables de color, convenciones de espaciado y patrones de componentes en su contexto antes de escribir una sola línea, garantizando que cada decisión de estilo refleje el sistema real y no suposiciones razonables. > *"Claude Code's default prompt tends towards concise, technical writing, which really isn't what you want for a landing page or email campaign, unless you want to put your customers to sleep."* ## [02:57] Antipatrones: afirmaciones de experto, pipelines y test runners Tres patrones empeoran las cosas de forma sistemática. Primero, los prompts de persona —«Eres un experto en Python» o «Eres un especialista en Kubernetes»— no aportan nada, porque Claude ya tiene ese conocimiento. Lanzar un subagente solo para etiquetarlo como experto desperdicia el coste de la aislación sin ofrecer nada que el hilo principal no pudiera hacer. Segundo, los pipelines secuenciales se rompen cuando los pasos no son verdaderamente independientes. Un flujo de tres agentes —reproducir un bug, depurarlo, corregirlo— suena limpio pero falla en la práctica: el agente de depuración necesita el contexto en vivo del agente de reproducción, no un resumen comprimido de él. Tercero, los subagentes test runner ocultan información activamente. Cuando los tests fallan, necesitas la salida bruta para diagnosticar qué salió mal. Un subagente que solo devuelve «test failed» te obliga a escribir scripts de depuración adicionales para recuperar detalles que la salida directa habría mostrado de inmediato. > *"A sub-agent that returns a test failed forces you to create additional debug scripts to get details that would have been visible in direct output."* ## [04:10] Resumen de la serie y la heurística de decisión clave A lo largo de la serie: los subagentes son hilos aislados creados con /agents, diseñados con salidas estructuradas y descripciones específicas. Úsalos para investigación, revisión de código y tareas que necesiten un prompt de sistema personalizado. Evítalos para afirmaciones de persona experta, pipelines dependientes de múltiples pasos y ejecución de tests. Todo el marco se reduce a una pregunta: ¿importa el trabajo intermedio? Si la respuesta es no, delégalo. > *"The key question, does the intermediate work matter? If not, then delegate it."* ## Entidades - **Anthropic Tutorial Narrator** (Persona): presentador de la serie de tutoriales de subagentes de Claude Code, Anthropic - **Claude Code** (Software): asistente de programación IA de Anthropic; el entorno en el que se crean y orquestan los subagentes - **Subagent** (Concepto): hilo de Claude aislado lanzado desde el contexto principal, que devuelve un resumen comprimido en lugar de exponer su contexto de trabajo completo - **JWT (JSON Web Token)** (Concepto): usado como ejemplo práctico para un subagente de investigación que rastrea la lógica de autenticación en un repositorio - **System prompt** (Concepto): conjunto de instrucciones por subagente que habilita un comportamiento especializado distinto al prompt por defecto de Claude Code - **Anthropic** (Organización): desarrolladora de Claude y de la serie de tutoriales de subagentes de Claude Code
Crear un subagente
Claude Code incluye subagentes integrados, pero los subagentes personalizados permiten incorporar comportamientos especializados para tareas concretas. Este tutorial crea un subagente de revisión de código desde cero, recorriendo el comando `/agents`, la selección de herramientas, la elección del modelo y los campos de configuración que controlan cuándo y cómo Claude delega. ## [00:03] Qué son los subagentes personalizados Claude Code viene con subagentes integrados, pero también puedes crear los tuyos propios especializados en tareas particulares. Un subagente personalizado es un archivo Markdown con front matter YAML: el front matter le dice a Claude cuándo enrutar hacia ese agente y qué capacidades tiene, mientras que el cuerpo Markdown es el prompt de sistema bajo el que ejecuta el subagente. > *"Custom sub aents are markdown files with YAML front matter. These markdown files contain configuration that helps claude understand when to use the sub aent and provides directions to the sub aent itself."* ## [00:28] Crear un subagente con /agents El comando `/agents` abre el panel de gestión de agentes. Al seleccionar "Crear nuevo agente" se plantean dos preguntas: el alcance (proyecto actual o compartido en todos los proyectos de la máquina) y el método de generación. La opción recomendada es dejar que Claude genere el agente automáticamente: en el tutorial, el narrador escribe en lenguaje natural una solicitud para un subagente que revise calidad de código y problemas de seguridad, y Claude se encarga del resto. > *"Now, the easiest way to create a sub agent is with the / agents command. Next, you can create a sub agent manually, but we recommend using claw code to automatically generate it for you."* ## [00:56] Configurar herramientas, modelo y color Antes de que Claude genere el archivo, eliges a qué herramientas puede acceder el subagente. Un agente de revisión de código no necesita estrictamente las herramientas de edición, pero dejar la ejecución habilitada le permite inspeccionar los cambios pendientes con mayor facilidad. Tras las herramientas, se elige el modelo: haiku para velocidad, opus para profundidad, sonnet como punto intermedio. La última elección es un color que aparece en la interfaz para identificar el subagente de un vistazo. > *"Now, given that our sub agent is only responsible for reviewing code, you might decide to disallow tools for editing, but I'll leave an execution to allow the sub agent to more easily identify pending changes."* ## [01:43] Entender el archivo de configuración El archivo generado se guarda en el proyecto en la ruta que aparece en la ventana de resumen. Cuatro campos son los más importantes. `name` es el identificador único; puedes referenciarlo escribiendo `@agent-code-quality-reviewer` en un mensaje. `description` es lo que Claude lee para decidir si delega; debe ocupar una sola línea (los caracteres `\n` escapados son literales). Añadir "proactively" a la descripción hace que Claude recurra al agente con más frecuencia; incluir conversaciones de ejemplo mejora la precisión del enrutamiento. `tools` refleja los accesos concedidos durante la generación, pero puede editarse directamente en el archivo. > *"If you want Claude to use the sub agent automatically more often, add in the word proactively to the description."* ## [02:41] El prompt de sistema y cómo lo usa Claude El campo `model` acepta `haiku`, `sonnet`, `opus` o `inherit`; con `inherit`, el subagente usa el mismo modelo que la conversación principal. Todo lo que aparece después del front matter es el prompt de sistema: guía al subagente en su tarea y le indica cómo devolver los resultados al agente principal. > *"The system prompt will provide guidance to the sub agent, helping it understand how to complete its task and how it should return information back to the main agent."* ## [03:15] Probar tu subagente Tras guardar la configuración, realiza algunos cambios en el código y pídele a Claude que los revise. Si el subagente no se activa cuando se espera, el campo `description` es lo primero que hay que ajustar: ejemplos más específicos afinan el criterio de Claude para saber cuándo delegar. > *"If the sub agent isn't being used when you expect, check your description. Adding more specific examples helps Claude understand when to delegate."* ## Entidades - **Anthropic Tutorial Narrator** (Persona): único presentador de este episodio; conduce la serie de tutoriales Claude Code subagents en el canal oficial de YouTube de Anthropic - **Claude Code** (Software): asistente de codificación IA de Anthropic; admite tanto subagentes integrados como subagentes personalizados creados por el usuario - **Custom subagent** (Concepto): archivo Markdown con front matter YAML que configura Claude Code para delegar tareas específicas a una instancia de agente especializado - **/agents command** (Concepto): punto de entrada de la interfaz de Claude Code para crear y gestionar subagentes; con alcance de proyecto o global - **System prompt** (Concepto): cuerpo Markdown del archivo de configuración de un subagente; proporciona al subagente instrucciones de tarea y formato de salida en tiempo de ejecución - **Anthropic** (Organización): creador de Claude y de la plataforma Claude Code
Cómo diseñar subagentes efectivos
Este tutorial de la serie Claude Code de Anthropic cubre cuatro patrones concretos que separan a los subagentes confiables de los que se desvían, se detienen o modifican archivos que no deberían tocar. El narrador recorre cada patrón usando un subagente de revisión de código y uno de búsqueda web como ejemplos continuos, mostrando exactamente qué parámetros ajustar y por qué. ## [00:03] Controlar el comportamiento del subagente con nombre y descripción Cada mensaje enviado al agente principal del contexto incluye el nombre y la descripción de cada subagente registrado en el prompt del sistema. Esto significa que la descripción cumple una doble función: indica al orquestador *cuándo* lanzar el subagente y proporciona la plantilla que usa al escribir el prompt de entrada. El tutorial lo demuestra con un subagente de revisión de código. En la configuración original, el orquestador escribe un prompt genérico que le dice al subagente que llame él mismo a `git diff`. Cambiar la descripción a "debes indicarle al agente exactamente qué archivos quieres que revise" transfiere la responsabilidad de seleccionar los archivos al orquestador; la siguiente ejecución produce un prompt de entrada notablemente más específico. El mismo mecanismo funciona con subagentes de búsqueda web: añadir "devuelve fuentes que se puedan citar" a la descripción hace que el hilo principal incluya esa instrucción automáticamente al delegar. > *"If you want to better control when the main agent launches a sub agent automatically, you should modify the name and description."* ## [01:41] Definir formatos de salida El narrador identifica el formato de salida como la mejora individual con mayor impacto. Sin uno, el subagente no tiene una señal clara de cuándo ha hecho suficiente: sigue ejecutándose, acumula contexto y consume tokens. Un formato de salida estructurado crea un punto de parada natural. El subagente sabe que ha terminado cuando los campos obligatorios están completos. En la práctica, esto significa añadir un esquema explícito —un bloque de resumen, una lista de hallazgos, un campo de estado— directamente al prompt del sistema del subagente. > *"Without a defined output format, sub agents struggle to decide when enough research has been done and they tend to run much much longer than sub agents that are given an output format."* ## [02:04] Reportar obstáculos en el resumen Cuando un subagente resuelve un problema —un conflicto de dependencias, un comando que necesita flags inesperados, una peculiaridad del entorno— el hilo principal necesita esa información o chocará con la misma pared en el siguiente paso. La solución es exigir el reporte de obstáculos dentro del propio formato de salida. El narrador enumera las categorías que siempre deben incluirse: obstáculos encontrados, problemas de configuración, soluciones alternativas descubiertas, comandos que requirieron flags o configuración especial, e importaciones o dependencias que causaron problemas. Incluir estas categorías en el esquema de salida obligatorio garantiza que el hilo principal herede los descubrimientos del subagente en lugar de redescubrirlos desde cero. > *"Otherwise, the main thread has to rediscover the same solutions, obstacles encountered, any setup issues, workarounds discovered or environment quirks, commands that needed special flags or configuration, dependencies or imports that cause problems."* ## [02:42] Limitar el acceso a herramientas por rol El acceso a herramientas no es solo un control de seguridad: es también una herramienta de claridad. Un subagente de solo lectura con únicamente `glob`, `grep` y `read` no puede modificar archivos por accidente, lo que hace que su rol sea inequívoco para cualquiera que lea la configuración. El narrador asigna tres niveles de acceso a tres roles de subagente: el subagente de investigación recibe acceso de solo lectura porque explorar el código base no requiere escritura; el revisor obtiene `bash` para `git diff` pero sin herramientas de edición de archivos; solo los subagentes encargados explícitamente de modificar código —como uno que aplica actualizaciones de CSS— reciben `edit` y `write`. Con varios subagentes en juego, la lista de herramientas se convierte en un resumen legible por máquina de lo que se supone que hace cada uno. > *"Only give edit and write to sub agents that should actually change your code, like a styling agent applying CSS updates."* ## [03:27] Los cuatro patrones de un subagente efectivo El tutorial cierra con un resumen en una sola oración de los cuatro patrones: salida estructurada, reporte de obstáculos, descripciones específicas y acceso restringido a herramientas. Cada patrón refuerza a los demás: las descripciones precisas reducen la ambigüedad en los prompts de entrada, los formatos de salida crean puntos de parada, el reporte de obstáculos preserva el contexto entre límites de agentes, y el acceso mínimo a herramientas evita efectos secundarios que agudizarían cualquier ambigüedad restante. > *"So effective sub agents use structured output report obstacles have specific descriptions and limit tool access."* ## Entidades - **Anthropic Tutorial Narrator** (Persona): presentador de la serie de tutoriales de subagentes de Claude Code, en representación de Anthropic - **Claude Code** (Software): herramienta de codificación agéntica de Anthropic que orquesta subagentes para completar tareas de ingeniería en múltiples pasos - **Subagent** (Concepto): instancia especializada de Claude lanzada por un agente orquestador, con su propio prompt de sistema, acceso a herramientas y prompt de entrada - **Formato de salida** (Concepto): esquema obligatorio definido en el prompt del sistema de un subagente que crea una condición de parada y estructura la información devuelta al hilo principal - **Reporte de obstáculos** (Concepto): patrón que requiere que los subagentes informen de soluciones alternativas, problemas de dependencias y particularidades del entorno en su salida, para que el orquestador no tenga que redescubrirlos - **Restricción del acceso a herramientas** (Concepto): limitar cada subagente a únicamente las herramientas que requiere su rol — solo lectura para investigación, bash para revisión, edit/write solo para agentes que deben modificar archivos - **Anthropic** (Organización): creador de Claude y de la plataforma de codificación agéntica Claude Code
¿Qué son los subagentes?
Los subagentes son asistentes especializados a los que Claude Code puede delegar tareas — cada uno opera en su propia ventana de contexto aislada, completa el trabajo de forma autónoma y devuelve un resumen concreto mientras se descarta todo el rastro intermedio. Este tutorial de dos minutos de Anthropic explica por qué ese aislamiento es clave para mantener usable la ventana de contexto principal, ilustra el tradeoff con un escenario real de exploración de código y enumera los subagentes integrados que incluye Claude Code hoy. ## [00:03] Qué son los subagentes Un subagente se ejecuta en su propia ventana de contexto de conversación, inicializada con un system prompt personalizado que tú defines. El agente principal (Claude Code en el hilo principal) le pasa al subagente una descripción de la tarea según lo que pediste. El subagente la resuelve de forma autónoma y devuelve un resumen al hilo principal, mientras todo el trabajo intermedio queda aislado. > *"Sub-agents are specialized assistants that Claude can delegate tasks to."* El punto de diseño clave: cuando el subagente termina, su hilo de conversación completo se descarta. Solo el resumen devuelto regresa a la conversación principal. ## [00:24] Gestión de la ventana de contexto Cada llamada a herramientas que Claude hace en el hilo principal — lecturas de archivos, búsquedas, trazas de funciones — se acumula en la ventana de contexto principal. En una sesión larga, eso se llena rápido. Los subagentes existen precisamente para externalizar tareas discretas de investigación o acción sin que ese coste recaiga en la ventana principal. > *"Each sub-agent runs in its own conversation contacts window with a custom system prompt that you define."* El tradeoff es explícito: la ventana principal gana contexto limpio, pero pierde visibilidad sobre cómo llegó el subagente a sus conclusiones y qué descubrió en el camino. Obtienes la respuesta, no la traza de razonamiento. ## [01:13] Un ejemplo concreto: el sistema de pagos Imagina que usas Claude Code para descubrir qué servicio gestiona los reembolsos en un codebase desconocido. Sin subagente, Claude podría leer 15 archivos, ejecutar varias búsquedas y recorrer múltiples llamadas a funciones — y todo eso llena la ventana de contexto principal aunque solo necesitabas un dato. > *"With a sub-agent, you get the answer without the journey."* El subagente explora el codebase, encuentra la respuesta y devuelve un resumen concreto, manteniendo limpio tu contexto principal. La visibilidad perdida es el coste: no verás qué archivos leyó ni qué trazas siguió para llegar ahí. ## [02:00] Los subagentes integrados de Claude Code Claude Code incluye tres subagentes integrados listos para usar de inmediato: - **Subagente de uso general** — para tareas de varios pasos que requieren tanto exploración como acción. - **Subagente de exploración** — búsqueda rápida en codebases sin la sobrecarga de un ciclo de tarea completo. - **Subagente de planificación** — se ejecuta en el modo plan para investigar y analizar el codebase antes de presentarte un plan. > *"And you can also create your own sub-agents with custom system prompts and tool access."* Más allá de estos tres, puedes definir subagentes personalizados con sus propios system prompts y listas de herramientas, adaptados a flujos de trabajo específicos. ## [02:30] Cuándo usar subagentes Los subagentes son rentables cuando tienes una pregunta o tarea discreta y autocontenida que, de otro modo, volcaría mucho contexto intermedio en tu ventana principal. > *"Sub-agents like Claude Code break work into focused pieces, keep your main context window clean, and bring back just what you need, whether you're using the built-in ones or creating your own."* Son más valiosos en sesiones largas de Claude Code donde la presión sobre la ventana de contexto se acumula — delegar una subtarea a un subagente en lugar de dejar que se extienda por el hilo principal prolonga directamente la efectividad de la sesión. ## Entidades - **Anthropic Tutorial Narrator** (Persona): narrador de la serie de tutoriales "Claude Code subagents" producida por Anthropic - **Claude Code** (Software): el asistente de codificación agéntico de Anthropic; el entorno anfitrión en el que operan los subagentes - **Claude** (Software): el modelo de IA subyacente que impulsa Claude Code y sus subagentes - **Sub-agent** (Concepto): un asistente especializado al que Claude Code delega tareas, ejecutándose en una ventana de contexto aislada con su propio system prompt - **Context window** (Concepto): el buffer finito de tokens que contiene todo el historial de conversación, llamadas a herramientas y resultados; los subagentes evitan que se llene con trabajo intermedio - **General-purpose sub-agent** (Software): subagente integrado de Claude Code para tareas de exploración y acción en varios pasos - **Explore sub-agent** (Software): subagente integrado de Claude Code optimizado para búsqueda rápida en codebases - **Plan sub-agent** (Software): subagente integrado de Claude Code que investiga el codebase en el modo plan antes de presentar un plan - **Anthropic** (Organización): creador de Claude y Claude Code; productor de esta serie de tutoriales

Terence Tao – Cómo usa la IA el mejor matemático del mundo
Tao y Dwarkesh usan el descubrimiento del movimiento planetario de Kepler como lente para examinar qué está cambiando realmente la IA en la ciencia. Tao argumenta que la generación de hipótesis ahora es casi gratuita, por lo que el cuello de botella se desplaza hacia la evaluación, la revisión por pares y la prueba del tiempo. Las IA actuales ganan en amplitud (prueban cada técnica estándar en cada problema) mientras los humanos ganan en profundidad (construyen acumulativamente sobre el progreso parcial), así que las configuraciones híbridas dominarán la matemática al menos durante otra década. ## [00:00] Kepler era un LLM de alta temperatura Tao recuenta cómo llegó Kepler a las tres leyes del movimiento planetario. Kepler partió de una teoría errónea pero bella —sólidos platónicos inscritos entre las órbitas de los planetas— y solo la abandonó tras procesar durante años las observaciones a simple vista robadas a Tycho Brahe. Las elipses, la ley de las áreas iguales y la relación cubo-cuadrado surgieron de un análisis de datos que duró una década, con la explicación de Newton un siglo después. La lectura de Dwarkesh: Kepler se parece a un LLM de alta temperatura que recorre relaciones aleatorias contra un conjunto de datos verificable. Tao coincide en la mecánica pero matiza el cuello de botella. La generación de ideas ya era barata: Kepler no carecía de teorías. Lo que necesitaba eran los datos de Brahe, un orden de magnitud mejores, y la paciencia para descartar las ideas que los datos refutaban. > *Pero como tú dices, tiene que ir acompañado de una cantidad igual de verificación, de lo contrario es basura.* ## [11:44] ¿Cómo sabríamos si hay un nuevo concepto unificador entre montones de basura generada por IA? Tao: si la IA ha llevado la generación de ideas a un coste casi nulo, la revisión por pares y la prueba del tiempo se convierten en la nueva restricción. Las revistas ya se ahogan en envíos generados por IA. El valor de cualquier idea depende de lo que la ciencia posterior haga con ella —Copérnico era menos preciso que Ptolomeo hasta que Kepler completó el cuadro—, así que la evaluación es difícil de automatizar desde dentro del momento. Dwarkesh pregunta cómo identificaría la ciencia un concepto unificador al estilo Bell Labs —el bit de Shannon, el transformer— enterrado entre millones de papers mediocres. La respuesta de Tao apunta a la parte que quizás siga siendo humana: los científicos no solo producen teorías, construyen relatos que convencen a otros científicos de invertir años en el seguimiento. La prosa de Darwin hizo el trabajo que las ecuaciones latinas de Newton no hacían. > *La IA ha reducido el coste de la generación de ideas a casi cero, de manera muy similar a como internet redujo el coste de la comunicación a casi cero.* ## [26:10] El excedente deductivo Tao sobre la señal inexplorada en los datos existentes. La astronomía ha sido la disciplina que extrae el máximo de información del mínimo de datos durante siglos, lo que también explica por qué los fondos cuantitativos contratan preferentemente a doctorados en astronomía. Pone un ejemplo favorito: investigadores midieron con qué frecuencia los científicos realmente leían los papers que citaban rastreando qué erratas se propagaban a través de las cadenas de citas. Propone aplicar el mismo enfoque sociológico de la ciencia al propio progreso de la IA: analizar patrones de citas, menciones en conferencias y otras huellas para detectar si un resultado constituyó realmente un avance, en lugar de esperar a que la prueba del tiempo lo haga lentamente. > *Una conclusión fue que el excedente deductivo en muchos campos podría ser mucho mayor de lo que la gente cree.* ## [30:31] El sesgo de selección en los descubrimientos de IA publicados La IA ha resuelto aproximadamente 50 de los ~1.100 problemas de Erdős y luego se ha estancado. Tao explica el efecto de selección: esos 50 tenían literatura casi nula —bastaba con una técnica oscura más un resultado conocido—, y las herramientas de IA son excelentes para "probar cada combinación estándar." Cuando el problema tiene el 80% del trabajo hecho por métodos existentes, la IA lo supera. Cuando necesita una técnica genuinamente nueva, las herramientas se detienen, y la tasa de éxito por problema en los barridos sistemáticos es del 1-2%. La metáfora de Tao: las herramientas de IA son robots saltadores sueltos en una cordillera, en la oscuridad. Pueden superar muros bajos que los humanos no alcanzan, pero no pueden agarrar un saliente, quedarse ahí y ascender desde el progreso parcial. La lectura optimista —una vez que las IA alcanzan un nivel determinado, puedes ejecutar un millón de copias en paralelo sobre un millón de problemas, algo que ninguna comunidad humana puede hacer— es también la razón estructural por la que la ciencia necesita nuevos paradigmas que realmente aprovechen la amplitud. > *Destacan en amplitud, y los humanos destacan en profundidad, al menos los expertos humanos.* ## [46:43] La IA hace los papers más ricos y amplios, pero no más profundos Tao sobre su propio modo de trabajo: los papers ahora incluyen más código, más figuras y revisiones bibliográficas más profundas, porque las tareas auxiliares se han abaratado unas 5 veces. El núcleo real —resolver la parte más difícil de un problema— sigue ocurriendo con papel y bolígrafo. Dudaría en llamarse "2 veces más productivo" porque la métrica no es unidimensional; lo que cambió es el tipo de paper que escribe, no la tasa a la que responde la pregunta con la que comenzó. La distinción entre astucia e inteligencia llega al mismo punto. Cuando dos humanos colaboran en un problema de matemáticas, cada prototipo fallido se convierte en un punto de apoyo para el siguiente. Con las IA actuales, una nueva sesión olvida lo que descubrió la anterior. Falta el paso de elevación acumulativa: solo existe la prueba y error bruta y, eventualmente, la absorción en la siguiente fase de entrenamiento. > *Ha hecho los papers más ricos y amplios, pero no necesariamente más profundos.* ## [53:00] Si la IA resuelve un problema, ¿pueden los humanos extraer comprensión de eso? ¿Podría una IA demostrar la hipótesis de Riemann en Lean y dejarnos sin comprensión? Tao no está preocupado. Lean tiene la propiedad de que cualquier prueba puede descomponerse de forma atómica: cada lema puede inspeccionarse, ablacionarse y verificarse de forma aislada. Así que incluso una prueba generada de 3.000 líneas se convierte en materia prima: otras IA pueden refactorizarla para ganar elegancia, otros humanos pueden extraer el contenido conceptual, y el artefacto sigue siendo útil aunque la derivación original fuera opaca. Predice toda una profesión de matemáticos cuyo trabajo sea desmontar grandes pruebas generadas por Lean y encontrar las ideas dentro de ellas —una especie de arqueología de pruebas, con juicio humano y herramientas de ablación por IA. > *Sacarás mucho más partido de la interacción de los humanos colaborando con estas herramientas.* ## [59:20] Necesitamos un lenguaje semiformal para la manera en que los científicos realmente se hablan entre sí Dwarkesh pregunta cómo sería un lenguaje semiformal para estrategias matemáticas —en contraposición a pruebas matemáticas—. Tao recorre la pregunta a través del teorema de los números primos de Gauss —la primera conjetura estadística importante de las matemáticas, derivada de datos brutos antes de que existiera ninguna prueba— y de la conjetura de los primos gemelos, en la que los matemáticos creen porque el modelo aleatorio de los primos la predice. Las matemáticas tienen tanto pruebas rigurosas como heurísticas rigurosas; solo el lado de las pruebas se ha formalizado en algo que Lean puede verificar. El motivo por el que el lado heurístico no se ha formalizado: cualquier evaluador comprobable mediante RL se convierte en objetivo de explotación, y la parte subjetiva de "este argumento es convincente" no admite aún un marco que pueda ser atacado. Tao desearía contar con una manera de evaluar la generación de conjeturas y la selección de estrategias a escala, posiblemente ejecutando IA pequeñas en universos matemáticos de juguete y observando qué estrategias emergen. > *Hay algún aspecto subjetivo de la ciencia que no sabemos cómo capturar de una manera que nos permita insertar la IA en él de forma útil.* ## [69:48] Cómo ocupa su tiempo Terry Tao sobre cómo absorbe nuevos subcampos. Se ubica como un zorro en el sentido de Berlin —sabe un poco de todo, y ocasionalmente se vuelve erizo cuando es necesario. El motor es una obsesión completista: si otro matemático puede demostrar un resultado con una técnica que él no conoce, tiene que descubrir cuál es el truco. (Tuvo que dejarse los videojuegos por la misma razón.) La colaboración con otros matemáticos es el vehículo principal, y escribir en su blog es el apoyo de memoria que desarrolló después de perder repetidamente argumentos seis meses después de haberlos derivado. En su agenda, Tao deja espacio deliberado para la serendipia. Detestaria optimizar su tiempo tan exhaustivamente que nunca asistiera a una reunión fuera de su zona de confort. El año que pasó en el Instituto de Estudios Avanzados confirmó la trampa: dos semanas de investigación pura fueron excelentes, luego se le agotó la inspiración. El descubrimiento accidental en el siguiente estante de la biblioteca, la conversación casual en el pasillo y la reunión a la que asistió a regañadientes estaban haciendo más trabajo del que parecía. > *Esas interacciones fortuitas puede que no parezcan óptimas, pero en realidad son muy importantes.* ## [77:05] Los híbridos humano-IA dominarán la matemática por mucho más tiempo ¿Cuándo hará la IA las matemáticas por sí sola? Tao lo reencuadra: la IA ya hace matemáticas que los humanos no pueden hacer, desde las calculadoras, solo en una frontera diferente. En aproximadamente una década espera que gran parte de lo que actualmente hacen los estudiantes de posgrado —aplicar técnicas estándar, revisar la literatura— pase a la IA, pero el campo subirá de nivel como lo hizo cuando los sistemas de álgebra computacional absorbieron la integración simbólica. La genética no terminó cuando la secuenciación se abarató; escaló hasta los ecosistemas. Las matemáticas harán lo mismo. Su consejo a los estudiantes que ingresan hoy en matemáticas: asumir el cambio, pero obtener las credenciales a la manera tradicional, porque por ahora no hay sustituto para trabajar las matemáticas por el camino clásico. Al mismo tiempo, ser lo suficientemente adaptable para utilizar modos de investigación completamente nuevos a medida que aparezcan, incluidos los que aún no existen. El hecho inusual es que con herramientas de IA y Lean, un estudiante de secundaria puede contribuir hoy a la investigación matemática real, algo que no era posible hace cinco años. > *Creo que los híbridos de humanos más IA dominarán las matemáticas por mucho más tiempo.* ## Entidades - **Terence Tao** (Persona): Medallista Fields (2006), matemático de la UCLA, escribe con regularidad sobre el papel de la IA en la investigación matemática. - **Dwarkesh Patel** (Persona): Presentador del Dwarkesh Podcast; entrevistas en profundidad sobre IA, ciencia y tecnología. - **Johannes Kepler** (Persona): Astrónomo (1571-1630) que derivó las tres leyes del movimiento planetario a partir de las observaciones de Tycho Brahe. - **Tycho Brahe** (Persona): Astrónomo danés de observación a simple vista cuyas décadas de observaciones planetarias fueron el conjunto de datos que Kepler necesitaba. - **Lean** (Software): Asistente de pruebas en el que las demostraciones matemáticas se formalizan y pueden verificarse, descomponerse y ablacionarse de forma atómica. - **Erdős problems** (Concepto): Los aproximadamente 1.100 problemas abiertos planteados por Paul Erdős; la IA ha resuelto ~50, casi todos con literatura previa casi nula. - **El excedente deductivo** (Concepto): La idea de que los datos existentes ya codifican mucho más conocimiento derivable del que se ha extraído, con la astronomía como modelo. - **Hipótesis de Riemann** (Concepto): Conjetura no resuelta sobre la distribución de los números primos; el caso de prueba para saber si una demostración por IA avanzaría la comprensión matemática humana.
¿Qué son los skills?
Los skills de Claude Code son archivos Markdown reutilizables que codifican conocimiento especializado una sola vez. Claude los activa automáticamente cuando una solicitud encaja, sin que el usuario tenga que repetir instrucciones ni escribir un comando slash. Este tutorial de tres minutos explica qué son los skills, dónde viven, en qué se diferencian de los archivos CLAUDE.md y qué señal indica que ya es hora de escribir uno. ## [00:03] El problema de repetición que resuelven los skills Cada vez que explicas los estándares de código de tu equipo, vuelves a describir cómo quieres que se estructure el feedback de una PR o recuerdas a Claude el formato de commit que prefieres, te estás repitiendo. El narrador encadena tres ejemplos para nombrar con precisión el punto de fricción que los skills eliminan. > *"Every time you explain your team's coding standards to Claude, you're repeating yourself."* ## [00:20] Qué es un skill y cómo lo elige Claude Un skill es un archivo Markdown que le enseña a Claude cómo hacer algo, una sola vez. Claude almacena la instrucción y la aplica automáticamente cada vez que la situación lo requiere. En Claude Code, ese archivo se llama SKILL.md. El campo description dentro del archivo es el mecanismo clave: cuando le pides a Claude que revise una PR, compara tu solicitud con todas las descripciones de skills disponibles y activa la que corresponde. > *"Claude reads your request, compares it to all available skill descriptions, and activates the ones that match."* ## [01:05] Dónde guardar los skills: personal o de proyecto Los skills tienen dos ubicaciones según quién los necesite. Los skills personales van en `~/.claude/skills` y te siguen de proyecto en proyecto: estilo de commit, formato de documentación, cómo te gusta que te expliquen el código. Los skills de proyecto van en `.claude/skills` dentro de la raíz del repositorio; cualquiera que clone el repo los obtiene automáticamente. Ahí es donde viven los estándares del equipo: directrices de marca, fuentes y colores preferidos para el diseño web. > *"Anyone who clones the repository gets these skills automatically."* ## [01:42] Skills vs CLAUDE.md: automáticos y eficientes en contexto Claude Code ofrece varias capas de personalización, y los skills ocupan un lugar propio. Los archivos CLAUDE.md se cargan en cada conversación de forma incondicional, lo que los hace ideales para reglas como "usar siempre el modo estricto de TypeScript". Los skills se cargan bajo demanda, solo cuando coinciden con la solicitud actual, y en ese momento solo el nombre y la descripción entran al contexto. El cuerpo completo del skill se carga únicamente al activarse. Así, la checklist de revisión de PR no ocupa el contexto mientras depuras, y solo aparece cuando de verdad pides una revisión. Los comandos slash requieren escribirlos; los skills, no. > *"Skills are unique because they're automatic and task-specific."* ## [02:27] Cuándo escribir un skill Los skills funcionan mejor con conocimiento especializado ligado a tareas concretas: los estándares de revisión de código del equipo, formatos de commit, directrices de marca. La regla final es directa y práctica: si te encuentras explicándole lo mismo a Claude una y otra vez, eso es un skill esperando ser escrito. > *"If you find yourself explaining the same thing to Claude repeatedly, well, that's a skill waiting to be written."* ## Entidades - **Anthropic Tutorial Narrator** (Persona): narrador y presentador de la serie de tutoriales de Claude Code skills - **Claude Code** (Software): asistente de codificación AI de Anthropic; el entorno de ejecución donde los skills se descubren y aplican - **SKILL.md** (Concepto): el archivo Markdown que define un skill — contiene un nombre, una descripción e instrucciones para Claude - **CLAUDE.md** (Concepto): archivo de instrucciones a nivel de proyecto o global que se carga en cada conversación de Claude Code de forma incondicional, en contraste con los skills - **Anthropic** (Organización): creador de Claude y Claude Code
Compartir skills
Un skill de revisión de PR que usa un solo ingeniero resulta útil; ese mismo skill desplegado en todo el equipo estandariza la revisión de código y crea una experiencia coherente en toda la organización. Este tutorial recorre cuatro métodos de distribución concretos — commits en el repositorio, plugins, configuración empresarial gestionada y sub-agentes personalizados — y explica con precisión cuándo aplicar cada uno. La sección de sub-agentes tiene un matiz que pasa fácilmente desapercibido: los sub-agentes no heredan los skills del hilo principal de forma automática, y los agentes integrados no pueden acceder a ellos en absoluto. ## [00:01] Por qué compartir multiplica el valor de los skills Un skill que permanece en manos de un solo desarrollador cumple su función. El mismo skill extendido a un equipo consolida estándares, elimina la variación individual y hace que cada revisión tenga el mismo aspecto y la misma calidad. El tutorial abre con un contraste directo entre el uso individual y el uso a escala de equipo, antes de presentar los cuatro mecanismos de distribución. > *"A PR review skill that only you use is helpful. The same skill shared across your team standardizes code review and provides a consistent experience amongst your organization which is much better."* ## [00:18] Añadir skills al repositorio del proyecto El método de menor fricción: colocar los skills en `.claude/skills` dentro del repositorio del proyecto. Quien clone el repositorio los obtiene de inmediato, sin pasos de instalación adicionales ni herramientas extra. Las actualizaciones llegan con el ciclo habitual de `git pull`. Este camino encaja con estándares de codificación de equipo, flujos de trabajo específicos del proyecto y skills que referencian la estructura propia del código. > *"Anyone who clones the repository gets these skills automatically. No extra installation, it's just what you're doing already."* ## [00:45] Distribuir skills mediante plugins Los plugins amplían Claude Code con funcionalidades personalizadas diseñadas para circular más allá de un proyecto concreto. Dentro del proyecto del plugin, un directorio `skills/` replica la estructura de `.claude/` — nombre del skill, `SKILL.md`. Una vez publicado en un marketplace, cualquier usuario de Claude Code puede descargarlo y activarlo. Este canal es el más adecuado para skills lo suficientemente generales como para servir a la comunidad en sentido amplio, en lugar de a las convenciones de un equipo concreto. > *"Think of plugins as ways to extend Claude Code with custom functionality, but designed to be shared across teams and projects."* ## [01:26] Despliegue empresarial a través de la configuración gestionada Los administradores pueden enviar skills a todos los desarrolladores de la organización mediante la configuración gestionada. Los skills empresariales tienen la máxima prioridad: sobrescriben los skills personales, de proyecto y de plugin que compartan el mismo nombre. El uso previsto son los estándares obligatorios — requisitos de seguridad, flujos de cumplimiento normativo, prácticas de codificación que deben ser uniformes. El narrador subraya la palabra "deben": no son sugerencias. > *"This is for mandatory standards, security requirements, compliance workflows, or coding practices that must be consistent across the organization."* ## [01:52] Sub-agentes personalizados y carga explícita de skills Los sub-agentes no heredan los skills de la conversación principal. Los agentes integrados (explorer, planner, verify) no pueden acceder a los skills en absoluto. Solo los sub-agentes personalizados — definidos mediante un archivo `agent.md` en `.claude/agents` — pueden usar skills, y únicamente los que figuren de forma explícita en el campo `skills:` de ese archivo. Los skills se cargan cuando el sub-agente arranca, no bajo demanda, por lo que la lista debe mantenerse ajustada: solo los skills siempre relevantes para el propósito del agente. El tutorial muestra cómo crear un sub-agente con la herramienta de creación de sub-agentes de Claude Code y cómo añadir skills a un `agent.md` existente. > *"Built-in agents like the explorer, planner, and verify can't access skills at all. Only custom sub-agents you define can use them, and only when you explicitly list them."* ## [03:18] Resumen: cómo elegir el método de distribución adecuado El cierre asocia cada método con su escenario: directorios de proyecto para el acceso del equipo, plugins para el uso entre repositorios, despliegue empresarial para los estándares obligatorios a escala de organización, y listas explícitas de skills en sub-agentes para la delegación de tareas aisladas. El aviso sobre los sub-agentes se repite una vez más — incluir solo los skills siempre pertinentes para el propósito de un agente determinado, dado que se cargan al inicio, no de forma diferida. > *"Share skills through project directories for team access, plugins for cross-repository distribution, or enterprise deployment for organization-wide standards."* ## Entidades - **Narrador del tutorial de Anthropic** (Persona): presentador único de la serie de tutoriales de skills de Claude Code - **Claude Code** (Software): asistente de programación con IA de Anthropic; entorno de ejecución donde los skills se crean y despliegan - **Skills** (Concepto): conjuntos de instrucciones reutilizables ubicados en `.claude/skills` que amplían el comportamiento de Claude Code - **Plugins** (Concepto): paquetes distribuibles que agrupan skills para compartirlos entre equipos y usuarios del marketplace - **Managed settings** (Concepto): mecanismo administrativo empresarial para desplegar skills en toda la organización con la máxima prioridad - **Sub-agents** (Concepto): agentes personalizados de Claude Code definidos mediante `agent.md` en `.claude/agents`; el único tipo de agente que puede cargar skills, y solo cuando se listan explícitamente - **Anthropic** (Organización): empresa que desarrolló Claude Code y produce la serie de tutoriales de skills de Claude Code
Configuración y skills de múltiples archivos
Tutorial de cuatro minutos de la serie Claude Code skills dedicado a los campos de configuración avanzados que convierten un skill básico en una herramienta fiable y eficiente en contexto. El presentador recorre el conjunto completo de campos de agentskills.io — `name`, `description`, `allowed_tools`, `model` — y explica cómo estructurar skills de gran tamaño mediante divulgación progresiva, de modo que los materiales de referencia y los scripts solo se carguen cuando la solicitud del usuario realmente los requiera. ## [00:02] Panorama de los campos avanzados de un skill El estándar abierto agentskills.io define varios campos más allá de los obligatorios `name` y `description`. `name` debe estar en minúsculas con guiones, con un máximo de 64 caracteres y debe coincidir con el nombre del directorio. `description` admite hasta 1.024 caracteres y es la señal principal que usa Claude para asociar un skill a una solicitud. Dos campos opcionales completan la configuración: `allowed_tools`, que restringe las herramientas que el skill puede invocar, y `model`, que ancla el skill a una versión concreta de Claude. > *"Un skill básico funciona solo con name y description, pero aquí hay algunos consejos avanzados para que tus skills sean realmente efectivos en Claude Code."* ## [00:39] Cómo escribir descripciones efectivas Una descripción vaga — "help with dogs" — deja a Claude adivinando el alcance y los disparadores del skill. Una buena descripción responde exactamente a dos preguntas: ¿qué hace este skill y cuándo debe usarlo Claude? Alinear las palabras clave con la forma natural en que los usuarios expresan sus solicitudes es el mecanismo para corregir skills que no se activan. > *"Una buena descripción responde a dos preguntas: ¿qué hace este skill? ¿Y cuándo debe usarlo Claude?"* ## [01:20] Restricción de herramientas con allowed_tools `allowed_tools` es el mecanismo para limitar un skill a una superficie de operación definida: acceso de solo lectura para flujos de trabajo sensibles desde el punto de vista de la seguridad, por ejemplo. Cuando el campo está configurado, Claude solo puede llamar a esas herramientas sin pedir permiso; queda excluida cualquier acción de edición, escritura o Bash. Omitir el campo deja intacto el modelo de permisos habitual de Claude. > *"Cuando este skill está activo, Claude solo puede usar esas herramientas sin pedir permiso. Ni edición, ni escritura, ni comandos bash."* ## [01:49] Divulgación progresiva para skills de múltiples archivos Los skills comparten la ventana de contexto de Claude con la conversación en curso. Meter todo en un `SKILL.md` de 20.000 líneas infla el contexto en cada invocación y convierte el archivo en una pesadilla de mantenimiento. La solución: colocar las instrucciones esenciales en `SKILL.md` y mover el material de referencia a archivos separados que Claude solo lee cuando la solicitud activa realmente lo requiere. El estándar sugiere tres directorios de apoyo — `scripts/` para código ejecutable, `references/` para documentación y `assets/` para imágenes y plantillas. Un enlace en `SKILL.md` funciona como una entrada de índice; si el tema no surge, el archivo nunca se carga. Los scripts del directorio del skill se ejecutan sin cargar su código fuente en el contexto: solo su salida consume tokens. El presentador recomienda mantener `SKILL.md` por debajo de 500 líneas; superarlo es señal de que el skill debe dividirse. > *"Es como tener un índice en la ventana de contexto en lugar de meter todo el documento ahí dentro."* ## [03:18] Resumen: metadatos del skill y buenas prácticas El tutorial cierra repasando la superficie de configuración completa: `name` y `description` son obligatorios; `allowed_tools` restringe la superficie de herramientas; `model` ancla la versión de Claude. Las descripciones necesitan verbos de acción concretos y frases disparadoras para hacer coincidir de forma fiable. Para skills de mayor tamaño, la divulgación progresiva mantiene `SKILL.md` bajo las 500 líneas y pospone la carga de los archivos de apoyo hasta que realmente se necesiten. Los scripts se ejecutan sin cargar su código fuente, lo que mantiene el contexto ajustado. > *"Los scripts pueden ejecutarse sin cargar su contenido, manteniendo el contexto eficiente."* ## Entidades - **Presentador de Anthropic** (Persona): anfitrión único de esta serie de tutoriales, dedicado a explicar la configuración de skills en Claude Code. - **Claude Code** (Software): herramienta CLI de Anthropic que carga y ejecuta skills según el estándar agentskills.io. - **agentskills.io** (Organización): estándar abierto que define el esquema del manifiesto de skills, incluyendo `name`, `description`, `allowed_tools`, `model` y las convenciones de directorios. - **SKILL.md** (Concepto): archivo de manifiesto principal de un skill de Claude Code; debe mantenerse por debajo de 500 líneas con enlaces a los archivos de apoyo. - **allowed_tools** (Concepto): campo opcional del skill que especifica en lista blanca las herramientas de Claude permitidas, habilitando modos de skill de solo lectura o en entorno aislado. - **Divulgación progresiva** (Concepto): estructuración de un skill de múltiples archivos para que los archivos de referencia y los scripts solo se carguen en el contexto cuando la solicitud activa realmente los requiere. - **Ventana de contexto** (Concepto): presupuesto de tokens compartido entre la conversación y los archivos de skill que Claude carga; el recurso clave que la divulgación progresiva busca preservar.
Crea tu primera habilidad
Este tutorial de 3 minutos muestra cómo construir una habilidad personal de Claude Code desde cero: crear un directorio con un archivo SKILL.md, verificar que la habilidad se carga al arrancar y observar cómo Claude la aplica a una solicitud real. La segunda mitad explica con precisión el pipeline de carga de habilidades — las cuatro ubicaciones de escaneo, el paso de inicio que solo carga nombres, la puerta de confirmación y el orden de prioridad de cuatro niveles que resuelve los conflictos de nombres. ## [00:03] Qué construye este tutorial El narrador abre con el objetivo concreto: una habilidad que enseñe a Claude a explicar código usando diagramas visuales y analogías. Una vez construida, el tutorial también rastrea qué ocurre internamente cuando Claude detecta y ejecuta una habilidad. > *"This skill will teach Claude how we would like it to explain code using visual diagrams and analogies."* ## [00:18] Creación del archivo de habilidad Las habilidades personales viven bajo el directorio personal (no dentro de un proyecto), así que el primer paso es crear un nuevo directorio con el nombre de la habilidad dentro de `~/.claude/skills/`. Dentro de ese directorio va un único archivo SKILL.md. Tres secciones importan: `name` (el identificador que Claude almacena al arrancar), `description` (el criterio que Claude usa para decidir si invocar la habilidad) y todo lo que sigue al segundo delimitador `---` (las instrucciones reales que Claude sigue cuando la habilidad se activa). > *"Take into consideration that we're creating a directory with the skill name inside of the skills directory."* ## [00:52] Carga y prueba de tu habilidad Claude Code escanea las habilidades al arrancar, no bajo demanda, por lo que se necesita reiniciar la sesión después de crear el archivo. Al ejecutar `/skills` debería aparecer el nombre de la habilidad recién creada. Para probarla, se cambia a una rama con cambios y se envía la solicitud en lenguaje natural "Write a PR description for my changes". Claude indica que está invocando la habilidad PR description, lee el diff y escribe una descripción que sigue la plantilla, con el mismo formato cada vez. > *"Claude will then show you that it's using the PR description skill."* ## [01:25] Cómo carga Claude las habilidades internamente Al arrancar, Claude Code escanea cuatro ubicaciones: configuración gestionada por la empresa, `~/.claude/skills/` personal, el directorio `.claude/` del proyecto y los plugins instalados. Solo carga el `name` y la `description`, no el contenido completo. Cuando llega una solicitud, Claude la compara con las descripciones almacenadas; "explain what this function does" coincide con "explain code with visual diagrams", por lo que la habilidad se activa. Claude pide confirmación antes de leer el SKILL.md completo, de modo que el usuario siempre sabe qué contexto se está inyectando. > *"It loads only the name and description of each skill, not the full content. This is important later."* ## [02:02] Reglas de prioridad y conflictos de nombres Clonar un repositorio que incluye sus propias habilidades puede crear colisiones de nombres. Claude las resuelve con una escala de prioridad fija: empresa (mayor) → personal → proyecto → plugins (menor). Una habilidad `code-review` de empresa siempre supera a una habilidad personal con el mismo nombre. La solución práctica es usar nombres descriptivos: `security-review` o `frontend-pr-review` en lugar del genérico `review`, para evitar conflictos desde el principio. > *"If your company has an enterprise code review skill and you create a personal code review skill, the enterprise version of that takes precedence."* ## [02:52] Actualización y eliminación de habilidades Actualizar una habilidad es tan directo como editar el archivo SKILL.md y guardar los cambios. Eliminar una habilidad significa borrar el directorio. Ambas operaciones requieren reiniciar Claude Code para que el cambio surta efecto — la lista de habilidades se construye una sola vez al iniciar la sesión y no se monitorea en tiempo real. > *"Edit the skill.md file to update a skill and restart Claude Code for changes to take effect."* ## Entidades - **Narrador del tutorial de Anthropic** (Persona): presentador único del tutorial de creación de habilidades en la serie Claude Code skills - **Claude Code** (Software): CLI de Anthropic para Claude; escanea habilidades al arrancar y las aplica cuando las solicitudes del usuario coinciden con las descripciones de las habilidades - **SKILL.md** (Concepto): el único archivo que define una habilidad — contiene un frontmatter YAML (name, description) y texto de instrucciones libre tras el segundo delimitador `---` - **Habilidades** (Concepto): conjuntos de instrucciones reutilizables y con nombre que enseñan a Claude un patrón de comportamiento consistente; almacenados como directorios que contienen un archivo SKILL.md - **Habilidades de empresa** (Concepto): habilidades gestionadas por la organización que ocupan el nivel más alto del orden de prioridad de cuatro niveles, por encima de las habilidades personales, de proyecto y de plugin - **Anthropic** (Organización): creador de Claude y Claude Code; publica esta serie de tutoriales en claude.com/resources/courses
Skills frente a otras funciones de Claude Code
Claude Code ofrece a los desarrolladores cinco mecanismos de personalización distintos — Skills, CLAUDE.md, subagentes, hooks y servidores MCP — cada uno diseñado para un propósito diferente. Este tutorial de tres minutos asigna cada opción a su caso de uso correcto, para que no recurras a Skills cuando CLAUDE.md es suficiente, ni configures un hook cuando lo que necesitas es un subagente. ## [00:02] Cinco opciones de personalización, un problema de elección Claude Code incluye cinco formas de configurar su comportamiento: Skills, CLAUDE.md, subagentes, hooks y servidores MCP. El narrador los enumera rápidamente y enseguida reorienta la pregunta: de "¿qué son?" a "¿cuál corresponde aquí?" > *"Resuelven problemas distintos. Saber cuándo usar cada uno evita que construyas lo que no necesitas."* El resto del tutorial es, en esencia, la respuesta a esa única pregunta. ## [00:18] CLAUDE.md vs Skills: siempre activo vs bajo demanda CLAUDE.md es un archivo que Claude lee al inicio de cada conversación, sin necesidad de activación. Es el lugar adecuado para las restricciones a nivel de proyecto que nunca deben olvidarse — elección de frameworks, estilo de código, reglas de base de datos. Las Skills, en cambio, se cargan bajo demanda: la lista de verificación para revisiones de PR solo entra en el contexto cuando realmente solicitas una revisión, no mientras escribes código nuevo. > *"Use Claude MD for project-wise standards that always apply constraints like never modify the database schema, framework preferences, and coding style."* La distinción está entre permanencia y relevancia. Si la instrucción debe aplicarse a cada prompt del proyecto, va en CLAUDE.md. Si solo es útil en determinados momentos, va en una Skill. ## [01:03] Skills vs subagentes: contexto compartido vs ejecución aislada Las Skills inyectan conocimiento en la conversación actual — sus instrucciones se suman al contexto existente. Los subagentes funcionan de otra manera: reciben una tarea, crean un contexto de ejecución separado, trabajan de forma independiente y devuelven los resultados sin tocar la conversación principal. > *"Use sub agents when you want to delegate a task to a separate execution context. You need different tool access that the main conversation does. You want isolation between delegated work and your main context."* Usa Skills cuando una expertise debe orientar el razonamiento de Claude a lo largo de una conversación en curso. Usa subagentes cuando quieras una frontera clara entre la sesión principal y una unidad de trabajo delegada — herramientas distintas, sin contaminación de contexto. ## [01:42] Hooks vs Skills: orientado a eventos vs orientado a solicitudes Los hooks se ejecutan automáticamente ante eventos — un linter que corre cada vez que Claude guarda un archivo, o una validación de entrada antes de ciertas llamadas a herramientas. No los activa lo que preguntas, sino lo que Claude hace. Las Skills son lo opuesto: orientadas a solicitudes, se activan cuando una consulta coincide con ellas. > *"A hook might run a llinter every time Claude saves a file or validate input before certain tool calls. They're all event driven, while skills, they're request driven. They activate based on what you're asking."* Si el comportamiento debe ocurrir de forma incondicional ante un evento del sistema, es un hook. Si debe influir en cómo piensa Claude cuando se le pregunta algo, es una Skill. ## [02:15] Combinar los cinco para una personalización completa Una configuración de Claude Code bien ajustada asigna a cada herramienta su rol natural: CLAUDE.md para los estándares de proyecto siempre activos, Skills para la expertise específica de tareas que no debe saturar cada prompt, hooks para los efectos secundarios automatizados, subagentes para el trabajo delegado en aislamiento, y servidores MCP para el acceso a herramientas externas. No son alternativas entre sí — se combinan. > *"Don't force everything into skills when another option fits best. You can use multiple at a time."* Las Skills se activan automáticamente cuando el tema es relevante; CLAUDE.md siempre está presente; los subagentes corren en aislamiento; los hooks se disparan ante eventos; MCP proporciona herramientas externas. Elige el nivel adecuado para cada necesidad y combínalos libremente. ## Entidades - **Narrador del tutorial de Anthropic** (Persona): Presentador de esta serie de tutoriales de Claude Code skills, en representación de Anthropic. - **Claude Code** (Software): Asistente de programación con IA de Anthropic; tema central de la serie de tutoriales. - **Skills** (Concepto): Paquetes de conocimiento bajo demanda que se activan cuando Claude detecta una coincidencia con la solicitud del usuario; inyectan instrucciones en el contexto de la conversación actual. - **CLAUDE.md** (Concepto): Archivo de configuración que se carga automáticamente en cada conversación de Claude Code; usado para estándares y restricciones permanentes a nivel de proyecto. - **Subagentes** (Concepto): Contextos de ejecución independientes que se crean para gestionar tareas delegadas en aislamiento de la conversación principal. - **Hooks** (Concepto): Automatización orientada a eventos que se dispara ante acciones específicas de Claude — como guardar un archivo o realizar una llamada a herramienta — con independencia de las solicitudes del usuario. - **Servidores MCP** (Software): Servidores Model Context Protocol que proporcionan herramientas externas a las sesiones de Claude Code. - **Anthropic** (Organización): Creador de Claude Code y editor de la serie de tutoriales de Claude Code skills.