LaiDub

Podcasts

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496
4:18:22
EN/ZH
Watch with Captions
Lex Fridmanvor 20 Tagen

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496

Lex Fridman sits down with Jean-Baptiste Kempf, president of VideoLAN and lead developer of VLC, and Kieran Kunhya, longtime FFmpeg contributor and the voice behind the infamous FFmpeg account on X, for a four-hour deep dive into the invisible machinery behind virtually all video on the internet. Together they trace the full arc from raw bytes and container formats through hand-written assembly and codec reverse-engineering, confronting the open-source sustainability crisis along the way. The conversation is both a technical masterclass and a meditation on why brilliant volunteers—many of them teenagers—quietly build infrastructure that powers billions of devices every day. ## [00:00] Episode highlight The episode opens with a rapid-fire highlight reel that captures the spirit of what follows. Kempf distills the FFmpeg community's core value: code quality is the only credential that matters—"Maybe you're a dog. I don't care. I need to look at your code." Kunhya adds the scale: FFmpeg is running on roughly 100 million CPUs at any moment, with three billion devices continuously decoding video, and FFmpeg's x86 assembly hand-optimization runs 62 times faster than equivalent C. The segment also previews the CIA-VLC spy story, the intelligence-agency backdoor request Kempf flatly refused, and Kieran's "no regrets" Twitter philosophy. > *"We care about excellent code. We don't care who you are. Like maybe you're a dog. I don't care, right? I need to look at your code."* — Jean-Baptiste Kempf ## [02:17] Introduction Lex sets the scene: FFmpeg is the invisible backbone behind YouTube, Netflix, Chrome, VLC, Discord, and nearly every platform that touches video or audio. VLC has been downloaded more than 6.5 billion times. Both projects are built entirely by volunteers. Lex frames the episode not merely as a technical discussion but as a tribute to engineers who work for the craft rather than for fame or money—"one of the great examples of human beings quietly collaborating across borders to build something useful, durable, and elegant." > *"It is one of the most incredible software systems ever developed, and it's all done by volunteers."* — Lex Fridman ## [05:35] Weirdest things VLC opens The conversation lightens up with playful examples of VLC's legendary tolerance for exotic formats. Kempf describes users capturing VHS tapes via capture cards, support for DVD-Audio with custom encryption, and the Lucasfilm Star Wars game codec that FFmpeg implemented for a single 10-second opening sequence. At a VideoLAN conference, a competition to create the most broken file ever—an MKV where every frame changed resolution, aspect ratio, and rotation—ended with VLC playing it perfectly. The orange traffic-cone logo is discussed: so recognizable that 25% of VLC's website traffic arrives from people searching "cone player." > *"There was a file that's a valid ZIP and a valid MP3 at the same time or something like that—and VLC opened all of the stupid files."* — Kieran Kunhya ## [09:59] How video playback works Kempf and Kunhya walk through what happens the moment you press play: the player fetches a byte stream from a URL, the demuxer separates audio, video, and subtitle tracks, entropy decoding removes mathematical compression, intra prediction reconstructs still-image frames (I-frames), motion-compensation handles temporal redundancy (P- and B-frames), and the final raw pixels are handed to the GPU or audio card. Video compression achieves 100x to 200x reduction by exploiting how human eyes perceive luminance versus color—working in YUV space rather than RGB—and by reusing unchanged background regions across frames. Kunhya warns that every single sentence in this pipeline represents someone's lifetime of work. > *"Everything we've just said in the past couple of minutes, every sentence is someone's lifetime's work. There are books about every sentence."* — Kieran Kunhya ## [19:20] Video codecs and containers The hosts clarify the often-confused distinction between containers and codecs. A container (MP4, MKV, MOV) multiplexes audio, video, and subtitle tracks; the codec (H.264, AV1) compresses the content inside. VLC and FFmpeg deliberately ignore the file extension and probe the actual bytes—because in the real world, extensions lie. The segment covers how AVI was Microsoft's format, MOV became MP4 via Apple, and the Matroska/MKV format emerged from the open-source community. Modern codecs like AV1 are not single algorithms but collections of tools that adapt to content type—screen share, animation, live video—each requiring different coding strategies. > *"We discard the file format. We look into the file to understand what's in it because so many people say, 'Oh, it's a video, it must be MP4,' but technically it's an MOV or maybe it's a MKV."* — Jean-Baptiste Kempf ## [30:07] FFmpeg explained FFmpeg is described as a low-level library suite—libavcodec, libavformat, libavfilter—plus a command-line tool so expressive that Kempf calls it a full programming language. Every person watching a YouTube video, recording with OBS, or editing in a professional broadcast box is likely touching FFmpeg. Kunhya notes that trillion-dollar corporations and grandmothers with home videos operate on exactly the same technology stack. The segment dives into open-source licensing—MIT, GPL, LGPL, AGPL—as "social contracts" that define community norms. Kempf recounts the painstaking process of re-licensing VLC's core from GPL to LGPL, requiring him to track down more than 350 contributors, including visiting the factory-worker father of a deceased contributor to obtain permission for two lines of code. > *"From a philosophical level, it's incredible that your grandmother's home videos and trillion-dollar corporations are on a level playing field using the same technology stack."* — Kieran Kunhya ## [51:07] Linus Torvalds Kempf offers a nuanced defense of Linus Torvalds's legendary harshness. The Linux kernel's core community is tiny—as is FFmpeg's (10–15 active maintainers)—and those few people must maintain every line of code forever. "We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code." Kunhya adds that terseness is often simply fatigue: volunteers arrive home after a full day of work and review patches without the bandwidth to hand-hold. Kempf also points out that most community members are non-native English speakers, and cultural misreadings amplify perceived hostility. > *"We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code."* — Jean-Baptiste Kempf ## [55:46] Turning down millions to keep VLC ad-free Kempf traces VLC's unlikely origin: a French engineering school (École Centrale Paris) whose student-run campus built a satellite video-streaming system in 1995—a decade before YouTube—just to enable faster networks for video games. From that Network 2000 project grew VideoLAN, and VLC emerged as its client. Kempf joined in 2003 when the project had nearly died, grew it from hundreds of thousands to billions of installs, and along the way repeatedly refused "obscene" offers to bundle toolbars, change search engines, or insert advertisements. His reasoning: "I need to go to bed at night and be happy about what I've done. If I had sold out, I would have betrayed so many other people who work here." > *"I refuse dozens of millions of dollars, yes, several times. Yes, I could be a multimillionaire and be somewhere on the beach. But I did not do it because I thought it was not moral and it was not the right thing to do."* — Jean-Baptiste Kempf ## [70:04] FFmpeg & Google drama Kunhya recounts a public controversy in which Google's security team used AI to auto-generate bug reports for FFmpeg, filing them under tight 90-day deadlines—with some vulnerability reports going to the press before patches could be written—without contributing corresponding fixes or meaningful funding. Kunhya compares it to "a denial of service by AI-generated bug reports" on obscure 1990s game codecs. The saga escalated via spicy FFmpeg tweets (a "rap battle" in Kunhya's words), but produced concrete results: Google began sending patches and established a financial reward system for fixes. A parallel incident saw Microsoft Teams engineers file a high-priority bug on the volunteer tracker, name-dropping their product's scale, and offering a one-time payment of a few thousand dollars in response to a request for a long-term support contract. > *"Google uses FFmpeg at a scale probably you or I couldn't even contemplate—millions of CPU cores. And yes, they contribute in areas mostly regarding their own products. But in a wider sense, there's a disproportionate level of contribution."* — Kieran Kunhya ## [89:18] FFmpeg developers What motivates FFmpeg's volunteer engineers? Kempf identifies three drivers: passion for the subject matter (many contributors arrived because they loved anime), excellence of the craft ("this is the best school ever of programming"), and pride in impact ("you can tell your grandma: I do this so you can play video on your laptop"). Kunhya adds that Andrew Kelley, creator of the Zig programming language, was an FFmpeg developer who credits his time there as his real-world education. Teenagers have written thousands of lines of hand-optimized assembly for FFmpeg. Kieran's favorite quote, from John Collison: "The world is a museum of passion projects." > *"If you're good in C, if you know how to write assembly in FFmpeg, I assure you you're going to be one of the best programmers ever—even if you're working on writing TypeScript."* — Jean-Baptiste Kempf ## [95:55] VLC and FFmpeg Kunhya frames the FFmpeg-VLC relationship as a "binary star system": VLC is to FFmpeg as Android is to Linux—they depend on each other and succeed because of each other. Roughly 80% of FFmpeg pipelines depend on at least one VideoLAN project (most often x264). VLC gives FFmpeg exposure to a vast zoo of real-world broken files. When compiled for Windows, VLC links against about 16 million lines of code, of which only 1 million live in the VLC repository itself. The two projects share many developers and collectively demonstrate that complex software ecosystems can be built entirely from interdependent open-source components. > *"VLC is to FFmpeg as Android is to Linux. They depend on each other, but they coexist because of each other."* — Kieran Kunhya ## [100:29] History of FFmpeg The "eras tour" of FFmpeg begins with Fabrice Bellard creating the initial concept, followed by the Michael Niedermayer era of the early 2000s—exhaustive support for DivX, Xvid, Windows Media, and RealMedia, eliminating the need for bloated, spyware-ridden codec packs. The late 2000s brought H.264 maturity and the rise of high-definition video. Throughout, VLC served as FFmpeg's field test: millions of users exposing edge cases that no lab could anticipate. > *"At the time you needed a new player to play every different type of file format. Having a single library that was fast and open source—that was a massive achievement."* — Kieran Kunhya ## [103:46] Reverse engineering codecs The segment showcases the art of reverse engineering proprietary codecs. Kostya Shishkov—described as "borderline genius"—reverse-engineered 20–30 megabyte binary blobs (each megabyte representing roughly a month of normal work) for fun, producing decoders for Windows Media, RealMedia, and GoToMeeting formats. Kunhya explains the methodology: hook into the proprietary player to dump raw YUV data, open a disassembler, step through machine code instruction by instruction to infer the entropy coding, prediction, and IDCT stages, then validate bit-exactness against sample files. For months, the work produces no visible output—pure debugging in memory. > *"He looked at the world as a binary specification. He didn't need documentation or anything. He would go away and come back and do interesting stuff."* — Kieran Kunhya ## [117:01] FFmpeg testing FFmpeg's FATE (FFmpeg Automated Testing Environment) system runs a pivot table of test combinations: dozens of compilers (GCC, Clang, MSVC, Apple Clang, Intel Compiler), operating systems (Linux, macOS, Windows, BSD, Solaris), and CPU architectures (x86, ARM, RISC-V, PowerPC). All test machines are volunteer-hosted. The system catches compiler miscompilations—rare but devastating, since even a single wrong bit in a frame dependency chain can cascade into major visual corruption. Kunhya notes that the Macs at the top of the FATE dashboard are hosted in his own office. > *"It's not just a matrix at this point. It's like a pivot table of different combinations—all run by volunteers."* — Kieran Kunhya ## [121:08] Assembly code (handwritten) This extended chapter is the technical heart of the episode. Handwritten x86/ARM SIMD assembly in FFmpeg and x264 runs up to 62 times faster than equivalent C—a gap that modern compilers and auto-vectorization cannot close despite years of trying. VLC still supports Windows XP through Windows 11, macOS 10.7 through macOS 26, iOS 9 through the latest, BSD, Solaris, and even OS/2. Understanding assembly forces programmers to internalize CPU pipeline stages, SIMD registers, L1/L2/L3 cache, and memory bus constraints. Kempf and Kunhya introduce the x86inc framework built by Loren Merritt for x264 and JB's Assembly Lessons tutorial series, which have attracted contributions from teenagers learning directly from the source. > *"I believe it's necessary to understand assembly language, even if you don't do it much, to understand what's going on inside your computer. That will make you a better programmer."* — Jean-Baptiste Kempf ## [145:26] Rust programming language Kempf and Kunhya hold divergent opinions on Rust. Kunhya respects the memory-safety goal but finds the community self-important—"It has a very big Esperanto vibe"—and argues that Rust rewrites reaching only 85–90% of required feature coverage are insufficient; "the last 1% takes 99% of the time." Kempf has written Rust VLC modules and sees genuine value, but notes that the lack of training data for low-level SIMD work means AI tools cannot yet assist meaningfully. The discussion broadens to the two assembly wizards of the community: Henrik Gramner, whose knowledge of Intel x86 cycle counts exceeds Intel's own engineers, and Martin Storsjö, who writes ARM Neon assembly on a virtual keyboard while watching his kids play in the playground. > *"Rust reminds me of the Sinclair C5. In order to get people to move, you have to build something as good as, if not better than, what you have now."* — Kieran Kunhya ## [154:42] FFmpeg and Libav fork In 2011, FFmpeg split into FFmpeg and Libav, primarily over governance and leadership style rather than technical disagreements. Several Linux distributions temporarily shipped Libav instead of FFmpeg. Kempf describes open-source forks as healthy—they force projects to confront structural weaknesses. Eventually most of Libav's developers returned to FFmpeg, and the projects merged back. Kempf draws a parallel to the XZ Utils attack, where a lone maintainer, exhausted by coordinated social engineering, granted commit access to an attacker—highlighting how burnout creates the very single-point-of-failure vulnerabilities that make critical open-source infrastructure fragile. > *"Forks are important because they change the status quo of a community. FFmpeg today is better than it was before the fork."* — Jean-Baptiste Kempf ## [163:04] Open source burnout Kempf and Kunhya confront the mental health crisis among open-source maintainers. Kempf has received physical death threats—including a letter containing powder—over decisions such as dropping PowerPC support. The security community's habit of filing alarming CVEs for hobby-project edge cases adds psychological load without providing patches. Kempf now maintains several libraries whose original maintainers burned out. The conversation broadens to the systemic problem: critical infrastructure like libxml and XZ is maintained by one or two people, unknown to the trillion-dollar enterprises that depend on them. > *"The mental health of the open source maintainers is something that large corporations don't care or don't see."* — Jean-Baptiste Kempf ## [170:51] x264 and internet video H.264 transformed internet video by arriving exactly when Intel Core 2/Nehalem CPUs made real-time software decoding practical. The key innovation of x264 was psychovisual rate-distortion optimization—encoding decisions driven by visual quality metrics rather than mean squared error, producing sharper, more natural-looking video. This was driven by the anime community's high standards for perceived sharpness. AV1 offers 40–60% bandwidth savings over H.264 at the same quality, but encoding costs two orders of magnitude more CPU. YouTube therefore re-encodes only popular videos in AV1, making the extra compute worthwhile by amortizing it over millions of viewers. > *"Thirty percent of the video from Netflix is now in AV1, fifty percent of YouTube."* — Jean-Baptiste Kempf ## [184:07] Video compression basics The chapter clarifies I/P/B frame structure: I-frames are complete still images, P-frames reference only previous frames, and B-frames can reference both past and future frames. ProRes is an intra-only codec designed for nonlinear editing—no temporal dependencies, fast seeking. The segment also covers constant-bitrate versus constant-quality encoding, group-of-pictures length, and the thousands of engineers at Netflix, YouTube, and Meta whose entire job is tuning FFmpeg parameters for specific content types. A historical curiosity: Google Video originally used VLC as an ActiveX plugin inside Internet Explorer; today VLC is compiled to WebAssembly to run inside browser JavaScript engines. > *"You have I-frames that are complete frames, P-frames that depend only on I-frames, and B-frames that can depend on frames in front."* — Jean-Baptiste Kempf ## [191:04] CIA and fake VLC WikiLeaks' Vault 7 release revealed that the CIA built a modified version of VLC with an additional DLL (psapi.dll) that silently encrypted and exfiltrated documents while the victim watched a movie, using the expected high CPU load of video playback as cover. VideoLAN issued a press release directing users to download only from the official website. A separate incident involved Chinese state hackers distributing a fake VLC using legitimate signed VideoLAN DLLs to target Indian users, causing India to ban VLC until Kempf fought a successful legal battle to reverse the ban. The segment also surfaces a hidden feature: VLC can render movies as ASCII art in a terminal, useful for diagnosing multicast network paths via SSH. > *"If we had to compromise our software, we would shut it down. This is clear."* — Jean-Baptiste Kempf ## [201:39] Ultra low latency streaming Kempf explains adaptive streaming (HLS, DASH): the player downloads segments, times the download, and adjusts quality tier accordingly. The real engineering frontier is live broadcasting with strict CBR constraints—satellite uplinks cannot burst even for one second. Kempf describes his company Kyber, an open-source (AGPL dual-licensed) ultra-low-latency streaming stack targeting robotics and XR, streaming compressed video feeds to devices without onboard compute. The segment ends with a discussion of teleop for robots, where latency directly determines safety. > *"Kyber is open source. Everything on Kyber is open source. If you want to use it in your product and not open source it, you pay the commercial license."* — Jean-Baptiste Kempf ## [219:07] AV2 codec and video patents AV2, the successor to AV1 within the Alliance for Open Media (of which VideoLAN is a member), promises a further 30% bandwidth reduction. VideoLAN's dav1d decoder will be followed by "dav2d." The Alliance exists specifically to escape the HEVC/H.265 patent thicket: HEVC's three separate patent pools demanded fees so large that HP removed HEVC support from new laptops, and streaming giants calculated they could build a new royalty-free codec for less than the annual licensing cost. France's rejection of software patents means Kempf has never paid codec licensing fees—if he had to, the bill would exceed 200 euros per user. > *"At a hundred million per year, you know, I could create my own codec—and this is what they did."* — Jean-Baptiste Kempf ## [228:59] VLC backdoors Intelligence agencies from two different countries approached Kempf asking him to insert backdoors into VLC. He declined both, in terms he describes as "a lot less polite" than a simple no. The chapter broadens into a discussion of European entrepreneurship: Kempf argues that French startup culture has transformed over 15 years—failure stigma has fallen, AI companies are proliferating—while acknowledging that over-regulation remains a real drag. He closes by reflecting on his strategy for remaining calm under legal and political pressure: always ask "am I dying? Am I hurting someone?" If not, move on. > *"If we had to compromise our software, we would shut it down. Also because what we do is good and it's done for everyone."* — Jean-Baptiste Kempf ## [239:14] Video archiving Kieran profiles the archiving preservation community, led in part by Dave Rice of CUNY, which relies on FFmpeg as a "Rosetta Stone" for playing future-proof multimedia. The community funded FFV1, FFmpeg's lossless codec, to guarantee that archived footage loses no information—critical because lossy compression could destroy forensic or historical details visible only on close inspection. A famous cautionary tale: the BBC's 1986 New Domesday Book project archived content on BBC Micros, and within 20 years no one had working software to read it. There are now more historical video tapes in archives than functional tape heads in the world to digitize them, forcing painful triage decisions about what human history to preserve. > *"C will be like Latin. It will be a thing you learn from the past, but it will still be usable in certain contexts."* — Kieran Kunhya ## [245:51] Future of FFmpeg and VLC The closing chapter surveys where multimedia is heading: volumetric video, point-cloud codecs for robotics, RGBD depth streams, XR/VR streaming, and—speculatively—neural interfaces that may one day require codecs for compressed brain data. Kempf is confident FFmpeg will exist in 100 years; VLC he rates as "maybe." He closes with his personal philosophy: "Regrets are a tax on your mind. Learn from your mistakes, but don't regret." The episode ends with Lex reading Linus Torvalds: "Most good programmers do programming not because they expect to get paid or get adulation by the public, but because it is fun to program." > *"Regrets are a tax on your mind. Learn from your mistakes, but don't regret. Because you've done it, so unless you have a time machine, don't regret."* — Jean-Baptiste Kempf ## Entities - **Jean-Baptiste Kempf** (Person): President of VideoLAN, primary maintainer of VLC, founder of Kyber and several other companies; declined tens of millions of dollars to keep VLC ad-free. - **Kieran Kunhya** (Person): Veteran FFmpeg contributor, codec engineer, founder of Open Broadcast Systems, the voice behind the FFmpeg account on X. - **Lex Fridman** (Person): Host of the Lex Fridman Podcast, AI researcher, longtime VLC and FFmpeg advocate. - **Fabrice Bellard** (Person): Creator of FFmpeg, QEMU, and tcc; foundational figure of the project. - **Michael Niedermayer** (Person): Long-time FFmpeg maintainer who drove exhaustive codec support through the 2000s. - **Kostya Shishkov** (Person): Legendary FFmpeg reverse engineer who decoded proprietary binary blobs for Windows Media, RealMedia, and GoToMeeting codecs. - **Henrik Gramner** (Person): Assembly wizard with deeper knowledge of Intel x86 cycle counts than Intel's own engineers. - **Linus Torvalds** (Person): Creator of Linux and Git; referenced as a model of uncompromising code quality standards in open-source communities. - **FFmpeg** (Software): Open-source multimedia framework providing codecs, muxers, filters, and command-line tools; the invisible backbone of nearly all internet video. - **VLC** (Software): Open-source media player with 6.5+ billion downloads, built on libVLC and FFmpeg; plays virtually any format on any platform. - **x264** (Software): VideoLAN's open-source H.264 encoder; the dominant software encoder for internet video, famous for psychovisual optimizations. - **dav1d** (Software): VideoLAN's fast open-source AV1 decoder; widely deployed in browsers and streaming clients. - **VideoLAN** (Organization): French nonprofit that stewards VLC, x264, dav1d, and related open-source multimedia libraries. - **Alliance for Open Media** (Organization): Industry consortium including Google, Netflix, Apple, Amazon, and VideoLAN that created AV1 and is developing AV2 as royalty-free codec standards. - **FATE** (Software): FFmpeg Automated Testing Environment; volunteer-hosted CI grid testing hundreds of compiler/OS/architecture combinations. - **Kyber** (Organization): JB Kempf's startup building an ultra-low-latency open-source streaming stack for robotics and XR, dual-licensed AGPL/commercial. - **H.264 / AVC** (Concept): The dominant internet video codec standard; open-source implementation is x264; basis of Blu-ray and most MP4 files. - **AV1 / AV2** (Concept): Royalty-free next-generation video codec standards from the Alliance for Open Media; AV1 saves 40-60% bandwidth vs H.264; AV2 adds another 30%.

#ffmpeg#vlc#open-source
Was ist Claude Code?
2:55
EN/ZH
Watch with Captions
ClaudeClaude Code 101vor 21 Tagen

Was ist Claude Code?

Anthropics offizielle Einführung in Claude Code — was es ist, wie es sich von Claude.ai unterscheidet und die drei Dinge, die Sie wissen sollten, bevor Sie einem LLM erlauben, Befehle auf Ihrer Codebasis auszuführen. Richtet sich an Entwickler, die das Terminal-Tool zum ersten Mal installieren möchten. ## [00:04] Was Claude Code ist und wo es läuft Claude Code ist als agentisches Coding-Tool positioniert: Es versteht Ihre Codebasis, bearbeitet Dateien, führt Befehle aus und integriert sich in die Entwickler-Tools, die Sie bereits verwenden. Es ist auf mehreren Oberflächen verfügbar — Terminal, VS Code, JetBrains-IDEs, die Claude-Desktop-App und das Web — aber diese Einführung konzentriert sich auf das Terminal als kanonische Erfahrung. > *Claude Code is an agentic coding tool that understands your code base, edits your files, run commands, and integrates with your existing developer tools to help you get things done faster.* ## [00:34] Wie es sich von Claude.ai unterscheidet Der entscheidende Unterschied liegt nicht in der Modellleistung, sondern im Zugriff: Claude Code greift direkt auf Ihr Terminal und Ihre gesamte Codebasis zu, sodass der Zyklus aus Kopieren und Einfügen in den Chat entfällt — das Tool erledigt die Arbeit an Ort und Stelle. Es als "KI-Agenten" zu bezeichnen ist eine Kurzform für diese direkte Ausführungsebene. > *Unlike Claude AI, Claude Code has direct access to your files in your terminal and your entire code base.* ## [00:51] KI-Agenten und was Claude Code kann Ein KI-Agent bedeutet hier Software, die mit ihrer Umgebung interagiert und Maßnahmen ergreift, um ein definiertes Ziel zu erreichen — in seiner einfachsten Form ein LLM in einer Echtzeit-Schleife mit Zugriff auf Tools, externe Dienste und andere Agenten. Für Claude Code bedeutet das konkrete Fähigkeiten: Ihre Codebasis lesen und erklären, Bugs über Dateien hinweg verfolgen, Build-Skripte und Tests ausführen, Pakete installieren und aktuelle API-Dokumentation aus dem Web abrufen, um zu entscheiden, was als Nächstes zu tun ist. > *An AI agent is a software that can interact with its environment and perform actions to complete a defined goal.* ## [01:45] Drei Konzepte, die Sie vor dem Start kennen sollten Der Sprecher nennt drei Eigenschaften, die die tägliche Nutzung prägen. Erstens ist das **Kontextfenster** Claudes Arbeitsgedächtnis — groß, aber endlich — weshalb der Agent eine Codebasis strategisch navigieren muss, anstatt sie vollständig zu laden. Zweitens **fragt Claude Code um Erlaubnis**, bevor es Befehle ausführt oder Dateien verändert; Sie behalten die Kontrolle, egal ob Sie jeden Schritt steuern oder es weitgehend selbstständig laufen lassen möchten. Drittens **kann es falsch liegen**: Absichten falsch interpretieren, Bugs einführen oder eine Lösung überentwickeln. Behandeln Sie die Ausgaben wie die eines jeden anderen Tools, nicht als unumstößliche Wahrheit. > *By default, Claude Code will ask you before running commands or making changes to your code base.* ## [02:34] Zusammenfassung Claude Code ist ein agentisches Coding-Tool, das Ihre Codebasis liest, Dateien bearbeitet, Befehle ausführt und sich mit externen Tools verbindet, um Ihnen zu helfen, schneller zu liefern — heute verfügbar in Terminal, VS Code, JetBrains und der Claude-Desktop-App. > *Claude Code is an agentic coding tool. It reads your code base, edits your files, runs commands, and connects to external tools to help you ship faster.* ## Entitäten - **Anthropic Tutorial Narrator** (Person): Anthropics offizieller Sprecher für die Claude Code 101-Tutorial-Serie. - **Claude Code** (Software): Anthropics agentischer, terminalbasierter Coding-Assistent, der direkt auf Ihrer Codebasis operiert. - **Claude.ai** (Software): Das chatbasierte Claude-Produkt — im Gegensatz zur umgebungsinternen Ausführung von Claude Code. - **AI agent** (Concept): Ein LLM, das in einer Echtzeit-Schleife mit Zugriff auf Tools, externe Dienste und andere Agenten läuft, um ein definiertes Ziel zu verfolgen. - **Context window** (Concept): Claudes Arbeitsgedächtnis — endlich, weshalb der Agent strategisch navigiert, anstatt die vollständige Codebasis zu laden. - **VS Code / JetBrains IDEs** (Software): Editor-Integrationen, in die Claude Code neben dem Terminal und der Claude-Desktop-App eingebettet ist.

#claude-code#ai-agent#developer-tools
🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI
1:31:51
EN/ZH
Watch with Captions
Latent Spacevor 21 Tagen

🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI

Alex Lupsasca — 2024 New Horizons Breakthrough Prize winner and OpenAI resident scientist — recounts how GPT-5 resolved a year-long open problem in quantum field theory: proving that single-minus gluon tree amplitudes are non-zero and finding their compact closed form. He then describes how the publicly available GPT Pro, given the gluon paper as a seed, independently generalized the result to graviton amplitudes in under three days of human clock time. Throughout the conversation, Lupsasca reflects on what this trajectory means for how physics is done, how the next generation of physicists will be trained, and where the remaining bottlenecks — verification, creativity, and publishing infrastructure — still lie. ## [00:00] Introduction to AI's impact on physics research Lupsasca opens in medias res, framing the episode's central claim before the formal introduction: AI has crossed a threshold where it can resolve questions that stumped human experts for over a year. He describes this not as a curiosity for theoretical physicists but as a profound, if underappreciated, change in the nature of scientific discovery itself. > *"That's a certain milestone that we've passed, and I think maybe for the average person on the street who doesn't care about theoretical physics, this is not very noticeable, but I think it's a very profound change and we've really passed some kind of a threshold."* ## [00:43] Guest introduction: Alex Luposka The hosts — Brandon (Atomic AI) and RJ Honicky (Miro Omix) — introduce Lupsasca as a Vanderbilt professor and OpenAI fellow who holds both the 2024 New Horizons in Physics Breakthrough Prize (often called the "Oscars for science") and the IUPAP Young Scientist Award. Lupsasca immediately sets the narrative arc: a year ago, AI was useful for email but not for his work; ChatGPT o3 was the first model that genuinely helped with research math; then GPT-5 reproduced one of his hardest published results in 30 minutes. > *"When GPT-5 came out it was able to reproduce one of my best papers that took me a very long time to come up with in like 30 minutes. And that's when I really became AI pilled."* ## [02:49] Alex joining OpenAI and the shift in physics research After GPT-5's release, Lupsasca began evangelizing the shift to colleagues who were skeptical. Finding OpenAI equally excited, and being on sabbatical, he joined as resident scientist — the person physicists around the world now email when something astonishing happens. He describes receiving an inbound that week about Codex simulating the Sachdev-Ye-Kitaev (SYK) model in 10 minutes, a feat that many research groups had struggled to achieve due to the narrow Venn diagram of physicists with strong coding skills. > *"I talked to OpenAI. They were also really excited and I thought I have to get in on this and to understand that this is happening and not be a part of it is a huge mistake so I have to go to OpenAI."* ## [04:08] The release of GPT-5 and the shift in capabilities Lupsasca contrasts the lukewarm Twitter reception of GPT-5 (complaints that it was not better at writing email) with what he observed at the science frontier. He notes GPT-5.4 is another significant jump, and describes how AI capabilities for physics have been accelerating rapidly since o3, the first reasoning model strong enough for research-grade mathematics. He uses this as a bridge to the central technical story of the episode: a pair of new papers on gluon and graviton scattering amplitudes. > *"At the science frontier the capabilities were really taking off."* ## [10:05] Explaining Quantum Field Theory and amplitude calculations Lupsasca gives an accessible primer on quantum field theory (QFT), the framework that reconciles special relativity and quantum mechanics. The key objects in QFT are scattering amplitudes — complex-valued functions that encode the quantum probability for a set of incoming particles (with given energies, momenta, and polarizations) to scatter into a set of outgoing particles. These amplitudes are computed at particle colliders like the LHC, and knowing the n-point amplitude (for any number n of particles) encodes essentially the full content of the theory. > *"If you have a particular force and you're able to compute the n-point amplitudes... you know everything about the theory."* ## [14:20] Overview of gluons and the strong force Gluons are the force-carrying particles of the strong nuclear force — the force that, despite like-charge repulsion between protons, holds the atomic nucleus together. They are the QFT analog of photons for electromagnetism and gravitons for gravity. Like photons, gluons carry a polarization (helicity): positive (right-handed) or negative (left-handed). This helicity structure is central to the paper discussed next. > *"The strong force is mediated by the exchange of the particles of the strong force, which are called gluons, because they're what glues together the nucleus of the atom."* ## [14:38] Discussing the first research paper on single-minus gluon tree amplitudes Lupsasca unpacks the paper's title — "Single-Minus Gluon Tree Amplitudes Are Non-Zero" — piece by piece. Tree amplitudes are the leading-order (no-loop) contributions to scattering. All-plus-helicity amplitudes are exactly zero by a symmetry argument. Single-minus amplitudes — where all but one gluon have positive helicity — were assumed in textbooks to also be zero by the same argument. The paper proves they are not. The result involves collaboration with Alfredo Guevara (IAS), David Skinner (Cambridge), Andrew Strominger (Harvard), and Kevin Wheel. > *"If you look at the lecture notes and textbooks that have been written on this, the same argument that rules out the all-plus amplitudes also appears to rule out the single-minus amplitudes."* ## [20:56] How ChatGPT helped solve a year-long physics puzzle Strominger, Guevara, and Skinner had understood for about a year that the textbook argument has a loophole: when particles are collinear (exactly aligned in momentum), the standard dimensional-analysis reasoning fails, and single-minus amplitudes can be non-zero. But computing what those non-zero amplitudes equal had eluded them. Lupsasca invited Strominger to visit OpenAI and work on it with AI. The week before Strominger's flight, Lupsasca began using ChatGPT Pro. By the time Strominger landed, they had the answer. > *"Using ChatGPT we solved the problem before he even got off the plane."* ## [23:02] Complexity of manual calculations in physics Lupsasca shows the audience a concrete illustration of the difficulty: the six-point single-minus amplitude, worked out by hand by Alfredo Guevara, is a sum of 32 terms each of which is itself a product of four complicated factors. The number of terms grows factorially with the number of particles n — super-exponential growth. This is the messy representation that the group had been staring at for a year, seeking the analog of the elegant Parke-Taylor formula. > *"By the time you get to six terms, it explodes in your face."* ## [26:12] The history and mechanics of Feynman diagrams Feynman diagrams are a visual language introduced by Richard Feynman to organize perturbative QFT calculations: diagrams represent possible intermediate histories of a scattering process, and the full amplitude is a sum over all of them. Diagrams are organized by number of vertices (interaction points); each additional vertex is suppressed by the coupling constant, so tree diagrams (fewest vertices) dominate. Loop diagrams — where intermediate particles are created and annihilated — contribute smaller corrections. The combinatorial explosion of tree diagrams is the root cause of factorial growth. > *"In principle, there are infinitely many pictures to sum over."* ## [27:44] The Parke-Taylor formula and the quest for simplification In the 1980s, Parke and Taylor computed the "maximally helicity violating" (MHV, or double-minus) gluon amplitudes through a heroic Feynman diagram expansion. Despite the factorial number of terms, everything canceled to leave a single compact formula — the Parke-Taylor formula — that fits in half a line. Strominger, Guevara, and Skinner spent a year looking for the analogous compact formula for the single-minus case. Their search stalled at the level of the messy Feynman representation. > *"Andy, Alfredo and David spent the last year chasing the analog of the Parke-Taylor formula, the very simple answer that was obtained in the '80s for the double minus amplitudes."* ## [31:26] Using ChatGPT to find the simplification in the special phase space region When the five-point single-minus amplitude was fed to ChatGPT Pro, the model identified a special subregion of phase space (where one particle's frequency has opposite sign) in which the amplitude simplifies from eight terms to a product of just three. This appears not to have been a known fact; the model wrote Python code and tested thousands of possibilities to deduce it. Moving to the six-point amplitude (Guevara's hand calculation), ChatGPT simplified 32 terms to a product of 4. It then conjectured the general n-point formula — with only linear growth in the number of terms, the best possible behavior. GPT-5.2 Pro guessed the formula but could not prove it. > *"The formula that it proposed, instead of having this factorial growth... here it's actually linear. So if you double the number of particles, you only double the number of terms."* ## [38:07] Proving the formula from scratch to ensure validity To obtain a proof, Lupsasca used an internal OpenAI model with extended reasoning. He gave it the problem cold — without the conjectured formula — and asked it to find the general answer in the special phase-space region. After 12 hours of computation, the model independently rediscovered the same formula and produced a complete three-step proof. The proof constitutes the bulk of the published paper. The team kept the AI attribution to one paragraph, framing the paper as a physics result that stands on its own merits. > *"We gave it the whole problem from scratch... and it came back with the same formula which we had not given it. So it rediscovered the correct formula. But this time it also found the proof."* ## [41:00] Determining the scientific impact and future research Asked to compare the result to the Parke-Taylor formula, Lupsasca is candid that scientific impact is only assessable decades later, but argues the result is genuinely surprising and should open a line of attack toward deeper questions in quantum gravity. The conversation pivots naturally to the second paper. > *"I think the true value of a paper can only be assessed decades into the future based on how much future work it leads to and what developments it opens up."* ## [42:27] Introduction to the second paper on graviton amplitudes Gravitons are the hypothetical quanta of gravity — the spin-2 force carrier analogous to the spin-1 photon (electromagnetism) and gluon (strong force). Unlike gluons, gravitons have never been directly detected, but they are central to quantum gravity theory. The second paper, "Single-Minus Graviton Tree Amplitudes Are Non-Zero," shows the same loophole applies to gravity and that a compact formula extends there too — despite gravitons being mathematically more complex than gluons. > *"We wrote this paper which is called single minus graviton tree amplitudes are non-zero. So it's the same title almost, except with graviton instead of gluon."* ## [45:41] Defining particles, irreducible representations, and symmetry Lupsasca sketches the modern QFT definition of a particle (an irreducible representation of the Poincaré group, classified by Wigner according to mass, spin, and charge) and explains why gravitons are spin-2 while gluons and photons are spin-1, making graviton polarization data twice as rich. Crucially, the second paper was complete within three days of the first going public — most elapsed time was spent verifying correctness, not computing. > *"Most of the time was spent verifying the answer, not writing, which is insane, actually, if you take a step back."* ## [47:46] How GPT Pro generalized the research to gravity For the graviton paper, no internal model was needed — the publicly available ChatGPT GPT-5.2 Pro sufficed. Lupsasca provided the gluon paper as context plus two paragraphs describing the key mathematical changes, then said "Good luck. You're a brilliant theoretical physicist." Over a 110-page exchange, the model worked through the graviton calculation — applying the directed matrix tree theorem, a piece of known combinatorics that neither Lupsasca nor collaborators had thought to invoke — produced correct intermediate results, and wrote a draft paper very close to the final arXiv version from section 3 onward. > *"It's a real solid result in quantum gravity that was done pretty much completely by an AI with human steering it and asking kind of the right questions."* ## [53:57] The epistemological shift: Is this a new way of doing physics? The hosts raise the central epistemological question: if an undergraduate with domain knowledge and good prompting could have done this, what does graduate training mean now? Lupsasca agrees this is the hardest open question facing academia. He notes that arduous calculation trains not just skill but self-confidence, that the gap between coursework and the research frontier is growing, and that many "easy" problems professors once assigned to students are now solvable by AI in minutes. He offers two concrete ways AI has already changed his own workflow: dramatically reducing time spent confused between steps, and enabling parallel AI scouts that explore multiple research directions simultaneously. > *"With AI, actually, you can launch 10 instances of chat and have each one try a different route and send it as a scout that moves very fast into the unknown."* ## [59:27] The use of AI as a 'scout' for research directions Lupsasca elaborates on the scout metaphor: rather than carefully mapping a route from A to C before committing to it, a researcher can now dispatch many AI "scouts" in parallel, get rapid feedback on which directions are promising, and redirect human attention accordingly. Even when a scout makes errors, its signposts reduce orientation cost for the human following. This constitutes a qualitatively new mode of research — one where the bottleneck shifts from calculation to judgment about which directions matter. > *"Even if ChatGPT doesn't always get everything right, just kind of having a scout that signposts some key steps along the way that you can use to anchor your own movement is extremely helpful."* ## [61:44] The role of 'taste' and collaboration with AI The hosts push on the problem of "taste" — the ability to identify which questions are at the productive edge of knowledge. Lupsasca argues that working effectively with ChatGPT requires the same skill a professor develops advising students: knowing what question to give, at what level of detail. "Taste" — knowing where the frontier is and which questions there are tractable — is the last skill to develop and the one AI currently lacks. AI is, he says, like an extremely technically skilled graduate student: given a sharp, well-posed question, it can do incredibly hard computations correctly, but it does not yet know which question to ask. > *"The difference between a good physicist and a great physicist is knowing what is the right question to ask — that is actually the hardest part of being a scientist."* ## [70:23] Personal evolution from AI skeptic to resident scientist Lupsasca recapitulates his personal arc: skeptic → converted by o3 (which solved in 11 minutes a calculation that would have taken him days) → "AI-pilled" by GPT-5 (which reproduced, in 30 minutes, his best published result on black hole Love numbers and tidal symmetries — a paper whose training cutoff predated its arXiv release) → now resident scientist at OpenAI. He notes that no competing model at the time could match GPT Pro on that calculation. > *"In under 30 minutes, with one hint... it completely solved this problem, which is one of the nicest calculations that I've ever done."* ## [72:46] Solving a black hole perturbation problem with GPT-5 Lupsasca details the "Move 37" moment that converted him: his paper "Why Is There No Love in Black Holes?" establishes new symmetry generators for perturbations of a Kerr black hole (explaining why black hole Love numbers — tidal response coefficients, named after mathematician Augustus Love — are exactly zero). When GPT-5 Pro was first given the full problem cold, it failed. But after being primed with the simpler flat-space warm-up (a 200-year-old known result), it then solved the full Kerr black hole problem in 18 minutes. > *"GPT-5 was able to reproduce one of my hardest calculations, which I think the number of people in the world that could do that you could count on your hands."* ## [76:34] Discussing whether AI can make original, conceptual leaps The hosts ask whether AI is doing genuine recombination versus true creative leaps. Lupsasca cites Terry Tao, who has not yet seen an AI proof that cannot be traced to an obscure reference. But Lupsasca has been impressed and frames the distinction as one of degree rather than kind — humans may also be recombination machines. He believes continued scaling will produce feats of insight that look like creativity, and notes OpenAI is actively working on enabling models to take bigger, more out-of-distribution leaps suited to scientific discovery. > *"I'm not sure there's a qualitative difference. I think it's just a matter of degree — as we continue scaling the capabilities, I don't see why it's going to stop."* ## [80:09] Challenges of 'AI slop' and the future of academic publishing With models now capable of turning out a physics paper in 30 minutes when properly steered, the arXiv preprint server is being flooded with submissions. Lupsasca distinguishes legitimate use (expert steering + careful verification) from "AI slop" — poorly prompted outputs submitted without adequate checking. His proposed response: raise the bar rather than increase volume. The single-minus amplitude papers open a clear line of attack toward genuine quantum gravity questions; the goal should be to pursue harder problems, not to publish incrementally. > *"Instead, I think now that we have this new tool that gives us AI superpowers, I think we should just raise the bar for what it means to write a good paper."* ## [83:13] The bottleneck of writing academic papers Asked what single bottleneck he would remove, Lupsasca nominates the paper-writing process itself — finding it increasingly strange that researchers use AI to do calculations, compress results into a static paper, and then readers feed that paper back into AI to understand it. He envisions interactive, LLM-embedded papers as a plausible future. He also identifies two missing capabilities in current models: (1) the spark of creativity to identify the next important question, and (2) reliable self-verification, so that the onus of checking long AI-generated proofs does not fall entirely on humans. > *"Maybe some kind of interactive paper which lives in some LLM. Maybe your whole paper is some ChatGPT page... I think we're going to head in that direction."* ## [90:19] Final takeaways and looking ahead to the next year Lupsasca's closing message: pay attention. The trajectory from "useful for email" to "solves open problems in quantum gravity" has taken roughly 18 months. Models are solving open problems that expert communities spent years on. Extrapolating forward, with more scaling already in the pipeline, the next 6 to 12 months should bring further surprises. The right posture is excitement, careful verification, and a commitment to pursuing harder problems. > *"If you just extrapolate that into the future, imagine where we're going to be in 6 months or a year — I think it's kind of surreal to live through this time, but it's really happening."* ## Entities - **Alex Lupsasca** (Person): Theoretical physicist, Vanderbilt University professor and OpenAI resident scientist; 2024 New Horizons Breakthrough Prize and IUPAP Young Scientist Award winner; expert in black hole physics and scattering amplitudes. - **Andrew Strominger** (Person): Harvard professor and Lupsasca's former PhD advisor; pioneer of celestial holography; co-author of both single-minus amplitude papers. - **Alfredo Guevara** (Person): Postdoctoral researcher at the Institute for Advanced Study (IAS); performed the foundational hand calculations underpinning the AI-assisted breakthrough. - **David Skinner** (Person): Professor at Cambridge University; co-author of the single-minus gluon amplitude paper. - **Terry Tao** (Person): Fields Medal-winning mathematician at UCLA; referenced regarding the question of whether AI proofs involve genuine creativity. - **Scattering Amplitudes** (Concept): Complex-valued functions in quantum field theory encoding probabilities for particles to scatter; the central mathematical objects of both papers discussed. - **Single-Minus Gluon/Graviton Amplitudes** (Concept): Tree-level scattering amplitudes where all but one particle have positive helicity; previously assumed zero in textbooks but shown non-zero in a collinear phase-space region. - **Parke-Taylor Formula** (Concept): Compact closed-form result for maximally helicity violating (MHV, double-minus) gluon amplitudes derived in the 1980s; the template whose analog was sought for single-minus amplitudes. - **Feynman Diagrams** (Concept): Diagrammatic technique to organize perturbative QFT calculations; individual diagrams represent distinct intermediate-particle histories whose amplitudes are summed. - **Love Numbers** (Concept): Coefficients encoding tidal deformability; famously vanish for black holes, a fact connected to hidden symmetries studied in Lupsasca's "Why Is There No Love in Black Holes?" paper. - **Celestial Holography** (Concept): Research program exploring symmetries of quantum gravity via scattering amplitude structure; motivates studying graviton amplitudes. - **OpenAI** (Organization): AI research company where Lupsasca serves as resident scientist; developer of GPT-5 and the internal extended-reasoning model used for the amplitude proof. - **arXiv** (Organization): Open-access physics and mathematics preprint server; mentioned in the context of AI-generated "slop" flooding submissions. - **GPT-5 / ChatGPT Pro** (Software): OpenAI's frontier language model used as the primary AI tool in both amplitude papers; capable of extended reasoning steps of 20-34 minutes per prompt.

#theoretical-physics#quantum-field-theory#gpt-5
Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!
1:58:11
EN/ZH
Watch with Captions
The Diary Of A CEOvor 22 Tagen

Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!

NYU Stern professor and serial entrepreneur Scott Galloway delivers a two-hour reality check on artificial intelligence: the doom-and-gloom predictions from AI CEOs are largely fundraising theatre, yet the technology poses a genuinely insidious risk that almost nobody is discussing — an epidemic of loneliness. Galloway argues that AI primarily benefits the already-wealthy, that tech leaders should not be trusted to self-regulate, and that the most valuable human skill in the AI era is not coding or Mandarin — it is the ability to endure rejection. The conversation weaves through geopolitics, investing, the masculinity crisis, and what it means to find purpose, closing with a raw reflection on grief and fatherhood. ## [00:00] Intro Host Stephen introduces Scott Galloway against a backdrop of rapid AI development and unsettling quotes from tech CEOs predicting total job replacement. Galloway opens with his central thesis: the two greatest brand collapses of the past 18 months are the United States' global reputation and artificial intelligence itself — both victims of overpromising and poor trust management. He signals that he is an AI optimist at the macro level, but insists the people building it do not have the public's best interests at heart. > *"These techs, they do not have our best interests at heart."* ## [02:45] What's Actually True About AI Galloway reveals a striking data point: approval of AI is directly correlated with income. Only households earning over $200,000 per year hold a net-positive view of the technology, because they benefit through rising portfolios and are the heaviest users. Everyone else sees higher electricity bills, no equity stake in the companies, and dismissive comments from leaders like Sam Altman telling people to stop complaining about energy costs. The AI brand, he argues, has shifted in 18 months from "scary but optimistic" to "scary and only good for the already rich." > *"Your view of AI is directly correlated to your wealth. The only cohort that has a positive rating of AI is people making over $200,000."* ## [05:00] Are AI CEOs Exaggerating The Future To Raise Billions? Galloway lays out the economic logic behind AI catastrophizing. These companies sit on astronomical valuations that can only be justified if either (a) a trillion dollars in incremental revenue materialises from AI-powered products, or (b) there is a massive wave of labour cost savings. Because option (a) is not yet visible — he sees no AI-driven products at meaningful scale — the CEOs amplify option (b), painting vivid pictures of job destruction to justify the efficiency gains enterprises need to believe in. He calls some of the doom talk "thinly veiled fundraising," noting that founders catastrophize and then take secondaries and leave for Santorini. > *"The catastrophizing is nothing more than a thinly veiled attempt to say my technology is so devastating that it's going to shift society and you should invest at this crazy valuation."* ## [09:00] What Would Prove The AI Skeptics Wrong? Asked where he could be wrong, Galloway is specific: if unemployment rises to 20% even temporarily, history shows civil unrest follows regardless of eventual job recovery. He points to radiologists and coders as cases where AI has augmented rather than eliminated roles — new coder job listings are up 11% year-on-year. His benchmark for being wrong is sustained destruction outpacing creation fast enough that the recovery "V" triggers social breakdown before the other side is reached. > *"At 20% unemployment, especially among youth, especially young men tend to get very angry and take to the streets."* ## [11:05] Could AI Move Too Fast For Society To Handle? The conversation turns to pace of change. Galloway uses the host's own media empire — 220 hires in 24 months — as a live counter-example to the apocalypse narrative. He notes a structural inversion: for the first time in decades, unemployment among non-college graduates is lower than among college graduates because AI data centres are driving a boom in trades. He praises the entrepreneurial wave unlocked by AI tools and flags Denmark's 2% GDP commitment to retraining versus America's inadequate equivalent as the real policy failure. > *"AI is not going to take your job. Someone who understands AI is going to take your job."* ## [16:05] What Happens When AI Combines With Robots? Galloway addresses Elon Musk's Optimus robot predictions and the convergence of physical automation with AI cognition. His 2026 stock pick is Amazon, which already holds more industrialised robots than the rest of the US combined and plans to double its retail operation by 2032 without additional headcount. He is sceptical of domestic humanoid robots but takes seriously the military application of weaponised autonomous systems as a genuinely dark unknown frontier. > *"Amazon is saying they're going to double their largest business, which is their retail business by 2032 without an incremental hire using robotics, industrialised robots."* ## [19:05] Is Elon Musk Selling Vision or Reality? Galloway separates Musk the innovator from Musk the stock promoter. He calls Starlink the best tech product of the past several years and credits Musk with inspiring the EV race. But Tesla should trade at 30x earnings, not 150x, and capital will migrate to SpaceX when it IPOs at a projected 90–110x revenues. The core insight: the modern CEO's job has inverted from underpromise-and-overdeliver to overpromise-and-underdel in order to access cheap capital and pull the future forward. > *"The key attribute of an innovator right now is storytelling — to make sure the promise is way ahead of the performance such you can access cheap capital and pull the future forward."* ## [24:05] Which Jobs Are First To Disappear In The AI Shift? Long-haul trucking is Galloway's clearest near-term casualty: autonomous trucks can run the 10 pm to 4 am window and trucking is the largest single employer of non-high-school-graduate males in America. Legal work at the junior associate level is already being displaced — he now routes contracts through two competing LLMs rather than a $400–$2,000 law firm review, projecting a third reduction in his annual legal spend. The pattern he observes is multiplication: one AI-fluent analyst replaces five, yet the resulting EBITDA funds expansion that creates new jobs elsewhere in the ecosystem. > *"AI is not going to take your job. Someone who understands AI is going to take your job. So have a second screen — always have a second screen open that has nothing but AI on it."* ## [30:05] What Skills Will Actually Matter In The Future? Storytelling tops Galloway's list — the ability to look at data, construct a narrative arc, and communicate it compellingly across every medium. He holds up Jeff Bezos's 1997 shareholder letter, Jensen Huang's stadium keynotes, and Alex Karp's walk-and-talk earnings calls as models. Relationships are the second pillar: as technology converges and products commoditise, the differentiator is whether people want to work with you. He is honest that predicting specific skills is unreliable — private schools doubled down on computer science and Mandarin a decade ago, and neither bet has paid off as expected. > *"The enduring skill is storytelling — your ability to look at data, create a narrative arc and then communicate that story in a compelling way via all the different mediums."* ## [33:45] Are Young People Losing The Ability To Handle Rejection? Galloway identifies the erosion of rejection-tolerance as the most underrated threat facing young people, especially young men. Frictionless online relationships offer a simulacrum of connection without the emotional labour of real-world risk. He mentors young men by assigning deliberate rejection exercises: approach a stranger for friendship, ask someone out for coffee. The goal is not the yes; it is learning that a no is survivable. He argues his own superpower is simply the willingness to mourn failure and try again. > *"The secret to my success is rejection. I ran for sophomore, junior, and senior class president of my high school. I lost all three times."* ## [39:55] Can You Trust The People Building AI? A sharp cultural critique: America has replaced declining religious institutions with tech idolatry, crowning each new CEO as a secular Jesus Christ. Steve Jobs, then Zuckerberg, then Sam Altman, now Dario Amodei — each is briefly positioned as the good guy before completing the villain's journey. Galloway's argument is not that these people are evil but that they are doing exactly what capitalism demands: maximising earnings regardless of wider harm. The answer is not more trustworthy tech founders; it is competent elected officials who regulate them. > *"Can we trust Sam Altman? No. But we shouldn't need to trust him. We should be able to trust that we have smart elected officials that will regulate these companies."* ## [44:50] Are Tech Leaders Quietly Preparing For The End? Galloway reveals that roughly one in three billionaires maintain a "go bag" — a fully funded escape plan, typically a private jet to Auckland and a fortified New Zealand bunker. He calls this nihilism: the ultra-wealthy have sequestered themselves so completely from ordinary infrastructure — private aviation, concierge medicine, private security, elite schools — that they are no longer invested in the health of society. Their disproportionate political donations are therefore not directed at making the system work for everyone. > *"The problem is the 0.1% are not invested in the health of America. They don't have to put up with TSA lines. They fly private."* ## [52:00] Do Some AI Leaders Believe The Risk Is Worth It? A secondhand but chilling account: a source with direct access to an AI CEO described someone who genuinely believes there is a roughly 7–10% chance their work ends in catastrophe, but considers being the person who summoned this new intelligence consequential enough to proceed regardless. Galloway connects this to widening inequality — the delta between middle-class and ultra-wealthy life has expanded so dramatically across healthcare, travel, and security that the incentives of the 0.1% are structurally misaligned with the rest of society. > *"The bottom 99% of Western societies are essentially being optimised and monetised to make the life of the 1% just unbelievable."* ## [58:04] Ads Sponsored segments for LinkedIn Hiring Pro and Function Health. ## [60:05] Could AI Make Us More Human? Galloway offers a surprising positive: unlike social media algorithms that push users toward political extremes, AI models appear to moderate views by seeking statistical medians. He sees genuine value in AI companionship for isolated elderly users. But he returns to his central fear: the biggest downside of AI is not weapons, not election contamination, not even income inequality — it is loneliness. Men aged 20 to 30 are spending less time outdoors than prison inmates, and 42% of men aged 18 to 24 have never asked a woman out in person. > *"The biggest downside of AI in my view is loneliness. AI is convincing people they can have a reasonable facsimile of life on a screen with an algorithm."* ## [65:00] What Happens When AI Becomes Your Closest Companion The conversation shifts to the Iran conflict as a case study in what happens when strategic incompetence meets operational excellence. Galloway credits the initial military strike as tactically credible but argues the absence of Congressional briefing, Gulf ally coordination, and clear exit objectives has produced a quagmire — and notes Iran's IRGC-produced propaganda is outperforming US information operations in the global war of memes. > *"The problem with wars is that the enemy has a say. And all the enemy needs to do — whether it's the Viet Cong or the Taliban or the IRGC — is survive, and they win."* ## [70:00] The Hidden Trade-Off Between Convenience And Real Relationships Galloway diagnoses America's Iran strategy as a product of a gutted diplomatic corps. When senior officials fly to Islamabad expecting a deal, 97% of the preparatory work that career diplomats would normally complete simply has not happened. The IRGC understands the game better: all they need to do is survive, and every day the conflict continues they look like the underdog who stood up to the superpower. His most optimistic scenario is a multinational force enforcing freedom of navigation through the Strait of Hormuz. > *"Do you know what we have done in the US to our diplomatic corps? We've absolutely gutted it."* ## [75:00] Why Loneliness Could Explode US stock markets hit an all-time high during active Middle East conflict — a sign that the wealthy are so insulated from geopolitical risk that war no longer registers in asset prices. The top 10% account for 50% of consumer spending, and that cohort does not care if gasoline hits six dollars a gallon. The pain is outsourced to lower-income households and oil-dependent nations. Galloway frames this dissociation from shared risk as one of the most dangerous structural features of contemporary inequality. > *"We've outsourced the downside of war to less wealthy nations who are very oil dependent, to the Gulf, which is incurring damage here."* ## [79:26] The Real Reason Human Connection Might Become More Valuable Extended discussion of AI market valuations and the historical pattern of infrastructure overbuild. Every great infrastructure boom — railroads, electrification, the internet — ended in a crash, and AI capex now constitutes a significant share of US GDP growth. Galloway argues there is a one-in-three chance AI ends up like jet aviation or vaccines: transformative for humanity but impossible to monetise exclusively for a small group of companies, because open-weight Chinese models could commoditise the entire stack through "AI dumping." > *"AI puts AI out of business. And that is if you look at the convergence of the technologies, all the models are converging."* ## [85:00] What This Means For The Next Generation Galloway argues that a market correction might actually benefit younger generations by making assets affordable again. He flags GLP-1 drugs as his technology pick over AI in terms of real-world human impact. His personal investment philosophy at age 61: aggressive diversification, no single position above 3% of net worth, rotation out of overheated US markets into Europe and Latin America. For young people, the only wealth-building path he trusts is compound interest through low-cost index funds, with money automatically invested before it can be spent. > *"The only answer I have is slowly — find out a way to start saving when you're a teenager, 25 bucks a month, then in your 20s 100, then 500."* ## [90:00] How Power, Politics, And AI Are Becoming Intertwined Drawing on his experience losing 70% of New York Times ad revenue in 60 days during 2008, Galloway warns that younger entrepreneurs have never experienced a true recession. He argues that the political class has systematically bailed out asset-owning baby boomers — COVID relief, corporate bailouts, perpetual market support — while denying younger generations the chance to buy assets at distressed prices. Recessions historically created entry points; that mechanism is now deliberately suppressed. > *"Your generation really doesn't know what a recession looks like. Like, everything stops."* ## [95:00] The Dangerous Gap Between Technology And Regulation Personal finance advice combined with a reflection on the limits of prediction. Galloway's investment rule for young people: put money in yourself first, then in relationships, then in diversified index funds. He is honest that picking winning sectors is largely futile, and that anyone claiming certainty does not know. His own investment in Pokemon cards with his son illustrates that the best investments compound in non-financial ways — relationships and shared experience accrue value that conventional ROI cannot measure. > *"The only answer I have is slowly and it requires some discipline. Save money, diversify, compound interest, invest in relationships early."* ## [100:00] What Happens If Governments Can't Keep Up With AI Asked what a 33-year-old should know that a 61-year-old has learned, Galloway offers three lessons: be humble in success because much of it is luck; forgive yourself in failure because much of it is also circumstance; and invest aggressively in relationships in your 30s, because he spent his prime years professionally focused and nearly ended up isolated. He frames every major disappointment as something people later regret not the thing itself but how upset they allowed themselves to be. > *"Nothing's ever as good or as bad as it seems. Be humble when you're successful. And forgive yourself and realise this will pass."* ## [105:00] The Future Of Work, Power, And Who Really Wins Fatherhood as purpose. Galloway confesses he did not want children and did not fall in love with his sons immediately after birth. What changed his view was discovering that fatherhood is the one investment where a positive financial return is structurally impossible — and that is precisely what makes it purposeful. The same logic applies to any cause large enough to demand more than you can ever get back: veterans, activism, caregiving. He closes with frank advice on partnership, timing, and the liberation of having no choice but to lean into your children's interests. > *"Finding your purpose is finding that thing that you can never get a real positive return on. I will never get a positive return for my children."* ## [110:00] Why The Biggest AI Risks Aren't What You've Been Told The final chapter opens with Galloway's emotional description of his sons' contrasting personalities — one a mirror of himself, one a "different species" he observes with fascination. He discusses his book *Notes on Being a Man*, framing it as letters he hopes his boys will read in 30 years. The closing question — the biggest setback and its lesson — draws the most emotionally raw answer of the episode: his mother's death. He says he has not gotten over it and does not want to, because grief is the receipt for love, and he hopes his sons will one day feel the same about losing him. > *"My mother dying. And you can never tell your parents how much you love them too much. The reverse of love is grief."* ## Entities - **Scott Galloway** (Person): NYU Stern Professor of Marketing, serial entrepreneur, author of *The Four*, *The Algebra of Happiness*, and *Notes on Being a Man*; host of the Prof G Pod and Pivot podcast - **Sam Altman** (Person): CEO of OpenAI; used as the primary case study in the recurring tech-leader idolisation and disillusionment cycle - **Elon Musk** (Person): CEO of Tesla, SpaceX, and xAI; discussed as visionary storyteller whose real products (Starlink, SpaceX) are transformative but whose timelines consistently overshoot - **Dario Amodei** (Person): CEO of Anthropic; cited as the current tech industry "good guy" before the inevitable villain turn - **Jensen Huang** (Person): CEO of Nvidia; held up as a model of storytelling-driven CEO performance via stadium keynotes - **OpenAI** (Organization): Developer of ChatGPT; primary subject of fundraising-hype and overvaluation critique - **Anthropic** (Organization): AI safety company; referenced as beneficiary of the "latest hero" investor narrative - **SpaceX** (Organization): Musk's rocket company; flagged as likely destination for capital migrating away from Tesla at IPO - **Amazon** (Organization): Galloway's top large-cap stock pick for 2026 due to robotics leadership and warehouse automation scale - **Tesla** (Organization): Great car company trading at an unjustifiable multiple that will correct when SpaceX IPOs - **GLP-1 drugs** (Concept): Weight-loss and metabolic medications (Ozempic/Wegovy class) that Galloway argues will create more real-world human impact and shareholder value than AI - **AI dumping** (Concept): Galloway's term for China flooding the US with cheap open-weight AI models to undermine American AI valuations and destabilise the economy - **Go bag / billionaire nihilism** (Concept): The practice among roughly one-in-three billionaires of maintaining funded escape plans as a symptom of disengagement from shared societal wellbeing - **Rejection tolerance** (Concept): Galloway's candidate for the most underrated skill of the AI era — the willingness to hear no, mourn briefly, and try again

#ai#economics#future-of-work
Robotics' End Game: Nvidia's Jim Fan
20:03
EN/ZH
Watch with Captions
Sequoia Capitalvor 26 Tagen

Robotics' End Game: Nvidia's Jim Fan

Jim Fan, lead of Nvidia's embodied AI research, outlines the transition from language-centric models to World Action Models (WAM) that simulate physical reality. He details a roadmap toward the 'Physical Turing Test' and autonomous factories by 2040, driven by video pre-training and human egocentric data scaling. ## [00:00] Introduction Host Sonya Huang introduces Jim Fan, who leads Nvidia's embodied autonomous research group. Fan reflects on his early days as an intern and the excitement surrounding the future of robotics. > *robots are just one of the most thrilling things that's going to happen.* > *[0, 12]* ## [00:30] DGX One Origin Story Jim Fan recounts the 2016 delivery of the first DGX-1 by Jensen Huang to Elon Musk and the OpenAI team. He highlights how this moment catalyzed the deep learning revolution that led to current AI breakthroughs. > *If you believe in deep learning, deep learning will believe in you.* > *[1, 26]* ## [01:42] The Great Parallel Fan proposes 'The Great Parallel,' applying the successful LLM scaling playbook to robotics. Instead of predicting the next token in a string, the goal is to predict the next physical world state through simulation and alignment. > *instead of simulating strings can we simulate next physical world state?* > *[2, 56]* ## [03:31] Robotics Endgame Setup The strategy for achieving the robotics end game is divided into two primary pillars: model strategy and data strategy. Fan notes that while LLMs are in their final 'boss fight,' robotics is just beginning its scaling journey. > *It boils down to two things, model strategy and data strategy.* > *[3, 32]* ## [03:39] Why VLA Falls Short Visual Language Action (VLA) models are criticized for being 'head-heavy' on language while lacking a fundamental grasp of physics and verbs. Fan argues they are better at encoding static knowledge than dynamic physical interaction. > *VLAs are great at encoding knowledge and nouns, but not so much at physics and verbs.* > *[4, 8]* ## [04:32] Video World Models Fan explains how video models like VEO3 learn internal physics—such as gravity and buoyancy—simply by predicting pixels at scale. These models act as simulators that can solve mazes and plan visual sequences internally. > *Physics emerge by predicting the next blob of pixels at scale.* > *[5, 15]* ## [06:09] DreamZero World Action Nvidia introduces 'Dreamer' and World Action Models (WAM), which jointly decode future world states and motor actions. This allows robots to perform zero-shot tasks by 'dreaming' the correct motion sequence before executing it. > *Dreamer jointly decodes the next world states and next actions.* > *[6, 29]* ## [07:46] Scaling Data Collection To overcome the physical limits of teleoperation, Fan discusses Universal Manipulation Interfaces (UMI) and exoskeletons like Dex-UMI. These tools allow humans to collect high-dexterity data directly without the robot being in the loop. > *we're able to break the curse of 24 hours per robot per day* > *[10, 6]* ## [11:06] EgoScale And Scaling Laws Fan introduces Ego-Exo, a policy trained on 21,000 hours of human egocentric video. This research uncovered a neural scaling law for dexterity, showing a mathematical relationship between pre-training volume and robot performance. > *we discovered this neural scaling law for dexterity.* > *[12, 39]* ## [15:39] DreamDojo And The Roadmap Fan outlines the roadmap to 2040, including the Physical Turing Test and 'lights-out' factories. He introduces Dream Dojo, a neural simulator that replaces classical physics engines with data-driven world models. > *I can say with 95% certainty that we'll get to the end of the end game... by 2040.* > *[19, 19]* ## Entities - **Jim Fan** (person): Lead of the embodied autonomous research group at Nvidia. - **Nvidia** (organization): The technology company developing the hardware and software for the robotics end game. - **Jensen Huang** (person): CEO of Nvidia, mentioned for delivering the first DGX-1 to OpenAI. - **OpenAI** (organization): The research lab that received the first DGX-1 for deep learning development. - **DGX-1** (product): The world's first deep learning supercomputer delivered in 2016. - **VEO3** (model): A video world model capable of simulating physics and visual planning. - **Dreamer** (model): A policy model that predicts future world states and actions simultaneously. - **Ego-Exo** (project): A robotics pre-training framework using large-scale human egocentric video data.

#robotics#nvidia#world-models
Andrej Karpathy: From Vibe Coding to Agentic Engineering
29:49
EN/ZH
Watch with Captions
Sequoia Capitalvor 27 Tagen

Andrej Karpathy: From Vibe Coding to Agentic Engineering

Andrej Karpathy explores the paradigm shift from traditional programming to Software 3.0, where LLMs act as programmable computers driven by context. He details the transition from 'vibe coding' to 'agentic engineering,' emphasizing that while AI handles execution, human taste and understanding remain the ultimate bottlenecks. ## [00:00] Introduction Stephanie Zhan introduces Andrej Karpathy, highlighting his foundational work at OpenAI and Tesla. She notes his unique ability to simplify complex AI shifts and introduces the concept of vibe coding. > *He has a rare gift of making the most complex technical shifts feel both accessible and inevitable. [00:22]* ## [00:44] Feeling Behind as a Coder Karpathy describes a turning point in December 2023 when agentic tools began producing perfect code without manual intervention. This shift led him to adopt vibe coding, trusting the AI to handle complex workflows autonomously. > *I just start to notice that with the latest models the chunks just came out fine. [01:29]* ## [02:28] Software 3.0 Explained Karpathy defines Software 3.0 as a paradigm where the LLM acts as a programmable computer and the context window serves as the primary programming lever. This follows Software 1.0's manual rules and Software 2.0's data-driven weight training. > *Software 3.0 is kind of about your programming now turns to prompting and what's in the context window is your lever. [03:20]* ## [03:44] Agents as the Installer Using the installation of OpenClaw as an example, Karpathy explains how agents replace rigid bash scripts with intelligent, environment-aware execution. This approach allows the AI to debug and adapt to specific system requirements autonomously. > *The agent has its own intelligence that it packages up and then it kind of like follows the instructions. [04:29]* ## [04:49] Menu Gen vs Raw Prompts Karpathy contrasts his custom-coded MenuGen app with raw prompts to models like Gemini, concluding that many traditional software layers are now redundant. He emphasizes that AI can now perform general information processing that was previously impossible with structured code. > *The software 3.0 paradigm is a lot more kind of raw. It just your neural network is doing more and more of the work. [06:11]* ## [07:37] What’s Obvious by 2026 Looking toward 2026, Karpathy envisions neural computers that process raw video and audio directly. These systems would use diffusion models to generate dynamic user interfaces, potentially making traditional UI code obsolete. > *You could imagine completely neural computers... a device that takes raw videos or audio into basically what's a neural net. [08:22]* ## [09:41] Verifiability and Jagged Skills AI models develop 'jagged' capabilities, peaking in verifiable domains like math and code due to reinforcement learning rewards. Karpathy notes the paradox where a model can refactor a massive codebase yet fail simple logic. > *state-of-the-art models today will tell you to walk [to a car wash] because it's so close... This is insane. [11:36]* ## [13:39] Founder Advice and Automation Model performance is heavily dictated by the specific data distributions chosen by frontier labs. Karpathy advises founders to explore the 'circuits' of these models to understand their strengths or use fine-tuning to fill gaps. > *we are slightly at the mercy of whatever the labs are doing, whatever they happen to put into the mix. [12:57]* ## [15:46] From Vibe Coding to Agent Engineering While 'vibe coding' raises the accessibility floor, 'agentic engineering' focuses on maintaining professional quality. This discipline involves coordinating powerful but stochastic agents to accelerate development without sacrificing the engineering bar. > *agentic engineering is about preserving the quality bar of what existed before in professional software. [16:07]* ## [25:17] Agents Everywhere and Learning Karpathy advocates for agent-native infrastructure, expressing frustration with human-centric documentation. He argues that while thinking can be outsourced to AI, human understanding remains a critical bottleneck for directing agents. > *You can outsource your thinking, but you can't outsource your understanding. [28:10]* ## Entities - **Andrej Karpathy** (person): AI researcher and former Director of AI at Tesla and founding member of OpenAI. - **Stephanie Zhan** (person): Partner at Sequoia Capital and host of the discussion. - **Software 3.0** (concept): A paradigm where LLMs act as programmable computers via prompting and context. - **Agentic Engineering** (concept): The professional discipline of coordinating AI agents to maintain software quality. - **MenuGen** (project): An app Karpathy built to OCR and visualize restaurant menus, used as a case study. - **OpenAI** (organization): AI research company co-founded by Karpathy. - **Gemini** (ai-model): Google's LLM used in Karpathy's software comparison. - **Vercel** (organization): A cloud platform used by Karpathy to deploy projects.

#vibe-coding#software-3-0#ai-agents
Ivanka Trump: Was ich mit 9 Jahren lernte, erfahren die meisten nie!
1:36:12
EN/ZH
Watch with Captions
The Diary Of A CEOvor etwa 2 Monaten

Ivanka Trump: Was ich mit 9 Jahren lernte, erfahren die meisten nie!

Ivanka Trump gewaehrt einen offenen Einblick in ihr Leben, von einer besonderen Kindheit, geformt durch beruehmte Eltern und intensive mediale Beobachtung, bis hin zu ihrer wirkungsvollen Karriere in Wirtschaft und oeffentlichem Dienst. Sie teilt Lektionen, die sie von ihrer Mutter lernte, die Herausforderungen beim Aufbau von Vertrauen und wie praegende Erfahrungen wie die Scheidung ihrer Eltern und das Attentat auf ihren Vater ihre Widerstandskraft foerderten. Trump spricht auch ueber ihre Philosophie der Intentionalitaet, die Kraft der Unterschaetzung und ihren Weg des persoenlichen Wachstums durch Mutterschaft und Therapie, der in ihrer missionsgetriebenen Arbeit mit Planet Harvest muendet. ## [00:00] Warum Vertrauen nicht leicht faellt und was das offenbart Ivanka Trump lernte frueh, besonders waehrend der oeffentlich ausgetragenen Scheidung ihrer Eltern im Alter von neun Jahren, sich vor unaufrichtigen Beziehungen zu schuetzen, bedingt durch staendige mediale Beobachtung und aggressive Paparazzi. Ihre Mutter lehrte sie die Kraft der Unterschaetzung und die Bedeutung, aeussere "Stoergeraeusche" unter Druck herauszufiltern. Obwohl sie zunaechst einen starken Abwehrmechanismus gegen Vertrauen entwickelte, hat sie seitdem bewusst einen vertrauensvolleren Ansatz fuer tiefere Verbindungen kultiviert und die damit verbundenen Risiken akzeptiert. > *Meine Mutter lehrte mich, dass unterschaetzt zu werden nichts Schlechtes ist. Es ist tatsaechlich etwas sehr Maechtiges [00:22]* > *Ich habe mir tatsaechlich selbst beigebracht, mehr zu vertrauen. [05:48]* ## [03:32] Wenn man merkt dass man anders ist was dann passiert Ivanka Trump erkannte schon in jungen Jahren, dass ihr Leben untypisch war, bedingt durch staendige Medienaufmerksamkeit und oeffentliche Pruefung ein Phaenomen, das sie mit der heute verstaerkten Exposition von Kindern durch soziale Medien vergleicht. Sie betont, dass ihre Eltern sich bemuehten, sie und ihre Geschwister vor diesen intensiven oeffentlichen Blicken zu schuetzen. Sie bevorzugt ausfuehrliche Gespraeche gegenueber haeufigen Interviews. > *Ich glaube, es gab immer viel Medienaufmerksamkeit und Pruefung. Man sieht es, man erlebt es sehr frueh. [06:24]* > *Nicht jeder ich glaube, die Erfahrung, die unsere Kinder machen, wo ueberall, wo sie hingehen, Menschen ein Aufnahmegeraet in der Hand haben [06:40]* ## [05:44] Wie ihre Mutter hinter verschlossenen Tueren wirklich war Ivanka Trump beschreibt ihre Mutter Ivana als eine disziplinierte ehemalige Nationalskilaeuferin, die ihr den Wert des Sports vermittelte und Ivanka zum Ballett fuehrte. Sie erinnert sich an eine ungewoehnliche Kindheitserinnerung, als Michael Jackson ihre Nussknacker-Auffuehrung besuchte. Trotz dieser aussergewoehnlichen Erlebnisse wurde ihr Alltag durch ihre Grossmutter muetterlicherseits, "Bubby," geerdet, die ihr bedingungslose Liebe schenkte und diese durch Kochen ausdrueckte. > *Meine Mutter war eine unglaubliche Skilaeuferin... sie glaubte wirklich an die Bedeutung des Sports fuer die Entwicklung von Disziplin [07:07]* > *Meine Grossmutter... hat uns wirklich grossgezogen... sie lehrte mich eine Art bedingungsloser Liebe und Zaertlichkeit [08:44]* ## [11:47] Der entscheidende Unterschied der sie praegte Ivanka Trumps Erziehung wurde zutiefst von ihrer fuersorglichen Grossmutter "Bubby," die bedingungslose Liebe und taegliche Betreuung bot, und ihrer Mutter Ivana gepraegt, die als bahnbrechendes Vorbild diente. Ivana verkoerperte Staerke, Ehrgeiz und Widerstandskraft und zeigte, wie man berufliche Ziele verfolgen und gleichzeitig eine liebevolle Mutter sein kann. Ivanka stellt klar, dass ihre Eltern trotz ihrer anspruchsvollen Karrieren praesent waren und ihr das Gefuehl gaben, Prioritaet zu sein, waehrend ihre Grossmutter die traditionelle Betreuerrolle uebernahm. > *Meine Mutter war eine unglaubliche Wegbereiterin... ein grossartiges Beispiel fuer mich fuer Staerke und Widerstandskraft und Glamour und Entschlossenheit und Ehrgeiz. [11:57]* > *Es gab nie einen Zweifel in meinem Kopf, dass ich seine hoechste Prioritaet war und dass er fuer mich erreichbar war. [14:42]* ## [15:43] Was die Scheidung von Donald und Ivana Trump fuer sie wirklich bedeutete Die oeffentlich ausgetragene Scheidung von Donald und Ivana Trump, von der Ivanka im Alter von neun Jahren aus einer Zeitung erfuhr, praegte sie zutiefst. Sie erinnert sich an die Angst vor der intensiven medialen Beobachtung und die normalen Aengste eines Kindes bei einer elterlichen Trennung. Diese herausfordernde Zeit, die mehr Schlagzeilen als der O.J.-Simpson-Prozess erzeugte, foerderte eine besondere Bindung zwischen ihr und ihren Geschwistern. Spaeter im Leben, nach dem Tod ihrer Mutter, gewann Ivanka ein tieferes Verstaendnis fuer Ivanas komplexen Charakter, der durch ihre Erziehung in der kommunistischen Tschechoslowakei geformt wurde, und wuenschte sich, mehr Fragen gestellt zu haben, solange ihre Mutter noch lebte. > *Diese Scheidung erzeugte offenbar mehr Schlagzeilen als der O.J.-Simpson-Prozess. [20:04]* > *Das Positive fuer mich und meine Geschwister war, dass wir uns auf eine andere Art verbunden haben, weil wir es gemeinsam durchmachten. [23:21]* ## [18:27] Die Realitaet als Trumps Tochter was Menschen falsch verstehen Als Donald Trumps Tochter musste sie von klein auf intensive oeffentliche Pruefung bewaeltigen, besonders waehrend der Scheidung ihrer Eltern, die ihr eine notwendige Vorsicht beim Vertrauen lehrte. Seitdem hat sie gelernt, "das Signal im Rauschen zu finden" und sich nicht auf kampflustige soziale Medien einzulassen, wobei sie inneren Frieden priorisiert. Ivanka betont die tiefe Authentizitaet ihrer Eltern, und obwohl sie Kommunikation feinfuehliger angeht, behaelt sie ein starkes Selbstbewusstsein, geleitet von stoischer Philosophie, um authentisch zu leben und aeusserem Druck zu widerstehen. > *Haette ich diese Lektion nicht gehabt, weiss ich nicht, ob ich stark waere. Sie lehrte mich, niemandem zu vertrauen. [18:53]* > *Ich schlage nicht zurueck, weil ich nicht... daran glaube, meine Zeit und Aufmerksamkeit darauf zu verwenden, kampflustig zu sein, in diese bestimmte Arena zu springen und in den haesslichen Strudel der sozialen Medien einzutauchen. [26:19]* ## [23:36] Wie findet man sich selbst umgeben von Macht und Ruhm Umgeben von Macht und Ruhm fand Ivanka Trump ihr Selbstbewusstsein durch bewusstes persoenliches Wachstum und die transformative Erfahrung der Mutterschaft, die sie "aufgebrochen" und ihre Liebesfaehigkeit vertieft hat. Sie betont die entscheidende Bedeutung der Selbstwahrnehmung, um aeusserem Druck zu widerstehen und sich selbst zu definieren, anstatt "den Mob gewinnen zu lassen." Sie wendet diese Philosophie auf ihre Erziehung an, foerdert die Individualitaet ihrer Kinder und wuerdigt ihre eigenen Eltern dafuer, respektvollen Widerspruch zugelassen zu haben, was ihr ermoeglichte, sich selbst treu zu bleiben. > *Wenn du nicht weisst, wer du bist, gewinnt der Mob. [29:55]* > *Sie schufen ein Umfeld, in dem Widerspruch in Ordnung war. [32:44]* ## [30:57] Warum Unterschaetzung ihr groesster Vorteil wurde Ivanka Trump lernte von ihrer Mutter, dass Unterschaetzung ein maechtiger Vorteil sein kann. In ihrer fruehen Immobilienkarriere wurde sie oft falsch eingeschaetzt, sowohl als Kind erfolgreicher Eltern als auch als junge Frau in einer maennerdominierten Branche. Sie nutzte diese Wahrnehmung und verwendete sie als Motivation, haerter zu arbeiten und uebermaessig vorbereitet zu sein, und setzte sie letztlich zu ihrem Vorteil gegen diejenigen ein, die sie unterschaetzten. > *Meine Mutter lehrte mich, dass unterschaetzt zu werden nichts Schlechtes ist. Es ist tatsaechlich etwas sehr Maechtiges [00:22]* > *Ich habe diese Angst, dieses Gefuehl genutzt und es eingesetzt, um mich voranzutreiben. [35:06]* ## [32:59] Worauf sie bei Einstellungen wirklich achtet und warum es wichtig ist Bei Einstellungen priorisiert Ivanka Trump Personen mit einem starken Selbstbewusstsein, Eigeninitiative, gutem Urteilsvermoegen und "Strassenschlauheit," da diese angeborenen Qualitaeten schwer zu vermitteln sind. Sie betont die Bedeutung der Zusammenarbeit mit "guten Menschen," denen sie vertraut und die sie respektiert, und betrachtet diese Eigenschaften als grundlegend fuer erfolgreiche Arbeitsbeziehungen und die gesamte Teamdynamik. > *Es ist sehr schwer, Menschen das beizubringen. Man kann eine brillante Person haben, aber wenn sie kein gutes Urteilsvermoegen hat oder kein Selbststarter ist, ist es sehr schwer, ihr das zu geben. [38:15]* > *Ich moechte nicht mit Menschen arbeiten, die ich nicht mag, die ich nicht fuer gute Menschen halte, weil ich meine Zeit nicht mit jemandem verbringen moechte, dem ich nicht vertraue oder den ich nicht respektiere. [39:00]* ## [37:49] Warum sie die Mode fuer die Regierung verliess Trotz eines prestigetraechtigen Jobangebots von Anna Wintour bei Vogue nach ihrem Abschluss an der Wharton School verfolgte Ivanka Trump ihre lebenslange Leidenschaft fuer Immobilien. Spaeter baute sie eine erfolgreiche Modemarke auf, Ivanka Trump.com, die auf fast 800 Millionen Dollar Jahresumsatz anwuchs. Sie traf jedoch die bewusste Entscheidung, dieses florierende Unternehmen zu schliessen, um den Ethikregeln der Regierung zu entsprechen, als sie die Bitte ihres Vaters annahm, in seiner Regierung zu dienen. Sie betrachtete diese Gelegenheit als unbestreitbares Privileg und Pflicht gegenueber ihrem Land, trotz der erheblichen persoenlichen und beruflichen Opfer. > *Wir machten fast 800 Millionen Dollar Jahresumsatz, als ich es schloss, als ich in die Regierung ging. [42:30]* > *Ich fuehle mich unglaublich privilegiert, dass er uns die Gelegenheit gab, einem Land zu dienen, das wir so sehr lieben. [43:30]* ## [41:06] Was wirklich geschah als Trump sich entschied zu kandidieren Donald Trumps Entscheidung, 2015 fuer das Praesidentenamt zu kandidieren, wurde bei einem Familientreffen in Bedminster angekuendigt und ueberraschte Ivanka mit ihrer Schnelligkeit, trotz seiner langjaehrigen, wenn auch unausgesprochenen, politischen Ambitionen seit den 1980er Jahren. Sie erinnert sich an einen Panikmoment mit 16, als sie befuerchtete, er wuerde kandidieren, nur um beruhigt zu werden, dass dem nicht so sei. Sein Einstieg in die Praesidentschaftspolitik war eine "radikale Umstellung" fuer die Familie, die Ivankas Weltsicht weit ueber ihre New Yorker "Blase" hinaus erweiterte und eine "aussergewoehnliche Reise" in den oeffentlichen Dienst einleitete. > *Ich erinnere mich, dass ich einmal dachte, es waere real. Ich war 16 und auf dem Internat und rief ihn an... 'Das wird mein Leben ruinieren.' [51:48]* > *Sein Wahlkampf hat das fuer mich aufgerissen und mir klargemacht, in was fuer einer Blase ich gelebt hatte [48:02]* ## [46:23] Trumps Praesidentschaftskandidatur was alles veraenderte Donald Trumps Entscheidung, fuer das Praesidentenamt zu kandidieren, veraenderte grundlegend alles fuer Ivanka und markierte eine "radikale Umstellung" fuer die gesamte Familie. Sein unkonventioneller Einstieg in die Politik, unter Umgehung traditioneller Karrierewege, war wie "Wasser aus einem Feuerwehrschlauch trinken." Der Wahlkampf zerstoerte Ivankas wahrgenommene "Blase" in New York City, erweiterte ihre Weltsicht grundlegend und fuehrte dazu, dass sie das Privileg annahm, ihrem Land zu dienen. > *Es war, als wuerde man Wasser aus einem Feuerwehrschlauch trinken, fuer uns alle. [47:08]* > *Sein Wahlkampf hat das fuer mich aufgerissen und mir klargemacht, in was fuer einer Blase ich gelebt hatte [48:02]* ## [48:52] Ads Dieses Segment zeigt eine Werbung fuer Shopify, eine E-Commerce-Plattform, die den Aufbau von Online-Shops, den Verkauf in sozialen Medien und das Management von Ablaeufen mit KI-Tools vereinfacht. Ausserdem wird Pipe Drive beworben, ein intelligentes CRM, das vom Moderator genutzt wird, und das visuelle Pipeline-Dashboard fuer klare Uebersicht ueber Verkaufsprozesse hervorhebt. > *Shopify macht den Einstieg leicht, weil man seinen Shop aufbauen, in sozialen Medien verkaufen, Zahlungen annehmen, KI-Tools nutzen und alles an einem Ort verwalten kann. [49:22]* > *Pipe Drive ist ein benutzerfreundliches, intelligentes CRM... es macht Ihren Verkaufsprozess durch ein Dashboard sichtbar. [50:17]* ## [51:04] Glaubte sie jemals dass ihr Vater es wirklich tun wuerde Obwohl Donald Trump seit den 1980er Jahren eine Kandidatur in Betracht gezogen hatte, erklaert Ivanka, dass diese Ambition waehrend ihrer Kindheit nicht explizit besprochen wurde. Sie erinnert sich lebhaft an einen Moment mit 16, als sie in Panik geriet, weil sie glaubte, ihr Vater wuerde kandidieren, nur um beruhigt zu werden, dass es nicht passiere. Sie merkt an, dass seine konsequenten Standpunkte zu Themen wie Handelspolitik ueber Jahrzehnte unveraendert blieben. > *Ich erinnere mich, dass ich einmal dachte, es waere real. Ich war 16 und auf dem Internat und rief ihn an... 'Das wird mein Leben ruinieren.' [51:48]* > *Sein Standpunkt blieb im Laufe der Zeit konsistent und ist bis heute konsistent, genau in Bezug auf Handelspolitik [52:35]* ## [54:26] War der Abschied vom Weissen Haus eine Erleichterung oder etwas anderes Das Verlassen des Weissen Hauses war keine Erleichterung im Sinne von Bedauern, da Ivanka Trump das Gefuehl hat, "alles gegeben" zu haben, und stolz auf ihre Leistungen waehrend ihrer vier Jahre im oeffentlichen Dienst ist. Sie betrachtet die Gelegenheit zu dienen als ein "grossartiges Privileg," hat aber keinen Wunsch, in die Politik zurueckzukehren, und priorisiert ihre Kinder, da sie nicht bereit ist, sie den Preis eines weiteren oeffentlichen Lebens zahlen zu lassen. Sie ist zufrieden mit ihren Beitraegen und hat das Gefuehl, dass ihr Vater jetzt ein starkes Team hat, das ihn unterstuetzt. > *Ich habe alles gegeben, wissen Sie? Ich schaue nicht zurueck und sage... ich habe keine Reue. [53:33]* > *Meine erste Verantwortung ist es, ihre Mama zu sein. [56:49]* ## [58:08] War irgendjemand wirklich auf das Leben im Weissen Haus vorbereitet Ivanka Trump gibt zu, dass nichts einen wirklich auf die intensive Erfahrung der Spitzenpolitik und das Leben im Weissen Haus vorbereitet. Sie beobachtete, dass Macht, aehnlich wie Reichtum, dazu neigt, die angeborenen Eigenschaften der Menschen zu verstaerken. Ihre Begegnungen mit Staatsfuehrern, von Monarchen bis zu gewaehlten Vertretern, entmystifizierten diese und zeigten, dass sie im Kern "einfach Menschen" mit gewoehnlichen Kaempfen sind, was letztlich jede Einschuechterung ausraeumte, die sie empfunden haben koennte. > *Es gibt nichts, das einen auf diese Erfahrung vorbereitet. [58:26]* > *Man erkennt am Ende des Tages, dass Menschen einfach Menschen sind. [59:03]* ## [59:44] Was das Attentat fuer immer veraenderte Das Attentat auf ihren Vater im Juli 2024 veraenderte Ivanka Trumps Leben grundlegend, verschaerfte die Sicherheitsbedenken und machte den Schutz durch den US Secret Service notwendig. Als sie das Ereignis in Echtzeit mit ihren Kindern miterlebte, war ihre erste Reaktion, sie abzuschirmen, obwohl sie intuitiv spuerte, dass es ihrem Vater gut gehen wuerde. Diese erschuetternde Erfahrung, zusammen mit anderen gesundheitlichen Krisen in der Familie, bekraeftigte ihren Glauben an die Kostbarkeit des Lebens und ihr Engagement, Positivitaet zu waehlen und jeden Moment zu schaetzen, trotz des beunruhigenden Zusammenhangs zwischen oeffentlichem Dienst und Gewalt. > *Meine erste Reaktion war, sie wegzudrehen. [62:02]* > *Im Leben hat man nur die Wahl, wie man reagiert. Und ich entscheide mich, das positive Ergebnis zu sehen. [66:05]* ## [1:07:20] Wie das Leben nach dem Rueckzug aus der Politik aussieht Nach ihrem Rueckzug aus der Politik 2022 priorisiert Ivanka Trumps Leben nun ihre kleinen Kinder und das private Familienleben, da sie die "dunkle Welt" der Politik als unvereinbar mit ihrer Natur empfand. Sie bewaeltigt oeffentliche Kritik mit der Metapher von "Adler und Kraehe" und waehlt, sich ueber Negativitaet zu erheben, anstatt sich darauf einzulassen. Diese Zeit intensiver oeffentlicher Pruefung, einschliesslich der Nahtod-Erfahrung ihres Vaters, war eine "Medizin" fuer persoenliches Wachstum und lehrte sie, inneren Frieden und Harmonie innerhalb ihrer Kontrolle zu suchen und sich auf die Dankbarkeit fuer die Segnungen des Lebens zu konzentrieren. > *Politik ist eine ziemlich dunkle Welt. Es gibt viel Dunkelheit, viel Negativitaet, und das steht einfach wirklich im Widerspruch zu dem, was sich als Mensch gut fuer mich anfuehlt. [67:45]* > *Die Reaktion des Adlers darauf... ist nicht, sich zu drehen und zu wenden und die Kraehe abzuschuetteln oder sich zu verteidigen... Er fliegt einfach hoeher. [69:28]* ## [1:11:04] Ads Dieses Kapitel stellt eine kurze Werbepause innerhalb des Podcasts dar. ## [1:14:24] Wie Therapie ihre gesamte Sichtweise veraenderte Ivanka Trump begann im Erwachsenenalter eine Therapie und betrachtete sie als Werkzeug zur "inneren Bestandsaufnahme," angetrieben von ihrer "wachstumsorientierten Denkweise" und dem Wunsch, bedeutende Lebensereignisse zu verarbeiten. Wichtige Ausloeser waren die zweite Schilddruesenkrebsdiagnose ihres Mannes Jared, ihr Abschied aus Washington und der unerwartete Tod ihrer Mutter. Die Therapie half ihr, sich selbst zu pflegen und Emotionen zu verarbeiten, anstatt sie zu verdraengen, und veraenderte letztlich ihre Perspektive auf Selbstverstaendnis und das Voranschreiten im Leben. > *Ich habe eine sehr wachstumsorientierte Denkweise... Ich versuche immer, ueber mich selbst und die Welt zu lernen [74:35]* > *Jared wurde zum zweiten Mal mit Schilddruesenkrebs diagnostiziert. Und dann starb meine Mutter [75:59]* ## [1:20:28] Der Verlust ihrer Mutter und was er sie lehrte Ivanka Trump reflektiert ueber den ploetzlichen und tragischen Tod ihrer Mutter, Ivana Trump, im Jahr 2022 und hebt die einzigartige Wirkung eines unerwarteten elterlichen Verlusts hervor. Sie verpflichtete sich zu einem angemessenen Trauerprozess, stellte sich dem Unbehagen und verarbeitete ihre Gefuehle. Als Mutter strebt sie nun danach, ihren Kindern die positiven Eigenschaften ihrer Mutter naeherzubringen und gleichzeitig bewusst zu vermeiden, deren Herausforderungen weiterzugeben, wobei sie eine klarere Erwachsenenperspektive auf das Leben ihrer Mutter gewann. > *Sie hat ein gutes Leben gelebt. [81:07]* > *Ich habe mir wirklich die Zeit genommen, ueber sie nachzudenken, nicht durch die Augen des Kindes, das sie voellig idealisierte, sondern durch die Augen einer Erwachsenen, die sie klar sah. [83:15]* ## [1:26:28] Die 3 Regeln die ihrer Meinung nach Erfolg und Glueck bestimmen Ivanka Trump glaubt, dass wahrer Erfolg und Glueck durch drei Schluesselprinzipien definiert werden, besonders fuer Unternehmertum, die sie mit ihrer Tochter Arabella teilen wuerde. Erstens muss man wirklich lieben, was man tut, da Leidenschaft fuer Hingabe unentbehrlich ist. Zweitens ist Authentizitaet von groesster Bedeutung; man selbst zu sein und seinen eigenen Weg zu gehen ist entscheidend, da Nachahmung zum Scheitern fuehrt. Drittens, und am grundlegendsten, muss man Selbstvertrauen entwickeln, bevor die Welt an einen glaubt, da dies der Ausgangspunkt fuer jede Errungenschaft ist. Sie merkt auch an, dass traditionelle "Work-Life-Balance" schwer erreichbar ist und strebt stattdessen nach Uebereinstimmung mit ihren Prioritaeten. > *Ich habe noch nie jemanden auf dem Hoehepunkt seines Spiels gesehen, der nicht absolut liebt, was er tut. [92:46]* > *Man muss an sich selbst glauben, bevor die Welt an einen glaubt. [94:48]* ## [1:28:37] Was Planet Harvest ist und warum es wichtiger sein koennte als man denkt Planet Harvest ist Ivanka Trumps missionsgetriebenes Unternehmen zur Reduzierung von Lebensmittelverschwendung und Unterstuetzung amerikanischer Landwirte. Die Initiative wurde waehrend der COVID-19-Pandemie inspiriert, als sie beobachtete, wie grosse Mengen verderblicher Produkte aufgrund von Lieferkettenproblemen entsorgt wurden. Planet Harvest befasst sich mit dem anhaltenden Problem, dass einwandfreie Lebensmittel von Einzelhaendlern abgelehnt werden, weil sie strenge kosmetische Standards nicht erfuellen, und bietet so zusaetzliche Einnahmen fuer Landwirte bei gleichzeitigem Nutzen fuer die Umwelt. > *Planet Harvest entstand... um sicherzustellen, dass, wenn Menschen Nahrung brauchten, die Nahrung auf den Feldern nicht verschwendet wurde, indem sie untergepfluegt wurde, wie wir es in den ersten Tagen der Pandemie sahen. [89:18]* > *400 Millionen Pfund Erdbeeren werden jedes Jahr auf den Feldern liegengelassen... Nicht weil sie mangelhaft sind. Sie erfuellen einfach eine wirklich strenge kosmetische Spezifikation nicht. [90:57]* ## Entitaeten - **Ivanka Trump** (Person): Tochter von Donald und Ivana Trump, Geschaeftsfrau und ehemalige Regierungsbeamtin. - **The Diary Of A CEO** (Organisation): Der Podcast, in dem das Interview stattfindet. - **Donald Trump** (Person): Ivanka Trumps Vater, ehemaliger Praesident der Vereinigten Staaten. - **Ivana Trump** (Person): Ivanka Trumps Mutter, ehemalige Skilaeuferin fuer die Tschechoslowakei. - **Michael Jackson** (Person): Beruehmter amerikanischer Saenger, Songwriter und Taenzer. - **O.J. Simpson** (Person): Ehemaliger American-Football-Spieler, Moderator, Schauspieler und verurteilter Straftaeter. - **Marcus Aurelius** (Person): Roemischer Kaiser und stoischer Philosoph. - **Shopify** (Organisation): E-Commerce-Plattform zum Aufbau von Online-Shops. - **Pipe Drive** (Organisation): Intelligente CRM-Software (Customer Relationship Management). - **Anna Wintour** (Person): Chefredakteurin der Vogue. - **Vogue** (Organisation): Mode- und Lifestyle-Magazin. - **Wharton School of Business** (Organisation): Wirtschaftshochschule der University of Pennsylvania. - **Office of Government Ethics** (Organisation): US-Regierungsbehoerde zur Vermeidung von Interessenkonflikten. - **Jared Kushner** (Person): Ivanka Trumps Ehemann, der ebenfalls in der Regierung diente. - **US Secret Service** (Organisation): Regierungsbehoerde zum Schutz von Ivanka Trump und ihrer Familie. - **Planet Harvest** (Organisation): Ein von Ivanka Trump mitgegruendetes Unternehmen zur Reduzierung von Lebensmittelverschwendung und Unterstuetzung von Landwirten. - **Arabella** (Person): Ivanka Trumps aelteste Tochter. - **Stoizismus** (Philosophie): Eine antike griechische Philosophenschule. - **Buddhismus** (Philosophie): Eine oestliche Philosophie. - **Daoismus** (Philosophie): Eine oestliche Philosophie. - **Tschechoslowakei** (Ort): Ein ehemaliger Staat in Mitteleuropa. - **New York City** (Ort): Grossstadt in den Vereinigten Staaten. - **Bedminster, New Jersey** (Ort): Ort, an dem sich Ivanka Trump befand, als sie vom Attentat auf ihren Vater erfuhr. - **Child Tax Credit** (Politik): US-Steuergutschrift fuer Familien mit Kindern. - **Great American Outdoors Act** (Politik): Von Ivanka Trump unterstuetzte Gesetzgebung. - **Gesetzgebung gegen Menschenhandel** (Politik): Gesetzgebung, an der Ivanka Trump waehrend ihres oeffentlichen Dienstes arbeitete. - **Berufsbildung und Qualifizierungsprogramme** (Initiative): Programme, die Ivanka Trump zur Qualifizierung und Umschulung amerikanischer Arbeitnehmer foerderte. - **Selbstbetrachtungen** (Buch): Eine Reihe persoenlicher Schriften von Marcus Aurelius.

#ivanka-trump#family#childhood
Der Erkunden→Planen→Coden→Committen Workflow in Claude Code
3:11
EN/ZH
Watch with Captions
ClaudeClaude Code 101vor etwa 2 Monaten

Der Erkunden→Planen→Coden→Committen Workflow in Claude Code

Anthropics dreiminütiger Walkthrough der Schleife, die sie als die wichtigste Gewohnheit beim Arbeiten mit Claude Code betrachten: zuerst im Planmodus recherchieren, festlegen, was "fertig" bedeutet, bevor eine Datei angefasst wird, und dann einen Subagenten den Diff prüfen lassen, bevor gepusht wird. ## [00:03] Warum Erkunden-Planen-Coden-Committen dem direkten Einstieg überlegen ist Die Eröffnung ist direkt: Wenn du aus dem Kurs nur eine Gewohnheit übernimmst, dann diese. Das Versagensmuster, gegen das sie ankämpft, ist der Reflex, eine Aufgabe in Claude einzufügen und dabei zuzusehen, wie sofort Code generiert wird — das priorisiert Geschwindigkeit, aber verschiebt den Korrekturaufwand nach hinten. > *Without this, most people jump straight to pasting in Claude to write code, which means more course correcting later on.* ## [00:21] Planmodus: Nur-Lese-Recherche vor jeder Bearbeitung Der Planmodus fasst Erkunden und Planen in einem einzigen Schritt zusammen. Claude kann Dateien lesen und Websuchen durchführen, darf aber nicht schreiben — Shift+Tab schaltet vom Prompt aus um. Der Erzähler demonstriert mit einer echten Anfrage (WebP-Konvertierung zu einem Bild-Upload-Pipeline hinzufügen, herausfinden, wo sie hingehört, welche Abhängigkeiten benötigt werden, wie man vorgeht). Claude gibt einen Plan zurück; du liest ihn und bittest um Überarbeitungen, falls etwas fehlt. Dies ist der günstigste Punkt im gesamten Zyklus, um die Richtung zu ändern, weil noch nichts geschrieben wurde. > *With plan mode, Claude can't edit files. It just reads files to gather research on how to tackle this implementation.* ## [01:11] Den Plan genehmigen und während Claude codiert korrigieren Sobald der Plan richtig aussieht, gibt Genehmigen die Ausführung an Claude zurück, um die Checkliste abzuarbeiten. Du wählst, ob Dateibearbeitungen automatisch akzeptiert werden oder jedes Mal eine Bestätigung erfordern. Claude wird selbstständig Fehler beheben, aber rechne damit, eingreifen zu müssen — und der Grund, warum sich der Planmodus hier auszahlt, ist, dass der Agent den Recherche-Kontext, der den Plan erzeugt hat, mitführt, sodass Korrekturen mitten im Flug an der richtigen Stelle landen, statt von vorne zu beginnen. > *This is the benefit of working with plan mode because after the plan is finished, we also have the context of how it got to the results to help it guide its next decision.* ## [01:39] Erfolgskriterien explizit machen und Claude echte Werkzeuge geben Ein Plan ohne Definition von "korrekt" lässt Claude raten. Lege fest, wie Erfolg aussieht, und rüste den Agenten aus, dies tatsächlich zu überprüfen: die Claude+Chrome-Erweiterung ermöglicht es ihm, einen Browser-Tab zu steuern, um eine gerade erstellte Benutzeroberfläche zu testen; eine Testsuite gibt ihm etwas, gegen das bei jeder Schleife validiert werden kann, und Claude kann die Tests auch selbst erstellen — aber nur, wenn du sie bereits als Grundwahrheit geprüft hast. Ein Tipp zur Beständigkeit: Wenn Claude immer wieder auf dasselbe Problem stößt, lass es die Lösung in der CLAUDE.md-Datei persistieren, damit es nicht immer wieder neu lernen muss. > *In order for Claude to be confident in its results, it has to be clear on what it deems correct.* ## [02:24] Subagenten-Review, Commit, Zusammenfassung Bevor du pushst, starte einen Subagenten-Code-Reviewer über den Diff — ein zweiter Durchgang ohne Bindung an die Implementierung. Lass dann Claude die Commit-Nachricht in deinem Stil entwerfen und versenden. Die Zusammenfassung rahmt jeden Schritt neu: Erkunden liefert Kontext, Planen definiert Erfolg, Coden ist das Hin-und-Her, das auf den Plan konvergiert, Committen überprüft und pusht, damit du weitermachen kannst. > *A tip before you commit, run a sub agent code reviewer to look at your code.* ## Entities - **Anthropic Tutorial Narrator** (Person): Anthropics offizielle Stimme für den Claude Code 101-Kurs. - **Claude Code** (Software): Agentisches Terminal-Coding-Tool, dessen empfohlene tägliche Schleife das Thema dieser Episode ist. - **Plan mode** (Feature): Nur-Lese-Modus, der mit Shift+Tab umgeschaltet wird — Claude recherchiert und schlägt einen Plan vor, kann aber keine Dateien bearbeiten. - **Claude + Chrome extension** (Software): Ermöglicht Claude Code, einen Chrome-Tab zu steuern, um UI-Änderungen zu überprüfen, bevor eine Aufgabe als abgeschlossen erklärt wird. - **CLAUDE.md** (File): Projektgedächtnis-Datei, die hier als Persistenzziel für wiederkehrende Korrekturen verwendet wird, die Claude immer wieder neu lernt. - **Subagent code reviewer** (Pattern): Vor-Commit Claude-Subagent, der den Diff überprüft, bevor der Mensch pusht.

#claude-code#plan-mode#agentic-coding
Kontextverwaltung in Claude Code
3:51
EN/ZH
Watch with Captions
ClaudeClaude Code 101vor etwa 2 Monaten

Kontextverwaltung in Claude Code

Anthropics Claude Code 101-Tutorial zum Thema Kontext — was das Fenster füllt, wann die automatische Komprimierung einsetzt und welche praktischen Hebel (/compact, /clear, /context, claude.md, MCP-Schalter, Skills, Sub-Agenten) eine Sitzung schlank halten. ## [00:03] Warum der Kontext endlich ist und warum das wichtig ist Der Kontext ist Claudes Arbeitsgedächtnis: Jeder Prompt, jedes gelesene File, jedes Tool-Call-Ergebnis landet im selben Fenster. Das Fenster ist groß, aber endlich — sobald man mehrstufige Sitzungen startet, ist die Optimierung des Inhalts unumgänglich. > *Every file it reads, every command it runs, every message you send, it all takes up space in the context window.* ## [00:39] Automatische Komprimierung und der /compact-Befehl Wenn das Limit naht, komprimiert Claude Code automatisch: Es fasst die wichtigen Punkte zusammen und entfernt rauschende Tool-Call-Ergebnisse, um Platz zu schaffen. Man kann `/compact` auch manuell auslösen — nützlich, wenn man Spielraum will, aber die bisherige Arbeit im Gedächtnis behalten möchte. Nachteil: Die Komprimierung kann Details aus früheren Gesprächsrunden verlieren. > *Compaction will summarize important details and remove the unnecessary tool call results and free up a lot of space in your context window.* ## [01:11] /clear und /context: neu starten und den Verbrauch einsehen Wer einen echten Reset ohne Erinnerung an die vorherige Sitzung will, löscht mit `/clear` alles. Um zu sehen, wohin der Platz tatsächlich geht, zeigt `/context` Gesamtgröße, die größten Verbraucher und eine grafische Aufschlüsselung — die Diagnose, bevor man zwischen compact und clear entscheidet. > *To check the state of your context, run the /context command.* ## [01:35] Die Faustregel: compact mitten in einer Aufgabe, clear zwischen Aufgaben Der Erzähler gibt eine klare Heuristik: Noch an einem Feature und nah am Limit? Compact — der relevante Verlauf soll erhalten bleiben. Plan abgeschlossen und zu etwas Neuem wechselnd? Clear — das alte Gespräch kann neue Arbeit verzerren. > *If you have finished the plan and want to start on a new feature, then clear. You don't want the previous conversation to present bias in anything new that you want to create.* ## [01:57] claude.md, Prompt-Präzision und weniger schreiben durch mehr schreiben Alles, was Claude sitzungsübergreifend wissen soll, gehört in `claude.md`, damit es dieselben Fakten nicht jedes Mal neu entdeckt. Und paradoxerweise verbrauchen kurze Prompts mehr Kontext: Bei einer vagen Anfrage durchsucht Claude die Codebase per grep und denkt mehr nach — beides füllt das Fenster. Ein oder zwei Sätze Präzision sparen danach viel Platz. > *The irony behind writing a smaller prompt is that it in the long run, it will take up more context.* ## [02:26] MCP-Server, Skills und Sub-Agenten als Kontextwerkzeuge MCP-Server laden standardmäßig alle exponierten Tools in den Kontext — kein Problem bei Relevanz, teuer wenn nicht, also nicht benötigte deaktivieren. Skills verhalten sich wie MCP-Server, laden aber nicht die gesamte Tool-Oberfläche in den Kontext. Sub-Agenten laufen parallel mit eigenem Fenster; für Rechercheaufgaben ("Wo sind die Auth-Endpunkte?") kann man einen Sub-Agenten beauftragen und nur die Antwort zurückbekommen, statt den gesamten Suchpfad. > *Sub agents run in parallel with your main agent but has a complete separate context window.* ## [03:06] Zusammenfassung Die Kontextverwaltung in Claude Code entscheidet zwischen einer langen produktiven Sitzung und einer ins Stocken geratenen. `/compact` für lange Sitzungen zusammenfassen, `/clear` für einen Neustart, Prompts präzise formulieren, `/context` prüfen, was das Fenster füllt, und reine Rechercheaufgaben an Sub-Agenten delegieren. > *Managing context within cloud code is crucial. Use slash compact to summarize long sessions and slashclear to start fresh.* ## Entitäten - **Anthropic Tutorial Narrator** (Person): Anthropics offizielle Stimme für die Claude Code 101-Tutorialserie. - **Claude Code** (Software): Anthropics agentischer Terminal-Coding-Assistent, dessen Kontextfenster das Thema dieser Episode ist. - **Context window** (Concept): Claudes Arbeitsgedächtnis — endlich, gefüllt durch Prompts, Dateilektüre und Tool-Call-Ergebnisse. - **/compact** (Command): Slash-Befehl (und Auto-Trigger), der den Verlauf zusammenfasst und Tool-Call-Rauschen entfernt, um Platz zu schaffen. - **/clear** (Command): Slash-Befehl, der die Sitzung vollständig löscht für einen sauberen Start bei neuer Arbeit. - **/context** (Command): Slash-Befehl, der Gesamtgröße des Kontexts und die verbrauchenden Kategorien anzeigt. - **claude.md** (File): Projektweite Gedächtnisdatei, die Claude sitzungsübergreifend liest, damit er dieselben Fakten nicht neu entdeckt. - **MCP servers** (Software): Tool-Anbieter, die standardmäßig alle exponierten Tools in den Kontext laden — deaktivieren, wenn irrelevant. - **Skills** (Feature): Leichtgewichtige Alternative zu MCP-Servern, die nicht die gesamte Tool-Oberfläche in den Kontext lädt. - **Sub agents** (Feature): Parallele Agenten mit eigenen Kontextfenstern, die gezielte Fragen beantworten, ohne das Hauptfenster zu belasten.

#claude-code#context-window#compact
Warum KI Mathematiker noch nicht ersetzen wird – Terence Tao
4:12
EN/ZH
Watch with Captions
Dwarkesh Patelvor etwa 2 Monaten

Warum KI Mathematiker noch nicht ersetzen wird – Terence Tao

Terence Tao diskutiert die sich wandelnde Rolle der KI in der Mathematik. Zwar werde KI viele Routineaufgaben automatisieren, doch die menschlichen Mathematiker werde sie nicht vollständig ersetzen – vielmehr verschiebt sie deren Fokus auf neue Grenzgebiete. Er hebt die Zukunft der Mensch-KI-Zusammenarbeit und die unvorhersehbaren Langzeitfolgen der KI für wissenschaftliche Entdeckungen hervor. ## [00:10] Die aktuelle Rolle der KI in der Frontier-Mathematik Terence Tao erläutert, dass KI bereits „Frontier-Mathematik" betreibt, die für Menschen unerreichbar ist – allerdings eine andere Art von Frontier. Er vergleicht dies mit den Taschenrechnern der Vergangenheit, die mathematische Möglichkeiten erweiterten, indem sie auf spezialisierte Weise Aufgaben übernahmen, die jenseits der menschlichen Kapazität lagen. > *In gewisser Weise betreiben sie bereits Frontier-Mathematik, die superintelligent ist und die Menschen nicht leisten können – aber es ist eine andere Art von Frontier als die, an die wir gewöhnt sind.* ## [00:52] KI als Automatisierungswerkzeug, nicht als Ersatz Tao prognostiziert, dass KI innerhalb eines Jahrzehnts viele Routineaufgaben übernehmen wird, die heute Mathematiker erledigen, sodass Menschen sich auf komplexere, wichtigere Probleme konzentrieren können. Er zieht Parallelen zu historischen Umbrüchen: Computer automatisierten einst die Arbeit menschlicher „Rechner", und die Genomsequenzierung wurde automatisiert, doch Felder wie die Genetik entwickelten sich auf neuen Skalen weiter. > *Innerhalb eines Jahrzehnts wird vieles von dem, was Mathematiker heute tun, … von KI erledigt werden können. Aber wir werden merken, dass das eigentlich nicht der wichtigste Teil unserer Arbeit war.* ## [02:46] Die Zukunft der Mensch-KI-Zusammenarbeit in der Mathematik Dwarkesh Patel fragt nach der Möglichkeit, dass KI die Millennium-Probleme autonom löst. Terence Tao glaubt, dass „hybride Mensch-plus-KI"-Ansätze die Mathematik noch viel länger dominieren werden – der heutigen KI fehlen schlicht noch alle Zutaten, um intellektuelle Aufgaben vollständig zu ersetzen; sie fungiert vielmehr als ergänzendes Werkzeug. > *Ich glaube tatsächlich, dass diese hybride Mensch-plus-KI die Mathematik noch sehr viel länger dominieren wird.* ## [03:43] Unvorhersehbare Auswirkungen auf wissenschaftliche Entdeckungen Tao räumt ein, dass KI zwar Wissenschaft und neue Entdeckungen beschleunigen wird, zugleich aber bestimmte Fortschrittspfade hemmen könnte, indem sie die „Serendipität zerstört". Die langfristigen Folgen der KI für wissenschaftliche Entdeckungen seien höchst unvorhersehbar. > *Es ist möglich, dass wir, indem wir irgendwie Serendipität zerstören, bestimmte Fortschrittstypen tatsächlich hemmen.* ## Entitäten - **Terence Tao** (Person): Gast, einer der bedeutendsten Mathematiker der Gegenwart. - **Dwarkesh Patel** (Person): Host des Podcasts. - **KI (AI)** (Konzept): Künstliche Intelligenz; diskutiert in ihrer Rolle für Mathematik und wissenschaftliche Entdeckungen. - **Mathematica / Wolfram Alpha** (Software): Rechentools, als Beispiele für Automatisierung in der Mathematik genannt. - **Millennium-Probleme (Millennium Prize Problems)** (Konzept): Sieben ungelöste mathematische Probleme, für die jeweils eine Million US-Dollar ausgelobt ist.

#ai#mathematics#terence-tao
Subagenten effektiv einsetzen
4:44
EN/ZH
Watch with Captions
ClaudeClaude Code subagentsvor 2 Monaten

Subagenten effektiv einsetzen

Subagenten entfalten ihre Stärke, wenn die Zwischenarbeit nicht in den Haupt-Thread gehört — doch wahllose Delegation macht die Dinge schlechter. Dieses Tutorial zieht die Grenze zwischen sinnvoller Delegation (Recherche, Code-Review, domänenspezifische System-Prompts) und verbreiteten Antimustern (Expert-Persona-Claims, sequenzielle Pipelines, Test-Runner), die Kontext verbrennen und genau die Informationen verlieren, auf die es ankommt. ## [00:03] Einführung: wann Subagenten helfen und wann nicht Die bisherigen Folgen der Serie behandelten Erstellung und Design von Subagenten. Diese Abschlussfolge richtet den Blick auf die Deploymentfrage: Bei welchen Aufgaben lohnt es sich wirklich, einen separaten Agenten zu starten — und bei welchen entsteht dabei Schaden? Die Antwort hängt an einem einzigen Test: Spielt die Zwischenarbeit für den Haupt-Thread eine Rolle? Wenn Erkundung und Ausführung getrennt sind, rechnen sich Subagenten. Wenn jeder Schritt vom Ergebnis des vorherigen abhängt, kostet der Übergabe-Overhead genau die Details, die man braucht. > *"Simply put, the difference comes down to whether the intermediate work matters to your main thread."* ## [00:32] Rechercheaufgaben: Erkundung isoliert halten Authentifizierungs-Tracing ist ein konkretes Beispiel. Der Haupt-Thread braucht zu wissen, wo die JWT-Validierung stattfindet — nicht die zwölf Dateien, die auf dem Weg gelesen wurden. Ein Recherche-Subagent kann die gesamte Codebasis scannen, Funktionsaufrufe über Dateigrenzen hinweg verfolgen und eine einzige präzise Antwort zurückgeben: JWT-Validierung findet in middleware/auth.js Zeile 42 statt, aufgerufen von route/api.js. Die gesamte Erkundung bleibt im Kontext des Subagenten eingeschlossen. Der Haupt-Thread erhält die Schlussfolgerung und arbeitet weiter, ohne dass der Suchverlauf sein Fenster verstopft. > *"Your main thread receives JWT validation happens in middleware/auth.js at line 42, called from the Express router and route/api.js, or something like that."* ## [01:15] Code-Review-Subagenten: unvoreingenommenes Feedback Claude, das Code überprüft, den es selbst mitgeschrieben hat, kämpft mit einem Bias-Problem: Es war bei jeder Entscheidung dabei und kann nicht leicht erkennen, was von außen seltsam wirkt. Ein Reviewer-Subagent umgeht das vollständig: Er sieht nur den Diff und die geänderten Dateien, ohne jede Erinnerung daran, wie der Code entstanden ist. Dieser leere Ausgangszustand schafft einen zweiten Vorteil. Projektspezifische Review-Kriterien — Namenskonventionen, Sicherheitsmuster, Architekturregeln — lassen sich einmal im System-Prompt des Subagenten codieren und werden dann konsistent angewendet, ohne dass der Haupt-Thread sie Runde für Runde im Gedächtnis behalten muss. > *"A reviewer sub agent sees the changes in a separate context. It runs get diff, reads the modified files, and applies its specialized review criteria without the history of how the code was written."* ## [01:59] Eigene System-Prompts: Texterstellung und Styling Der Standard-Prompt von Claude Code ist auf knappe, technische Ausgabe optimiert — genau das Falsche für eine Landing Page oder eine Marketing-E-Mail. Ein Texterstellungs-Subagent erhält völlig andere Anweisungen zu Ton, Zielgruppe und Struktur und erzeugt Ergebnisse, die die Standardeinstellungen des Haupt-Threads nie liefern würden. Dieselbe Logik gilt für CSS. Ein Styling-Subagent, der die Design-System-Dateien im Prompt erwähnt, lädt automatisch Farbvariablen, Abstandskonventionen und Komponentenmuster in seinen Kontext, bevor er eine einzige Zeile schreibt — jede Styling-Entscheidung spiegelt so das echte System wider und nicht gut gemeinte Vermutungen. > *"Claude Code's default prompt tends towards concise, technical writing, which really isn't what you want for a landing page or email campaign, unless you want to put your customers to sleep."* ## [02:57] Antimuster: Expert-Claims, Pipelines, Test-Runner Drei Muster verschlechtern die Ergebnisse zuverlässig. Erstens: Persona-Prompts — „Du bist ein Python-Experte" oder „Du bist ein Kubernetes-Spezialist" — bringen nichts, weil Claude dieses Wissen ohnehin besitzt. Einen Subagenten allein für ein Experten-Label zu starten, kostet den Isolations-Overhead, ohne dass etwas gewonnen wird, was der Haupt-Thread nicht selbst leisten könnte. Zweitens: Sequenzielle Pipelines brechen zusammen, sobald die Schritte nicht wirklich unabhängig sind. Ein Drei-Agenten-Ablauf — Bug reproduzieren, debuggen, beheben — klingt sauber, scheitert aber in der Praxis: Der Debug-Agent braucht den Live-Kontext des Reproduktions-Agenten, nicht dessen komprimierte Zusammenfassung. Drittens: Test-Runner-Subagenten verbergen aktiv Informationen. Wenn Tests scheitern, braucht man die Rohausgabe, um die Ursache zu diagnostizieren. Ein Subagent, der nur „test failed" zurückgibt, zwingt dazu, zusätzliche Debug-Skripte zu schreiben, um Details zu rekonstruieren, die direkte Ausgabe sofort gezeigt hätte. > *"A sub-agent that returns a test failed forces you to create additional debug scripts to get details that would have been visible in direct output."* ## [04:10] Serienrückblick und die entscheidende Heuristik Rückblick auf die Serie: Subagenten sind isolierte Threads, die mit /agents erstellt werden, mit strukturierter Ausgabe und konkreten Beschreibungen entworfen sind und Zusammenfassungen zurückgeben. Einsetzen für Recherche, Code-Review und Aufgaben, die einen eigenen System-Prompt erfordern. Meiden bei Expert-Persona-Claims, mehrstufigen abhängigen Pipelines und Testausführung. Das gesamte Framework verdichtet sich auf eine Frage: Spielt die Zwischenarbeit eine Rolle? Wenn nicht, delegieren. > *"The key question, does the intermediate work matter? If not, then delegate it."* ## Entitäten - **Anthropic Tutorial Narrator** (Person): Moderator der Claude Code Subagenten Tutorial-Serie, Anthropic - **Claude Code** (Software): Anthropics KI-Coding-Assistent; die Umgebung, in der Subagenten erstellt und orchestriert werden - **Subagent** (Konzept): isolierter Claude-Thread, der aus dem Hauptkontext gestartet wird und eine komprimierte Zusammenfassung zurückgibt, anstatt seinen vollständigen Arbeitskontext offenzulegen - **JWT (JSON Web Token)** (Konzept): als Arbeitsbeispiel für einen Recherche-Subagenten verwendet, der Authentifizierungslogik in einer Codebasis verfolgt - **System prompt** (Konzept): subagenten-spezifischer Anweisungssatz, der domänenspezifisches Verhalten ermöglicht, das vom Standard-Prompt von Claude Code abweicht - **Anthropic** (Organisation): Entwickler von Claude und der Claude Code Subagenten Tutorial-Serie

#claude-code#subagents#ai-agents
Einen Subagenten erstellen
3:45
EN/ZH
Watch with Captions
ClaudeClaude Code subagentsvor 2 Monaten

Einen Subagenten erstellen

Claude Code bringt eingebaute Subagenten mit, doch benutzerdefinierte Subagenten erlauben es, spezialisiertes Verhalten für konkrete Aufgaben einzubinden. Dieses Tutorial erstellt von Grund auf einen Code-Review-Subagenten — mit dem `/agents`-Befehl, der Tool-Auswahl, der Modellwahl und den Konfigurationsfeldern, die steuern, wann und wie Claude delegiert. ## [00:03] Was benutzerdefinierte Subagenten sind Claude Code enthält eingebaute Subagenten, aber man kann auch eigene erstellen, die auf bestimmte Aufgaben spezialisiert sind. Ein benutzerdefinierter Subagent ist eine Markdown-Datei mit YAML-Front-Matter: Das Front-Matter teilt Claude mit, wann er zu diesem Agenten routen soll und welche Fähigkeiten er hat, während der Markdown-Textteil der System-Prompt ist, unter dem der Subagent läuft. > *"Custom sub aents are markdown files with YAML front matter. These markdown files contain configuration that helps claude understand when to use the sub aent and provides directions to the sub aent itself."* ## [00:28] Einen Subagenten mit /agents erstellen Der Befehl `/agents` öffnet das Agentenverwaltungspanel. Bei „Neuen Agenten erstellen" werden zwei Fragen gestellt: der Geltungsbereich (aktuelles Projekt oder auf allen Projekten des Rechners geteilt) und die Generierungsmethode. Empfohlen wird, Claude den Agenten automatisch generieren zu lassen. Im Tutorial tippt der Sprecher auf Englisch eine Anfrage für einen Subagenten, der Code-Qualität und Sicherheitsprobleme prüfen soll, und Claude erledigt den Rest. > *"Now, the easiest way to create a sub agent is with the / agents command. Next, you can create a sub agent manually, but we recommend using claw code to automatically generate it for you."* ## [00:56] Tools, Modell und Farbe konfigurieren Bevor Claude die Datei schreibt, wählt man aus, auf welche Tools der Subagent zugreifen darf. Ein Code-Review-Agent braucht Bearbeitungs-Tools nicht unbedingt, aber Ausführungsrechte zu belassen erleichtert es ihm, ausstehende Änderungen zu prüfen. Nach den Tools wird das Modell gewählt: haiku für Geschwindigkeit, opus für Tiefe, sonnet als Mittelweg. Zuletzt wählt man eine Farbe, die in der Oberfläche angezeigt wird, um den Subagenten auf einen Blick zu erkennen. > *"Now, given that our sub agent is only responsible for reviewing code, you might decide to disallow tools for editing, but I'll leave an execution to allow the sub agent to more easily identify pending changes."* ## [01:43] Die Konfigurationsdatei verstehen Die generierte Datei wird im Projekt unter dem im Zusammenfassungsfenster angezeigten Pfad gespeichert. Vier Felder sind besonders wichtig. `name` ist der eindeutige Bezeichner — man kann ihn durch Eingabe von `@agent-code-quality-reviewer` in einer Nachricht referenzieren. `description` ist das, was Claude liest, um zu entscheiden, ob er delegiert; sie muss in einer Zeile stehen (escapte `\n`-Zeichen werden wörtlich behandelt). „proactively" in der Beschreibung lässt Claude öfter auf den Agenten zurückgreifen; Beispielgespräche machen das Routing präziser. `tools` spiegelt die bei der Generierung erteilten Zugriffsrechte wider, kann aber direkt in der Datei geändert werden. > *"If you want Claude to use the sub agent automatically more often, add in the word proactively to the description."* ## [02:41] Der System-Prompt und wie Claude ihn nutzt Das Feld `model` akzeptiert `haiku`, `sonnet`, `opus` oder `inherit` — mit `inherit` läuft der Subagent auf demselben Modell wie das übergeordnete Gespräch. Alles nach dem Front-Matter ist der System-Prompt: Er leitet den Subagenten durch seine Aufgabe und gibt an, wie er Ergebnisse an den Hauptagenten zurückgeben soll. > *"The system prompt will provide guidance to the sub agent, helping it understand how to complete its task and how it should return information back to the main agent."* ## [03:15] Den Subagenten testen Nach dem Speichern der Konfiguration einige Codeänderungen vornehmen und Claude bitten, sie zu überprüfen. Wenn der Subagent nicht zum erwarteten Zeitpunkt anspringt, ist das Feld `description` der erste Ansatzpunkt — spezifischere Beispiele schärfen Claudes Gespür dafür, wann delegiert werden soll. > *"If the sub agent isn't being used when you expect, check your description. Adding more specific examples helps Claude understand when to delegate."* ## Entitäten - **Anthropic Tutorial Narrator** (Person): einziger Moderator dieser Episode; präsentiert die Claude Code Subagents-Tutorialserie auf Anthropics offiziellem YouTube-Kanal - **Claude Code** (Software): Anthropics KI-Coding-Assistent; unterstützt sowohl eingebaute als auch benutzerdefinierte Subagenten - **Custom subagent** (Konzept): Markdown-Datei mit YAML-Front-Matter, die Claude Code so konfiguriert, dass bestimmte Aufgaben an eine spezialisierte Agenteninstanz delegiert werden - **/agents command** (Konzept): UI-Einstiegspunkt von Claude Code zum Erstellen und Verwalten von Subagenten; Geltungsbereich projektbezogen oder global - **System prompt** (Konzept): Markdown-Textteil der Subagenten-Konfigurationsdatei; liefert dem Subagenten zur Laufzeit Aufgabenanleitungen und Ausgabeformatanweisungen - **Anthropic** (Organisation): Entwickler von Claude und der Claude Code-Plattform

#claude-code#subagents#ai-agents
Effektive Subagenten entwerfen
3:42
EN/ZH
Watch with Captions
ClaudeClaude Code subagentsvor 2 Monaten

Effektive Subagenten entwerfen

Dieses Tutorial aus der Claude Code-Serie von Anthropic stellt vier konkrete Muster vor, die zuverlässige Subagenten von solchen unterscheiden, die abdriften, hängenbleiben oder Dateien verändern, die sie nicht anfassen sollten. Der Erzähler geht jeden Ansatz anhand eines Code-Review- und eines Websuche-Subagenten durch und zeigt genau, welche Konfigurationsparameter angepasst werden und warum. ## [00:03] Subagenten-Verhalten über Name und Beschreibung steuern Jede Nachricht an den Haupt-Kontextfenster-Agenten enthält im System-Prompt den Namen und die Beschreibung aller registrierten Subagenten. Die Beschreibung erfüllt damit eine Doppelfunktion: Sie teilt dem Orchestrator mit, *wann* er den Subagenten starten soll, und liefert die Vorlage, anhand derer er den Eingabe-Prompt formuliert. Das Tutorial demonstriert dies mit einem Code-Review-Subagenten. In der ursprünglichen Konfiguration schreibt der Orchestrator einen generischen Prompt, der den Subagenten anweist, selbst `git diff` aufzurufen. Wird die Beschreibung so geändert, dass sie lautet „Du musst dem Agenten genau mitteilen, welche Dateien er prüfen soll", geht die Verantwortung für die Dateiauswahl an den Orchestrator über — der nächste Lauf produziert einen deutlich spezifischeren Eingabe-Prompt. Denselben Hebel gibt es für Websuche-Subagenten: Das Hinzufügen von „Liefere Quellen, die zitierbar sind" zur Beschreibung sorgt dafür, dass der Hauptthread diese Anweisung bei jeder Delegation automatisch einschließt. > *"If you want to better control when the main agent launches a sub agent automatically, you should modify the name and description."* ## [01:41] Ausgabeformate definieren Der Erzähler bezeichnet das Ausgabeformat als die wirksamste Einzelverbesserung. Ohne ein definiertes Format fehlt dem Subagenten ein klares Signal dafür, wann er genug getan hat — er läuft weiter, sammelt Kontext an und verbraucht Token. Ein strukturiertes Ausgabeformat schafft einen natürlichen Haltepunkt: Sobald die Pflichtfelder gefüllt sind, weiß der Subagent, dass er fertig ist. Praktisch bedeutet das, dem System-Prompt des Subagenten ein explizites Schema hinzuzufügen — einen Zusammenfassungsblock, eine Befundliste, ein Statusfeld. > *"Without a defined output format, sub agents struggle to decide when enough research has been done and they tend to run much much longer than sub agents that are given an output format."* ## [02:04] Hindernisse im Ergebnisbericht melden Wenn ein Subagent ein Problem löst — einen Abhängigkeitskonflikt, einen Befehl, der unerwartete Flags benötigt, eine Eigenheit der Umgebung — muss der Hauptthread diese Information erhalten, sonst läuft er im nächsten Schritt in dieselbe Wand. Die Lösung besteht darin, das Melden von Hindernissen direkt in das Ausgabeformat zu integrieren. Der Erzähler nennt die Kategorien, die immer auftauchen sollten: aufgetretene Hindernisse, Einrichtungsprobleme, gefundene Workarounds, Befehle, die spezielle Flags oder Konfigurationen erforderten, sowie Abhängigkeiten oder Imports, die Schwierigkeiten verursachten. Werden diese ins Pflichtschema aufgenommen, erbt der Hauptthread die hart erkämpften Erkenntnisse des Subagenten, statt sie neu erarbeiten zu müssen. > *"Otherwise, the main thread has to rediscover the same solutions, obstacles encountered, any setup issues, workarounds discovered or environment quirks, commands that needed special flags or configuration, dependencies or imports that cause problems."* ## [02:42] Werkzeugzugriff nach Rolle einschränken Der Werkzeugzugriff ist nicht nur eine Sicherheitskontrolle — er ist auch ein Mittel zur Rollenklarheit. Ein schreibgeschützter Subagent mit nur `glob`, `grep` und `read` kann keine Dateien versehentlich ändern, was seine Rolle für alle, die die Konfiguration lesen, unmissverständlich macht. Der Erzähler ordnet drei Zugriffsebenen drei Subagenten-Rollen zu: Ein Recherche-Subagent erhält nur Lesezugriff, weil das Erkunden der Codebasis keine Schreibvorgänge erfordert. Ein Review-Subagent bekommt `bash` für `git diff`, aber keine Dateibearbeitungswerkzeuge. Nur Subagenten, die explizit damit beauftragt sind, Code zu verändern — etwa einer, der CSS-Updates einspielt — erhalten `edit` und `write`. Bei mehreren Subagenten im Einsatz wird die Werkzeugliste zu einer maschinenlesbaren Zusammenfassung der Aufgabe jedes Einzelnen. > *"Only give edit and write to sub agents that should actually change your code, like a styling agent applying CSS updates."* ## [03:27] Die vier Muster effektiver Subagenten Das Tutorial schließt mit einer einzigen Zusammenfassung aller vier Muster: strukturierte Ausgabe, Hindernismeldung, präzise Beschreibungen und eingeschränkter Werkzeugzugriff. Jedes Muster verstärkt die anderen — präzise Beschreibungen reduzieren Unklarheiten in Eingabe-Prompts, Ausgabeformate schaffen Haltepunkte, Hindernismeldungen sichern den Kontext über Agentengrenzen hinweg, und minimaler Werkzeugzugriff verhindert Nebeneffekte, die verbleibende Unklarheiten verstärken würden. > *"So effective sub agents use structured output report obstacles have specific descriptions and limit tool access."* ## Entitäten - **Anthropic Tutorial Narrator** (Person): Moderator der Claude Code Subagenten-Tutorial-Serie im Auftrag von Anthropic - **Claude Code** (Software): Anthropics agentisches Coding-Tool, das Subagenten orchestriert, um mehrstufige Engineering-Aufgaben abzuschließen - **Subagent** (Konzept): eine spezialisierte Claude-Instanz, die von einem Orchestrator-Agenten gestartet wird und über einen eigenen System-Prompt, Werkzeugzugriff und Eingabe-Prompt verfügt - **Ausgabeformat** (Konzept): ein im System-Prompt eines Subagenten definiertes Pflichtschema, das eine Abbruchbedingung schafft und die an den Hauptthread zurückgegebenen Informationen strukturiert - **Hindernismeldung** (Konzept): ein Muster, das Subagenten verpflichtet, Workarounds, Abhängigkeitsprobleme und Umgebungsbesonderheiten in ihrer Ausgabe zu melden, damit der Orchestrator sie nicht neu entdecken muss - **Werkzeugzugriff einschränken** (Konzept): jeden Subagenten auf die Werkzeuge zu beschränken, die seine Rolle erfordert — Lesezugriff für Recherche, bash für Reviews, edit/write nur für Agenten, die Dateien ändern müssen - **Anthropic** (Organisation): Schöpfer von Claude und der agentischen Coding-Plattform Claude Code

#claude-code#subagents#ai-agents
Was sind Subagenten?
2:48
EN/ZH
Watch with Captions
ClaudeClaude Code subagentsvor 2 Monaten

Was sind Subagenten?

Subagenten sind spezialisierte Assistenten, an die Claude Code Aufgaben delegieren kann — jeder läuft in einem eigenen, isolierten Kontextfenster, erledigt seine Arbeit selbstständig und liefert danach eine kompakte Zusammenfassung zurück, während der vollständige Zwischenverlauf verworfen wird. Dieses zweiminütige Tutorial von Anthropic erklärt, warum diese Isolation das Hauptkontextfenster nutzbar hält, zeigt ein konkretes Code-Explorations-Szenario, das den Kompromiss verdeutlicht, und listet die eingebauten Subagenten auf, mit denen Claude Code heute ausgeliefert wird. ## [00:03] Was Subagenten sind Ein Subagent läuft in einem eigenen, separaten Kontextfenster, das mit einem selbst definierten System-Prompt initialisiert wird. Der übergeordnete Agent (Claude Code im Hauptthread) gibt dem Subagenten eine Aufgabenbeschreibung basierend auf der eigenen Anfrage. Der Subagent arbeitet diese selbstständig ab und liefert dann eine Zusammenfassung an den Hauptthread zurück — während die gesamte Zwischenarbeit isoliert bleibt. > *"Sub-agents are specialized assistants that Claude can delegate tasks to."* Der entscheidende Designpunkt: Sobald der Subagent fertig ist, wird sein gesamter Gesprächsverlauf vollständig verworfen. Nur die zurückgegebene Zusammenfassung fließt in das Hauptgespräch ein. ## [00:24] Das Kontextfenster im Griff behalten Jeder Tool-Aufruf, den Claude im Hauptthread macht — Datei-Lesevorgänge, Suchen, Funktions-Traces — sammelt sich im Hauptkontextfenster an. Bei langen Sitzungen füllt sich das schnell. Subagenten sind genau dafür da, einzelne Recherche- oder Aktionsaufgaben auszulagern, damit die Kosten nicht im Hauptfenster landen. > *"Each sub-agent runs in its own conversation contacts window with a custom system prompt that you define."* Der Kompromiss ist klar: Das Hauptfenster gewinnt einen sauberen Kontext, verliert aber den Einblick darin, wie der Subagent zu seinen Schlüssen gelangt ist und was er unterwegs entdeckt hat. Man bekommt die Antwort, nicht den Reasoning-Trace. ## [01:13] Ein konkretes Beispiel: das Zahlungssystem Angenommen, du nutzt Claude Code, um in einer unbekannten Codebasis herauszufinden, welcher Service Rückerstattungen verarbeitet. Ohne Subagenten würde Claude möglicherweise 15 Dateien lesen, mehrere Suchen durchführen und mehrere Funktionsaufrufe nachverfolgen — und all das füllt das Hauptkontextfenster, obwohl du nur eine einzige Information gebraucht hättest. > *"With a sub-agent, you get the answer without the journey."* Der Subagent durchforstet die Codebasis, findet die Antwort und liefert eine kompakte Zusammenfassung zurück — das Hauptkontextfenster bleibt sauber. Der Preis dafür ist der fehlende Einblick: Man sieht nicht, welche Dateien gelesen oder welche Traces verfolgt wurden. ## [02:00] Die eingebauten Subagenten von Claude Code Claude Code wird mit drei eingebauten Subagenten ausgeliefert, die sofort einsatzbereit sind: - **General-purpose sub-agent** — für mehrstufige Aufgaben, die sowohl Erkundung als auch Aktion erfordern. - **Explore sub-agent** — schnelles Durchsuchen von Codebasen ohne den Overhead eines vollständigen Task-Loops. - **Plan sub-agent** — läuft im Plan-Modus und analysiert die Codebasis, bevor ein Plan präsentiert wird. > *"And you can also create your own sub-agents with custom system prompts and tool access."* Über diese drei hinaus lassen sich eigene Subagenten mit individuellen System-Prompts und Tool-Zugriffslisten definieren, zugeschnitten auf spezifische Workflows. ## [02:30] Wann Subagenten sinnvoll sind Subagenten lohnen sich, wenn eine abgeschlossene, in sich selbst enthaltene Frage oder Aufgabe vorliegt, die andernfalls viel Zwischenkontext ins Hauptfenster spülen würde. > *"Sub-agents like Claude Code break work into focused pieces, keep your main context window clean, and bring back just what you need, whether you're using the built-in ones or creating your own."* Besonders wertvoll sind sie bei längeren Claude Code-Sitzungen, in denen sich der Kontextfensterdruck aufbaut — eine Teilaufgabe an einen Subagenten auszulagern, statt sie direkt im Hauptthread zu bearbeiten, verlängert spürbar, wie lange eine Sitzung effektiv bleibt. ## Entitäten - **Anthropic Tutorial Narrator** (Person): Sprecher der Tutorial-Reihe "Claude Code subagents", produziert von Anthropic - **Claude Code** (Software): Anthropics agentischer Coding-Assistent; die Umgebung, in der Subagenten betrieben werden - **Claude** (Software): das zugrundeliegende KI-Modell, das Claude Code und seine Subagenten antreibt - **Sub-agent** (Konzept): ein spezialisierter Assistent, an den Claude Code Aufgaben delegiert; läuft in einem isolierten Kontextfenster mit eigenem System-Prompt - **Context window** (Konzept): der begrenzte Token-Puffer, der den gesamten Gesprächsverlauf, Tool-Aufrufe und Ergebnisse enthält; Subagenten verhindern, dass er sich mit Zwischenarbeit füllt - **General-purpose sub-agent** (Software): eingebauter Claude Code-Subagent für mehrstufige Erkundungs- und Aktionsaufgaben - **Explore sub-agent** (Software): eingebauter Claude Code-Subagent, optimiert für schnelles Durchsuchen von Codebasen - **Plan sub-agent** (Software): eingebauter Claude Code-Subagent, der im Plan-Modus die Codebasis analysiert, bevor ein Plan präsentiert wird - **Anthropic** (Organisation): Schöpfer von Claude und Claude Code; Produzent dieser Tutorial-Reihe

#claude-code#subagents#context-window
Terence Tao – Wie der weltbeste Mathematiker KI einsetzt
1:23:44
EN/ZH
Watch with Captions
Dwarkesh Patelvor 2 Monaten

Terence Tao – Wie der weltbeste Mathematiker KI einsetzt

Tao und Dwarkesh nehmen Keplers Entdeckung der Planetenbewegung als Linse für das, was KI in der Wissenschaft wirklich verändert. Tao argumentiert, dass die Hypothesengenerierung heute nahezu kostenlos ist und der Engpass damit auf Bewertung, Peer-Review und die Bewährung über die Zeit übergeht. Aktuelle KI-Systeme gewinnen durch Breite (alle Standardmethoden auf jedes Problem anwenden), Menschen durch Tiefe (kumulativ auf Teilfortschritten aufbauen) — deshalb werden Hybridkonfigurationen die Mathematik noch mindestens ein Jahrzehnt dominieren. ## [00:00] Kepler war ein LLM mit hoher Temperatur Tao schildert, wie Kepler zu seinen drei Gesetzen der Planetenbewegung gelangte. Kepler startete mit einer falschen, aber ästhetisch überzeugenden Theorie — Platonische Körper zwischen den Planetenbahnen — und verwarf sie erst, nachdem er jahrelang Tycho Brahes gestohlene Beobachtungen mit bloßem Auge ausgewertet hatte. Ellipsen, Flächensatz und das Verhältnis aus Umlaufzeit und Abstand entstanden durch jahrzehntelange Datenanalyse; Newtons Erklärung folgte ein Jahrhundert später. Dwarkeshs Deutung: Kepler ähnelt einem LLM mit hoher Temperatur, der zufällige Zusammenhänge gegen einen prüfbaren Datensatz durchspielt. Tao stimmt der Mechanik zu, widerspricht aber bei der Engpassfrage. Ideen zu erzeugen war schon damals billig — Kepler hatte keinen Mangel an Theorien. Was er brauchte, waren Brahes um eine Größenordnung bessere Daten und die Geduld, Ideen zu verwerfen, die die Daten widerlegten. > *Aber wie Sie sagen, muss das durch ebenso viel Verifikation gedeckt sein, sonst ist es nur Schrott.* ## [11:44] Wie erkennt man ein neues vereinheitlichendes Konzept in Massen von KI-Schrott? Tao: Hat KI die Ideengenerierung auf nahezu null gedrückt, werden Peer-Review und die Bewährung über die Zeit zur eigentlichen Engstelle. Fachzeitschriften versinken bereits in KI-generierten Einreichungen. Was eine Idee wert ist, zeigt sich daran, was spätere Wissenschaft damit anfängt — Kopernikus war ungenauer als Ptolemäus, bis Kepler das Bild vervollständigte — und diese Bewertung lässt sich im Moment kaum automatisieren. Dwarkesh fragt, wie die Wissenschaft ein Bell-Labs-artiges vereinheitlichendes Konzept (Shannons Bit, der Transformer) in Millionen mittelmäßiger Arbeiten erkennen würde. Taos Antwort verweist auf den Teil, der menschlich bleiben könnte: Wissenschaftler produzieren nicht nur Theorien, sie erzählen Geschichten, die andere überzeugen, Jahre in die Nachverfolgung zu investieren. Darwins Prosa leistete, was Newtons lateinische Gleichungen nicht schafften. > *KI hat die Kosten der Ideengenerierung auf nahezu null gesenkt, ähnlich wie das Internet die Kosten der Kommunikation auf nahezu null gesenkt hat.* ## [26:10] Der deduktive Überhang Tao über das ungenutzte Signal in vorhandenen Daten. Die Astronomie hat seit Jahrhunderten die Disziplin verfeinert, maximale Information aus minimalen Daten zu ziehen — weshalb Quant-Hedgefonds bevorzugt Astronomie-Doktoranden einstellen. Ein Lieblingsbeispiel: Forscher maßen, wie oft Wissenschaftler die Arbeiten, die sie zitieren, tatsächlich gelesen hatten, indem sie verfolgten, welche Tippfehler sich durch Zitationsketten fortpflanzten. Er schlägt vor, dieselbe wissenschaftssoziologische Methode auf den KI-Fortschritt selbst anzuwenden — Zitationsmuster, Konferenzerwähnungen und andere Spuren auswerten, um zu erkennen, ob ein Ergebnis tatsächlich einen Fortschritt darstellte, statt auf die langsame Bewährung über die Zeit zu warten. > *Eine Erkenntnis war, dass der deduktive Überhang in vielen Feldern viel größer sein könnte, als die meisten Menschen ahnen.* ## [30:31] Auswahlverzerrung bei gemeldeten KI-Entdeckungen KI hat rund 50 von etwa 1.100 Erdős-Problemen gelöst und stagniert seither. Tao erklärt den Selektionseffekt: Bei diesen 50 gab es kaum Literatur — eine obskure Technik plus ein bekanntes Ergebnis reichten, und KI-Werkzeuge sind hervorragend darin, "alle Standardkombinationen durchzuprobieren." Wenn 80 % der Arbeit durch bestehende Methoden erledigt ist, räumt KI das Problem aus dem Weg. Braucht es eine wirklich neue Technik, kommen die Werkzeuge nicht weiter, und die Erfolgsquote systematischer Durchläufe liegt bei 1-2 %. Taos Metapher: KI-Werkzeuge sind springende Roboter in einem dunklen Gebirge. Sie kommen über kurze Mauern hinweg, die Menschen nicht erreichen können, aber sie können keinen Griff fassen, dort verharren und sich aus Teilfortschritten hochziehen. Die optimistische Lesart — sobald KI ein bestimmtes Niveau erreicht, kann man eine Million Kopien parallel auf eine Million Probleme ansetzen, was keine menschliche Gemeinschaft kann — ist auch der strukturelle Grund, warum die Wissenschaft neue Paradigmen braucht, die Breite wirklich nutzen. > *Sie sind überlegen in der Breite, und Menschen sind überlegen in der Tiefe, zumindest menschliche Experten.* ## [46:43] KI macht Arbeiten breiter und reichhaltiger, aber nicht tiefer Tao über seine eigene Arbeitsweise: Arbeiten enthalten jetzt mehr Code, mehr Abbildungen und tiefere Literaturrecherchen, weil Hilfsaufgaben etwa fünfmal günstiger geworden sind. Der eigentliche Kern — den schwierigsten Teil eines Problems lösen — geschieht nach wie vor mit Stift und Papier. Er würde sich scheuen, sich als "doppelt so produktiv" zu bezeichnen, denn der Maßstab ist nicht eindimensional; was sich verändert hat, ist die Art der Arbeiten, die er schreibt, nicht die Rate, mit der er seine eigentliche Ausgangsfrage beantwortet. Die Unterscheidung zwischen Cleverness und Intelligenz führt an denselben Ort. Wenn zwei Menschen gemeinsam an einem Mathematikproblem arbeiten, wird jeder gescheiterte Ansatz zur Basis für den nächsten. Bei aktuellen KI-Systemen vergisst eine neue Sitzung, was die letzte herausgefunden hat. Der kumulative Hochzieh-Schritt fehlt — es bleibt bei reinem Versuch-und-Irrtum und der schließlichen Absorption ins nächste Training. > *Die Arbeiten sind dadurch reicher und breiter geworden, aber nicht notwendigerweise tiefer.* ## [53:00] Wenn KI ein Problem löst, können Menschen dann etwas daraus lernen? Könnte eine KI die Riemann-Hypothese in Lean beweisen und uns ohne jeden Erkenntnisgewinn zurücklassen? Tao macht sich keine Sorgen. Lean hat die Eigenschaft, dass jeder Beweis atomar zerlegbar ist — jedes Lemma lässt sich einzeln inspizieren, ablativieren und testen. Selbst ein 3.000-Zeilen-Beweis wird so zum Rohmaterial: Andere KI-Systeme können ihn auf Eleganz umformen, andere Menschen den konzeptuellen Gehalt herausarbeiten, und das Artefakt bleibt nützlich, auch wenn die ursprüngliche Herleitung undurchsichtig war. Er sagt eine ganze Berufsgruppe von Mathematikern voraus, deren Aufgabe es sein wird, riesige Lean-generierte Beweise auseinanderzunehmen und die darin verborgenen Ideen freizulegen — eine Art Beweisarchäologie, mit menschlichem Urteilsvermögen und KI-Ablativierungswerkzeugen. > *Man gewinnt viel mehr aus dem Zusammenspiel von Menschen, die mit diesen Werkzeugen zusammenarbeiten.* ## [59:20] Wir brauchen eine halbformale Sprache für den Austausch zwischen Wissenschaftlern Dwarkesh fragt, wie eine halbformale Sprache für mathematische Strategien (im Unterschied zu mathematischen Beweisen) aussehen könnte. Tao verfolgt die Frage durch den Primzahlsatz von Gauß — die erste große statistische Vermutung in der Mathematik, aus Rohdaten abgeleitet, bevor ein Beweis existierte — und durch die Zwilllingsprimzahlvermutung, an die Mathematiker glauben, weil das Zufallsmodell der Primzahlen sie vorhersagt. Mathematik hat sowohl rigorose Beweise als auch rigorose Heuristiken; nur die Beweisseite wurde formalisiert, so dass Lean sie prüfen kann. Warum die Heuristikseite noch nicht formalisiert wurde: Jeder RL-prüfbare Bewerter wird zum Angriffsziel für Exploits, und der subjektive Teil von "dieses Argument ist überzeugend" lässt sich noch nicht in einem exploitierbaren Rahmen fassen. Tao würde gern einen Weg finden, Vermutungsgenerierung und Strategiewahl im großen Maßstab zu benchmarken, möglicherweise indem man kleine KI-Systeme in vereinfachten mathematischen Universen laufen lässt und beobachtet, welche Strategien entstehen. > *Es gibt einen subjektiven Aspekt der Wissenschaft, den wir nicht wissen, wie wir ihn so erfassen können, dass wir KI auf nützliche Weise einbinden könnten.* ## [69:48] Wie Terry seine Zeit einteilt Tao darüber, wie er neue Teilgebiete erschließt. Er ordnet sich selbst als Fuchs im Sinne Berlins ein — ein bisschen über alles, gelegentlich Igel, wenn nötig. Der Antrieb ist eine Vollständigkeitsobsession: Wenn ein anderer Mathematiker ein Ergebnis mit einer Technik beweisen kann, die er nicht kennt, muss er herausfinden, was der Trick war. (Videospiele hat er aus demselben Grund aufgegeben.) Zusammenarbeit mit anderen Mathematikern ist das wichtigste Vehikel, und Dinge in seinem Blog aufzuschreiben ist die Gedächtnishilfe, die er entwickelt hat, nachdem er Argumente sechs Monate nach ihrer Herleitung wiederholt vergessen hatte. In seinem Kalender lässt Tao bewusst Raum für Zufälle. Er würde es hassen, seine Zeit so straff zu optimieren, dass er nie in einem Meeting sitzt, das außerhalb seiner Komfortzone liegt. Das Jahr am Institute for Advanced Study bestätigte die Falle — zwei Wochen reine Forschung waren großartig, dann ging ihm die Inspiration aus. Die zufällige Entdeckung im nächsten Bücherregal, das beiläufige Flurgespräch und das Meeting, das er widerstrebend besuchte, leisteten mehr, als es den Anschein hatte. > *Diese zufälligen Begegnungen mögen nicht optimal erscheinen, aber sie sind tatsächlich sehr wichtig.* ## [77:05] Mensch-KI-Hybride werden die Mathematik noch sehr viel länger dominieren Wann wird KI die Mathematik eigenständig betreiben? Tao rahmt die Frage neu — KI betreibt bereits Mathematik, die Menschen nicht können, seit dem Taschenrechner, nur an einer anderen Grenze. In etwa einem Jahrzehnt erwartet er, dass ein Großteil dessen, was Doktoranden heute tun — Standardmethoden anwenden, Literatur aufarbeiten — an KI übergeht; das Feld wird dann eine Ebene nach oben rücken, wie es beim Computeralgebrasystem und der symbolischen Integration geschah. Die Genetik endete nicht, als Sequenzierung billig wurde; sie skalierte hinauf zu Ökosystemen. Die Mathematik wird dasselbe tun. Sein Rat an Studierende, die jetzt in die Mathematik einsteigen: Veränderung einkalkulieren, aber den Abschluss auf dem herkömmlichen Weg erwerben — vorläufig gibt es noch keinen Ersatz dafür, Mathematik auf dem traditionellen Pfad zu erarbeiten. Gleichzeitig anpassungsfähig genug bleiben, um völlig neue Forschungsweisen zu nutzen, wenn sie entstehen, einschließlich solcher, die es noch nicht gibt. Bemerkenswert ist, dass ein Gymnasiast heute mit KI-Werkzeugen und Lean echte mathematische Forschung betreiben kann — das war vor fünf Jahren noch nicht möglich. > *Ich glaube tatsächlich, dass Mensch-KI-Hybride die Mathematik noch sehr viel länger dominieren werden.* ## Entitäten - **Terence Tao** (Person): Fields-Medaillist (2006), Mathematiker an der UCLA, schreibt regelmäßig über die Rolle von KI in der mathematischen Forschung. - **Dwarkesh Patel** (Person): Moderator des Dwarkesh Podcast; Langformatinterviews zu KI, Wissenschaft und Technologie. - **Johannes Kepler** (Person): Astronom (1571-1630), der die drei Gesetze der Planetenbewegung aus den Beobachtungen Tycho Brahes ableitete. - **Tycho Brahe** (Person): Dänischer Beobachtungsastronom, dessen jahrzehntelange Planetenbeobachtungen mit bloßem Auge den Datensatz lieferten, den Kepler benötigte. - **Lean** (Software): Beweisassistent, in dem mathematische Beweise formalisiert, geprüft, zerlegt und atomar ablativiert werden können. - **Erdős-Probleme** (Konzept): Die rund 1.100 offenen Probleme, die Paul Erdős aufgestellt hat; KI hat etwa 50 davon gelöst, fast alle mit kaum vorhandener Vorliteratur. - **Der deduktive Überhang** (Konzept): Die Idee, dass vorhandene Daten weit mehr ableitbares Wissen enthalten, als bisher extrahiert wurde, mit der Astronomie als Modell. - **Riemann-Hypothese** (Konzept): Ungelöste Vermutung zur Verteilung der Primzahlen; der Testfall dafür, ob ein KI-Beweis das mathematische Verständnis des Menschen voranbringen würde.

#ai-for-math#terence-tao#kepler
Was sind Skills?
2:54
EN/ZH
Watch with Captions
ClaudeClaude Code skillsvor 3 Monaten

Was sind Skills?

Claude Code Skills sind wiederverwendbare Markdown-Dateien, die Spezialwissen einmalig festhalten. Claude aktiviert sie automatisch, sobald eine Anfrage passt — ohne dass der Nutzer Anweisungen wiederholen oder einen Slash-Befehl eingeben muss. Dieses dreiminütige Tutorial erklärt, was Skills sind, wo sie liegen, wie sie sich von CLAUDE.md-Dateien unterscheiden und welches Signal anzeigt, dass es Zeit ist, einen zu schreiben. ## [00:03] Das Wiederholungsproblem, das Skills lösen Jedes Mal, wenn du Claude die Coding-Standards deines Teams erklärst, neu beschreibst, wie du PR-Feedback strukturiert haben möchtest, oder ihn an dein bevorzugtes Commit-Format erinnerst, wiederholst du dich. Der Sprecher nennt drei Beispiele nacheinander, um den genauen Reibungspunkt zu benennen, den Skills beseitigen. > *"Every time you explain your team's coding standards to Claude, you're repeating yourself."* ## [00:20] Was ein Skill ist und wie Claude einen auswählt Ein Skill ist eine Markdown-Datei, die Claude einmal beibringt, wie etwas funktioniert. Claude speichert die Anweisung und wendet sie automatisch an, sobald die Situation es erfordert. In Claude Code heißt diese Datei SKILL.md. Das description-Feld darin ist der entscheidende Mechanismus: Wenn du Claude bittest, eine PR zu reviewen, vergleicht er deine Anfrage mit allen verfügbaren Skill-Beschreibungen und aktiviert die passende. > *"Claude reads your request, compares it to all available skill descriptions, and activates the ones that match."* ## [01:05] Wo Skills gespeichert werden: persönlich oder Projekt Skills haben zwei Speicherorte, je nachdem wer sie braucht. Persönliche Skills kommen in `~/.claude/skills` und begleiten dich projektübergreifend: Commit-Stil, Dokumentationsformat, wie du Code erklärt haben möchtest. Projekt-Skills kommen in `.claude/skills` im Repository-Stammverzeichnis; wer das Repo klont, erhält sie automatisch. Dort leben Team-Standards: Markenrichtlinien, bevorzugte Schriften und Farben fürs Webdesign. > *"Anyone who clones the repository gets these skills automatically."* ## [01:42] Skills vs CLAUDE.md: automatisch und kontexteffizient Claude Code bietet mehrere Anpassungsebenen, und Skills besetzen eine eigene Nische. CLAUDE.md-Dateien werden in jedes Gespräch bedingungslos geladen — richtig für Regeln wie „immer TypeScript Strict Mode verwenden". Skills laden bei Bedarf, nur wenn sie zur aktuellen Anfrage passen, und zunächst gelangen nur Name und Beschreibung in den Kontext. Der vollständige Skill-Inhalt wird erst beim Auslösen geladen. So belastet die PR-Review-Checkliste den Kontext nicht beim Debuggen, sondern wird erst dann eingelesen, wenn du tatsächlich ein Review anforderst. Slash-Befehle muss man eintippen; Skills nicht. > *"Skills are unique because they're automatic and task-specific."* ## [02:27] Wann man einen Skill schreibt Skills eignen sich am besten für Spezialwissen, das an bestimmte Aufgaben gebunden ist: Code-Review-Standards des Teams, Commit-Formate, Markenrichtlinien. Die abschließende Faustregel ist knapp und praktisch: Wer sich dabei ertappt, Claude immer wieder dasselbe zu erklären, hat einen Skill vor sich, der darauf wartet, geschrieben zu werden. > *"If you find yourself explaining the same thing to Claude repeatedly, well, that's a skill waiting to be written."* ## Entitäten - **Anthropic Tutorial Narrator** (Person): Sprecher und Moderator der Claude Code Skills-Tutorialserie - **Claude Code** (Software): KI-Programmierassistent von Anthropic; die Laufzeitumgebung, in der Skills erkannt und angewendet werden - **SKILL.md** (Konzept): die Markdown-Datei, die einen Skill definiert — enthält Namen, Beschreibung und Anweisungen für Claude - **CLAUDE.md** (Konzept): projektweite oder globale Anweisungsdatei, die bedingungslos in jedes Claude Code-Gespräch geladen wird, im Gegensatz zu Skills - **Anthropic** (Organisation): Schöpfer von Claude und Claude Code

#claude-code#ai-tools#developer-productivity
Skills teilen
3:53
EN/ZH
Watch with Captions
ClaudeClaude Code skillsvor 3 Monaten

Skills teilen

Ein PR-Review-Skill, den ein einzelner Entwickler nutzt, ist praktisch; derselbe Skill im ganzen Team standardisiert Code-Reviews und sorgt für ein einheitliches Erlebnis in der gesamten Organisation. Dieses Tutorial zeigt vier konkrete Verteilungsmethoden — Repository-Commits, Plugins, Enterprise Managed Settings und benutzerdefinierte Sub-Agenten — und erklärt genau, wann welche zum Einsatz kommt. Der Abschnitt zu Sub-Agenten enthält einen nicht offensichtlichen Vorbehalt: Sub-Agenten erben Skills nicht automatisch, und eingebaute Agenten können überhaupt nicht auf Skills zugreifen. ## [00:01] Warum Teilen den Wert eines Skills vervielfacht Ein Skill, der nur bei einem Entwickler liegt, leistet seinen Dienst. Derselbe Skill im Team verankert Standards, beseitigt individuelle Abweichungen und macht jeden Review-Prozess konsistent in Stil und Ergebnis. Das Tutorial beginnt mit einem direkten Vergleich zwischen Einzel- und Teamnutzung, bevor die vier Sharing-Mechanismen vorgestellt werden. > *"A PR review skill that only you use is helpful. The same skill shared across your team standardizes code review and provides a consistent experience amongst your organization which is much better."* ## [00:18] Skills ins Repository einchecken Der Weg mit dem geringsten Aufwand: Skills in `.claude/skills` im Projektrepository ablegen. Wer das Repository klont, erhält diese Skills sofort — kein Installationsschritt, kein zusätzliches Tooling. Updates kommen über den normalen `git pull`-Zyklus. Diese Methode passt zu Team-Codierstandards, projektspezifischen Workflows und Skills, die auf die eigene Codestruktur verweisen. > *"Anyone who clones the repository gets these skills automatically. No extra installation, it's just what you're doing already."* ## [00:45] Skills über Plugins verteilen Plugins erweitern Claude Code um benutzerdefinierte Funktionalität, die über ein einzelnes Projekt hinaus reist. Im Plugin-Projekt spiegelt ein `skills/`-Verzeichnis die Struktur von `.claude/` wider — Skillname, `SKILL.md`. Nach der Veröffentlichung in einem Marketplace kann jeder Claude Code-Nutzer das Plugin herunterladen und aktivieren. Dieser Kanal eignet sich am besten für Skills, die allgemein genug sind, um der breiteren Community zu dienen, nicht nur den Konventionen eines einzelnen Teams. > *"Think of plugins as ways to extend Claude Code with custom functionality, but designed to be shared across teams and projects."* ## [01:26] Unternehmensweites Deployment via Managed Settings Administratoren können Skills über Managed Settings an jeden Entwickler der Organisation verteilen. Enterprise-Skills haben die höchste Priorität: Sie überschreiben persönliche, Projekt- und Plugin-Skills mit gleichem Namen. Gedacht ist das für verbindliche Standards — Sicherheitsanforderungen, Compliance-Workflows, Codierungsrichtlinien, die einheitlich sein müssen. Der Narrator betont das Wort „must" ausdrücklich: Das sind keine Empfehlungen. > *"This is for mandatory standards, security requirements, compliance workflows, or coding practices that must be consistent across the organization."* ## [01:52] Benutzerdefinierte Sub-Agenten und explizites Skill-Loading Sub-Agenten erben die Skills der Hauptkonversation nicht. Eingebaute Agenten (explorer, planner, verify) können überhaupt nicht auf Skills zugreifen. Nur benutzerdefinierte Sub-Agenten — definiert durch eine `agent.md`-Datei in `.claude/agents` — können Skills nutzen, und zwar ausschließlich die, die im `skills:`-Feld dieser Datei explizit aufgeführt sind. Skills werden beim Start des Sub-Agenten geladen, nicht bei Bedarf. Die Liste sollte daher knapp gehalten werden: nur Skills, die für den Zweck des Agenten stets relevant sind. Das Tutorial zeigt, wie man mit dem Claude Code Sub-Agenten-Creator einen neuen Sub-Agenten erstellt und Skills an eine bestehende `agent.md` anhängt. > *"Built-in agents like the explorer, planner, and verify can't access skills at all. Only custom sub-agents you define can use them, and only when you explicitly list them."* ## [03:18] Zusammenfassung: die richtige Verteilungsmethode wählen Der Abschluss ordnet jede Methode ihrem Szenario zu: Projektverzeichnisse für den Teamzugang, Plugins für die repositoryübergreifende Weitergabe, Enterprise-Deployment für organisationsweite Pflichtstandards und explizite Sub-Agenten-Skill-Listen für isolierte Aufgabendelegation. Der Hinweis zu Sub-Agenten kommt noch einmal — nur die Skills auflisten, die für einen bestimmten Agenten stets relevant sind, denn sie werden beim Start geladen, nicht lazy. > *"Share skills through project directories for team access, plugins for cross-repository distribution, or enterprise deployment for organization-wide standards."* ## Entitäten - **Anthropic Tutorial-Narrator** (Person): alleiniger Präsentator der Claude Code Skills Tutorial-Serie - **Claude Code** (Software): KI-gestützter Coding-Assistent von Anthropic; die Laufzeitumgebung, in der Skills erstellt und eingesetzt werden - **Skills** (Konzept): wiederverwendbare Anweisungssets in `.claude/skills`, die das Verhalten von Claude Code erweitern - **Plugins** (Konzept): verteilbare Pakete, die Skills bündeln und teamübergreifend sowie über den Marketplace teilen - **Managed Settings** (Konzept): Enterprise-Administratormechanismus zur organisationsweiten Bereitstellung von Skills mit höchster Priorität - **Sub-Agenten** (Konzept): benutzerdefinierte Claude Code-Agenten, die via `agent.md` in `.claude/agents` definiert werden; der einzige Agententyp, der Skills laden kann, und nur wenn sie explizit aufgeführt sind - **Anthropic** (Organisation): Unternehmen, das Claude Code entwickelt hat und die Claude Code Skills Tutorial-Serie produziert

#claude-code#skills#developer-tools
Konfiguration und mehrsprachige Skill-Dateien
4:04
EN/ZH
Watch with Captions
ClaudeClaude Code skillsvor 3 Monaten

Konfiguration und mehrsprachige Skill-Dateien

Ein vierminütiges Tutorial aus der Claude Code Skills-Reihe über die erweiterten Konfigurationsfelder, die aus einem einfachen Skill ein zuverlässiges, kontexteffizientes Werkzeug machen. Der Erzähler geht das vollständige agentskills.io-Feldset durch — `name`, `description`, `allowed_tools`, `model` — und erklärt anschließend, wie man größere Skills per Progressive Disclosure strukturiert, sodass Referenzmaterial und Skripte nur geladen werden, wenn die Anfrage des Nutzers das tatsächlich erfordert. ## [00:02] Überblick über erweiterte Skill-Felder Der offene Standard agentskills.io definiert mehrere Felder jenseits der Pflichtfelder `name` und `description`. `name` muss aus Kleinbuchstaben mit Bindestrichen bestehen, darf maximal 64 Zeichen lang sein und muss mit dem Verzeichnisnamen übereinstimmen. `description` fasst bis zu 1.024 Zeichen und ist das primäre Signal, anhand dessen Claude einen Skill einer Anfrage zuordnet. Zwei optionale Felder runden die Konfiguration ab: `allowed_tools` schränkt ein, welche Werkzeuge der Skill aufrufen darf, und `model` fixiert den Skill auf eine bestimmte Claude-Version. > *"Ein einfacher Skill funktioniert mit nur einem name und einer description – aber hier sind einige fortgeschrittene Tipps, mit denen deine Skills in Claude Code wirklich effektiv werden."* ## [00:39] Effektive Descriptions schreiben Eine vage Description – „help with dogs" – lässt Claude im Dunkeln darüber, wofür der Skill zuständig ist und wann er ausgelöst wird. Eine gute Description beantwortet genau zwei Fragen: Was tut dieser Skill, und wann soll Claude ihn einsetzen? Schlüsselbegriffe an die natürliche Ausdrucksweise der Nutzeranfragen anzupassen ist der wirksamste Hebel, um Skills zu reparieren, die nicht auslösen. > *"Eine gute Description beantwortet zwei Fragen: Was macht dieser Skill? Und wann soll Claude ihn nutzen?"* ## [01:20] Werkzeuge mit allowed_tools einschränken `allowed_tools` ist der Mechanismus, um einen Skill auf eine definierte Operationsfläche zu begrenzen — zum Beispiel reiner Lesezugriff für sicherheitssensible Arbeitsabläufe. Ist das Feld gesetzt, darf Claude nur diese Werkzeuge ohne Rückfrage aufrufen; Bearbeiten, Schreiben und Bash-Befehle sind ausgeschlossen. Wird das Feld weggelassen, bleibt Claudes normales Berechtigungsmodell unverändert. > *"Wenn dieser Skill aktiv ist, kann Claude nur diese Werkzeuge ohne Genehmigung verwenden. Kein Bearbeiten, kein Schreiben, keine Bash-Befehle."* ## [01:49] Progressive Disclosure für Multi-Datei-Skills Skills teilen Claudes Kontextfenster mit dem laufenden Gespräch. Alles in eine 20.000 Zeilen lange `SKILL.md` zu packen bläht den Kontext bei jedem Aufruf auf und macht die Datei zum Wartungsalbtraum. Die Lösung: wesentliche Anweisungen in `SKILL.md` belassen und Referenzmaterial in separate Dateien auslagern, die Claude nur liest, wenn die aktuelle Anfrage das wirklich verlangt. Der Standard empfiehlt drei Hilfsverzeichnisse — `scripts/` für ausführbaren Code, `references/` für Dokumentation und `assets/` für Bilder und Vorlagen. Ein Link in `SKILL.md` funktioniert wie ein Inhaltsverzeichniseintrag; kommt das Thema nie auf, wird die Datei nie geladen. Skripte im Skill-Verzeichnis werden ausgeführt, ohne dass ihr Quellcode in den Kontext geladen wird — nur ihre Ausgabe verbraucht Tokens. Der Erzähler empfiehlt, `SKILL.md` unter 500 Zeilen zu halten; wird diese Marke überschritten, ist das ein Signal, den Skill aufzuteilen. > *"Es ist, als hätte man ein Inhaltsverzeichnis im Kontextfenster, statt das gesamte Dokument dort hineinzuquetschen."* ## [03:18] Zusammenfassung: Skill-Metadaten und Best Practices Das Tutorial schließt mit einer Wiederholung der vollständigen Konfigurationsfläche: `name` und `description` sind Pflicht; `allowed_tools` schränkt die Werkzeugfläche ein; `model` fixiert die Claude-Version. Descriptions benötigen konkrete Aktionsverben und Auslösephrasen, um zuverlässig zu matchen. Bei größeren Skills hält Progressive Disclosure `SKILL.md` unter 500 Zeilen und lädt Hilfsdateien erst, wenn sie tatsächlich gebraucht werden. Skripte werden ohne Laden ihres Quellcodes ausgeführt, was den Kontext schlank hält. > *"Skripte können ausgeführt werden, ohne ihren Inhalt zu laden, was den Kontext effizient hält."* ## Entitäten - **Anthropic-Tutorial-Erzähler** (Person): alleiniger Moderator dieser Tutorial-Reihe, der die Konfiguration von Claude Code Skills erklärt. - **Claude Code** (Software): CLI-Tool von Anthropic, das Skills gemäß dem agentskills.io-Standard lädt und ausführt. - **agentskills.io** (Organisation): offener Standard, der das Skill-Manifest-Schema definiert, einschließlich `name`, `description`, `allowed_tools`, `model` und Verzeichniskonventionen. - **SKILL.md** (Konzept): primäre Manifest-Datei eines Claude Code Skills; sollte unter 500 Zeilen bleiben und Links zu unterstützenden Dateien enthalten. - **allowed_tools** (Konzept): optionales Skill-Feld, das bestimmte Claude-Werkzeuge auf die Whitelist setzt und so reine Lese- oder Sandbox-Skill-Modi ermöglicht. - **Progressive Disclosure** (Konzept): Strukturierung eines Multi-Datei-Skills, sodass Referenzdateien und Skripte nur dann in den Kontext geladen werden, wenn die aktuelle Anfrage das wirklich benötigt. - **Kontextfenster** (Konzept): geteiltes Token-Budget zwischen dem Gespräch und den von Claude geladenen Skill-Dateien; die Schlüsselressource, die Progressive Disclosure schonen soll.

#claude-code#skills#configuration
Deine erste Fähigkeit erstellen
3:47
EN/ZH
Watch with Captions
ClaudeClaude Code skillsvor 3 Monaten

Deine erste Fähigkeit erstellen

Dieses 3-minütige Tutorial zeigt Schritt für Schritt, wie man eine persönliche Claude Code-Fähigkeit von Grund auf baut: ein Verzeichnis mit einer SKILL.md-Datei anlegen, sicherstellen, dass die Fähigkeit beim Start geladen wird, und beobachten, wie Claude sie auf eine echte Anfrage anwendet. Die zweite Hälfte erklärt genau, wie Claudes Lade-Pipeline für Fähigkeiten funktioniert — von den vier Scan-Speicherorten und dem startorientierten Nur-Name-Durchlauf bis zum Bestätigungsgate und der vierstufigen Prioritätsreihenfolge, die Namenskonflikte auflöst. ## [00:03] Was dieses Tutorial aufbaut Der Erzähler nennt gleich zu Beginn das konkrete Ziel: eine Fähigkeit, die Claude beibringt, Code mithilfe visueller Diagramme und Analogien zu erklären. Nach dem Aufbau wird auch nachverfolgt, was intern abläuft, wenn Claude eine Fähigkeit erkennt und ausführt. > *"This skill will teach Claude how we would like it to explain code using visual diagrams and analogies."* ## [00:18] Die Fähigkeitsdatei erstellen Persönliche Fähigkeiten liegen im Home-Verzeichnis (nicht in einem Projekt), daher besteht der erste Schritt darin, ein neues Verzeichnis mit dem Fähigkeitsnamen in `~/.claude/skills/` zu erstellen. Darin befindet sich eine einzige SKILL.md-Datei. Drei Abschnitte sind entscheidend: `name` (der Bezeichner, den Claude beim Start speichert), `description` (das Kriterium, anhand dessen Claude entscheidet, ob die Fähigkeit aktiviert wird) und alles nach dem zweiten `---`-Trennzeichen (die eigentlichen Anweisungen, denen Claude folgt, wenn die Fähigkeit ausgelöst wird). > *"Take into consideration that we're creating a directory with the skill name inside of the skills directory."* ## [00:52] Deine Fähigkeit laden und testen Claude Code scannt Fähigkeiten beim Start, nicht auf Abruf, daher ist nach dem Erstellen der Datei ein Neustart der Session erforderlich. `/skills` sollte dann die neu erstellte Fähigkeit auflisten. Zum Testen wechselt man zu einem Branch mit Änderungen und sendet die Anfrage in natürlicher Sprache: "Write a PR description for my changes." Claude zeigt an, dass es die PR-description-Fähigkeit aufruft, liest dann den Diff und schreibt eine Beschreibung, die jedes Mal dieselbe Vorlage einhält. > *"Claude will then show you that it's using the PR description skill."* ## [01:25] Wie Claude Fähigkeiten im Hintergrund lädt Beim Start scannt Claude Code vier Speicherorte: verwaltete Enterprise-Einstellungen, das persönliche `~/.claude/skills/`, das `.claude/`-Verzeichnis des Projekts und installierte Plugins. Dabei werden nur `name` und `description` geladen, nicht der vollständige Inhalt. Kommt eine Anfrage an, vergleicht Claude sie mit den gespeicherten Beschreibungen; "explain what this function does" überschneidet sich mit "explain code with visual diagrams", also stimmt die Fähigkeit überein. Bevor Claude die vollständige SKILL.md liest, bittet es um Bestätigung, damit der Nutzer immer weiß, welcher Kontext eingebettet wird. > *"It loads only the name and description of each skill, not the full content. This is important later."* ## [02:02] Prioritätsregeln und Namenskonflikte Das Klonen eines Repositorys, das eigene Fähigkeiten mitbringt, kann Namenskollisionen verursachen. Claude löst sie mit einer festen Prioritätsleiter: Enterprise (höchste) → persönlich → Projekt → Plugins (niedrigste). Eine Enterprise-Fähigkeit `code-review` setzt sich immer gegen eine gleichnamige persönliche Fähigkeit durch. Die praktische Lösung ist beschreibendes Benennen: `security-review` oder `frontend-pr-review` statt des generischen `review`, damit Konflikte erst gar nicht entstehen. > *"If your company has an enterprise code review skill and you create a personal code review skill, the enterprise version of that takes precedence."* ## [02:52] Fähigkeiten aktualisieren und entfernen Eine Fähigkeit zu aktualisieren bedeutet, die SKILL.md direkt zu bearbeiten und zu speichern. Eine Fähigkeit zu entfernen bedeutet, das Verzeichnis zu löschen. Beide Vorgänge erfordern einen Neustart von Claude Code, damit die Änderung wirksam wird — die Fähigkeitenliste wird einmalig beim Sitzungsstart aufgebaut und nicht auf Live-Änderungen überwacht. > *"Edit the skill.md file to update a skill and restart Claude Code for changes to take effect."* ## Entitäten - **Anthropic-Tutorial-Erzähler** (Person): einziger Moderator des Skill-Erstellungs-Tutorials in der Claude Code skills-Serie - **Claude Code** (Software): Anthropics CLI für Claude; scannt Fähigkeiten beim Start und wendet sie an, wenn Benutzeranfragen zu den Fähigkeitsbeschreibungen passen - **SKILL.md** (Konzept): die einzige Datei, die eine Fähigkeit definiert — enthält ein YAML-Frontmatter (name, description) und freien Anweisungstext nach dem zweiten `---`-Trennzeichen - **Fähigkeiten** (Konzept): wiederverwendbare, benannte Anweisungssets, die Claude ein konsistentes Verhaltensmuster beibringen; als Verzeichnisse mit einer SKILL.md-Datei gespeichert - **Enterprise-Fähigkeiten** (Konzept): von der Organisation verwaltete Fähigkeiten, die an der Spitze der vierstufigen Prioritätsreihenfolge stehen und persönliche, Projekt- und Plugin-Fähigkeiten überschreiben - **Anthropic** (Organisation): Schöpfer von Claude und Claude Code; veröffentlicht diese Tutorial-Serie unter claude.com/resources/courses

#claude-code#skills#developer-tools
Skills im Vergleich zu anderen Claude Code-Funktionen
3:01
EN/ZH
Watch with Captions
ClaudeClaude Code skillsvor 3 Monaten

Skills im Vergleich zu anderen Claude Code-Funktionen

Claude Code bietet Entwicklern fünf verschiedene Anpassungsmöglichkeiten — Skills, CLAUDE.md, Subagenten, Hooks und MCP-Server — jede für einen anderen Zweck gebaut. Dieses dreiminütige Tutorial ordnet jede Option dem richtigen Anwendungsfall zu, damit man nicht zu Skills greift, wo CLAUDE.md ausreicht, oder einen Hook verdrahtet, wo eigentlich ein Subagent gefragt ist. ## [00:02] Fünf Anpassungsoptionen, eine Entscheidungsfrage Claude Code stellt fünf Wege bereit, das Verhalten zu gestalten: Skills, CLAUDE.md, Subagenten, Hooks und MCP-Server. Der Sprecher listet alle fünf in rascher Folge auf und verlagert die Frage sofort von „Was sind das?" zu „Welches gehört hierher?" > *"Sie lösen unterschiedliche Probleme. Zu wissen, wann man welches einsetzt, verhindert, dass man das Falsche baut."* Alles Weitere im Tutorial ist im Grunde die Antwort auf diesen einen Satz. ## [00:18] CLAUDE.md vs Skills: dauerhaft vs bei Bedarf CLAUDE.md ist eine Datei, die Claude zu Beginn jedes Gesprächs liest — ohne Aktivierung. Hier gehören projektweite Vorgaben hin, die nie vergessen werden dürfen: Framework-Entscheidungen, Codierungsstil, Datenbankregeln. Skills hingegen laden bei Bedarf: Die PR-Review-Checkliste gelangt erst dann in den Kontext, wenn wirklich um ein Review gebeten wird — nicht schon beim Schreiben von neuem Code. > *"Use Claude MD for project-wise standards that always apply constraints like never modify the database schema, framework preferences, and coding style."* Die Trennlinie liegt zwischen Dauerhaftigkeit und Relevanz. Wenn eine Anweisung für jeden Prompt im Projekt gelten muss, gehört sie in CLAUDE.md. Ist sie nur manchmal nützlich, gehört sie in eine Skill. ## [01:03] Skills vs Subagenten: geteilter Kontext vs isolierte Ausführung Skills injizieren Wissen in das laufende Gespräch — ihre Anweisungen fügen sich dem vorhandenen Kontext hinzu. Subagenten arbeiten anders: Sie erhalten eine Aufgabe, starten einen separaten Ausführungskontext, arbeiten unabhängig und liefern Ergebnisse zurück, ohne das Hauptgespräch zu berühren. > *"Use sub agents when you want to delegate a task to a separate execution context. You need different tool access that the main conversation does. You want isolation between delegated work and your main context."* Skills kommen zum Einsatz, wenn Fachwissen das Denken von Claude durch ein laufendes Gespräch hindurch prägen soll. Subagenten wählt man, wenn eine klare Grenze zwischen der Hauptsitzung und einer delegierten Arbeitseinheit gewünscht ist — andere Werkzeuge, kein Kontextverlauf. ## [01:42] Hooks vs Skills: ereignisgesteuert vs anforderungsgesteuert Hooks lösen bei Ereignissen automatisch aus — ein Linter läuft jedes Mal, wenn Claude eine Datei speichert; eine Eingabe wird vor einem bestimmten Werkzeugaufruf geprüft. Nicht die Frage löst sie aus, sondern das Handeln von Claude. Skills sind das Gegenteil: anforderungsgesteuert, sie werden aktiv, wenn eine Anfrage zu ihnen passt. > *"A hook might run a llinter every time Claude saves a file or validate input before certain tool calls. They're all event driven, while skills, they're request driven. They activate based on what you're asking."* Muss ein Verhalten bedingungslos bei einem Systemereignis eintreten, ist es ein Hook. Soll es die Art beeinflussen, wie Claude auf eine Frage antwortet, ist es eine Skill. ## [02:15] Alle fünf kombiniert für umfassende Anpassung Ein gut konfiguriertes Claude Code-Setup weist jedem Werkzeug seine natürliche Rolle zu: CLAUDE.md für dauerhaft gültige Projektstandards, Skills für aufgabenspezifisches Fachwissen, das nicht jeden Prompt belasten soll, Hooks für automatisierte Nebeneffekte, Subagenten für isolierte delegierte Arbeit und MCP-Server für den Zugriff auf externe Werkzeuge. Sie sind keine Alternativen — sie ergänzen sich. > *"Don't force everything into skills when another option fits best. You can use multiple at a time."* Skills aktivieren sich automatisch, wenn ein Thema relevant ist; CLAUDE.md ist stets präsent; Subagenten laufen isoliert; Hooks feuern bei Ereignissen; MCP stellt externe Werkzeuge bereit. Das richtige Layer für jedes Anliegen wählen und alles frei kombinieren. ## Entitäten - **Anthropic Tutorial-Sprecher** (Person): Moderator dieser Claude Code Skills-Tutorial-Reihe, der im Namen von Anthropic präsentiert. - **Claude Code** (Software): Anthropics KI-gestützter Coding-Assistent; Thema der Tutorial-Reihe. - **Skills** (Konzept): Bedarfsgesteuerte Wissenspakete, die aktiviert werden, wenn Claude eine Benutzeranfrage abgleicht; sie injizieren Anweisungen in den aktuellen Gesprächskontext. - **CLAUDE.md** (Konzept): Konfigurationsdatei, die automatisch in jedes Claude Code-Gespräch geladen wird; dient dauerhaft gültigen projektweiten Standards und Vorgaben. - **Subagenten** (Konzept): Separate Ausführungskontexte, die gestartet werden, um delegierte Aufgaben isoliert vom Hauptgespräch zu bearbeiten. - **Hooks** (Konzept): Ereignisgesteuerte Automatisierung, die bei bestimmten Claude-Aktionen wie Datei speichern oder Werkzeugaufrufen anspringt — unabhängig von Benutzeranfragen. - **MCP-Server** (Software): Model Context Protocol-Server, die Claude Code-Sitzungen mit externen Werkzeugen versorgen. - **Anthropic** (Organisation): Entwickler von Claude Code und Herausgeber der Claude Code Skills-Tutorial-Reihe.

#claude-code#skills#claude-md