LaiDub

팟캐스트

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496
4:18:22
EN/ZH
Watch with Captions
Lex Fridman20일 전

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496

Lex Fridman sits down with Jean-Baptiste Kempf, president of VideoLAN and lead developer of VLC, and Kieran Kunhya, longtime FFmpeg contributor and the voice behind the infamous FFmpeg account on X, for a four-hour deep dive into the invisible machinery behind virtually all video on the internet. Together they trace the full arc from raw bytes and container formats through hand-written assembly and codec reverse-engineering, confronting the open-source sustainability crisis along the way. The conversation is both a technical masterclass and a meditation on why brilliant volunteers—many of them teenagers—quietly build infrastructure that powers billions of devices every day. ## [00:00] Episode highlight The episode opens with a rapid-fire highlight reel that captures the spirit of what follows. Kempf distills the FFmpeg community's core value: code quality is the only credential that matters—"Maybe you're a dog. I don't care. I need to look at your code." Kunhya adds the scale: FFmpeg is running on roughly 100 million CPUs at any moment, with three billion devices continuously decoding video, and FFmpeg's x86 assembly hand-optimization runs 62 times faster than equivalent C. The segment also previews the CIA-VLC spy story, the intelligence-agency backdoor request Kempf flatly refused, and Kieran's "no regrets" Twitter philosophy. > *"We care about excellent code. We don't care who you are. Like maybe you're a dog. I don't care, right? I need to look at your code."* — Jean-Baptiste Kempf ## [02:17] Introduction Lex sets the scene: FFmpeg is the invisible backbone behind YouTube, Netflix, Chrome, VLC, Discord, and nearly every platform that touches video or audio. VLC has been downloaded more than 6.5 billion times. Both projects are built entirely by volunteers. Lex frames the episode not merely as a technical discussion but as a tribute to engineers who work for the craft rather than for fame or money—"one of the great examples of human beings quietly collaborating across borders to build something useful, durable, and elegant." > *"It is one of the most incredible software systems ever developed, and it's all done by volunteers."* — Lex Fridman ## [05:35] Weirdest things VLC opens The conversation lightens up with playful examples of VLC's legendary tolerance for exotic formats. Kempf describes users capturing VHS tapes via capture cards, support for DVD-Audio with custom encryption, and the Lucasfilm Star Wars game codec that FFmpeg implemented for a single 10-second opening sequence. At a VideoLAN conference, a competition to create the most broken file ever—an MKV where every frame changed resolution, aspect ratio, and rotation—ended with VLC playing it perfectly. The orange traffic-cone logo is discussed: so recognizable that 25% of VLC's website traffic arrives from people searching "cone player." > *"There was a file that's a valid ZIP and a valid MP3 at the same time or something like that—and VLC opened all of the stupid files."* — Kieran Kunhya ## [09:59] How video playback works Kempf and Kunhya walk through what happens the moment you press play: the player fetches a byte stream from a URL, the demuxer separates audio, video, and subtitle tracks, entropy decoding removes mathematical compression, intra prediction reconstructs still-image frames (I-frames), motion-compensation handles temporal redundancy (P- and B-frames), and the final raw pixels are handed to the GPU or audio card. Video compression achieves 100x to 200x reduction by exploiting how human eyes perceive luminance versus color—working in YUV space rather than RGB—and by reusing unchanged background regions across frames. Kunhya warns that every single sentence in this pipeline represents someone's lifetime of work. > *"Everything we've just said in the past couple of minutes, every sentence is someone's lifetime's work. There are books about every sentence."* — Kieran Kunhya ## [19:20] Video codecs and containers The hosts clarify the often-confused distinction between containers and codecs. A container (MP4, MKV, MOV) multiplexes audio, video, and subtitle tracks; the codec (H.264, AV1) compresses the content inside. VLC and FFmpeg deliberately ignore the file extension and probe the actual bytes—because in the real world, extensions lie. The segment covers how AVI was Microsoft's format, MOV became MP4 via Apple, and the Matroska/MKV format emerged from the open-source community. Modern codecs like AV1 are not single algorithms but collections of tools that adapt to content type—screen share, animation, live video—each requiring different coding strategies. > *"We discard the file format. We look into the file to understand what's in it because so many people say, 'Oh, it's a video, it must be MP4,' but technically it's an MOV or maybe it's a MKV."* — Jean-Baptiste Kempf ## [30:07] FFmpeg explained FFmpeg is described as a low-level library suite—libavcodec, libavformat, libavfilter—plus a command-line tool so expressive that Kempf calls it a full programming language. Every person watching a YouTube video, recording with OBS, or editing in a professional broadcast box is likely touching FFmpeg. Kunhya notes that trillion-dollar corporations and grandmothers with home videos operate on exactly the same technology stack. The segment dives into open-source licensing—MIT, GPL, LGPL, AGPL—as "social contracts" that define community norms. Kempf recounts the painstaking process of re-licensing VLC's core from GPL to LGPL, requiring him to track down more than 350 contributors, including visiting the factory-worker father of a deceased contributor to obtain permission for two lines of code. > *"From a philosophical level, it's incredible that your grandmother's home videos and trillion-dollar corporations are on a level playing field using the same technology stack."* — Kieran Kunhya ## [51:07] Linus Torvalds Kempf offers a nuanced defense of Linus Torvalds's legendary harshness. The Linux kernel's core community is tiny—as is FFmpeg's (10–15 active maintainers)—and those few people must maintain every line of code forever. "We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code." Kunhya adds that terseness is often simply fatigue: volunteers arrive home after a full day of work and review patches without the bandwidth to hand-hold. Kempf also points out that most community members are non-native English speakers, and cultural misreadings amplify perceived hostility. > *"We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code."* — Jean-Baptiste Kempf ## [55:46] Turning down millions to keep VLC ad-free Kempf traces VLC's unlikely origin: a French engineering school (École Centrale Paris) whose student-run campus built a satellite video-streaming system in 1995—a decade before YouTube—just to enable faster networks for video games. From that Network 2000 project grew VideoLAN, and VLC emerged as its client. Kempf joined in 2003 when the project had nearly died, grew it from hundreds of thousands to billions of installs, and along the way repeatedly refused "obscene" offers to bundle toolbars, change search engines, or insert advertisements. His reasoning: "I need to go to bed at night and be happy about what I've done. If I had sold out, I would have betrayed so many other people who work here." > *"I refuse dozens of millions of dollars, yes, several times. Yes, I could be a multimillionaire and be somewhere on the beach. But I did not do it because I thought it was not moral and it was not the right thing to do."* — Jean-Baptiste Kempf ## [70:04] FFmpeg & Google drama Kunhya recounts a public controversy in which Google's security team used AI to auto-generate bug reports for FFmpeg, filing them under tight 90-day deadlines—with some vulnerability reports going to the press before patches could be written—without contributing corresponding fixes or meaningful funding. Kunhya compares it to "a denial of service by AI-generated bug reports" on obscure 1990s game codecs. The saga escalated via spicy FFmpeg tweets (a "rap battle" in Kunhya's words), but produced concrete results: Google began sending patches and established a financial reward system for fixes. A parallel incident saw Microsoft Teams engineers file a high-priority bug on the volunteer tracker, name-dropping their product's scale, and offering a one-time payment of a few thousand dollars in response to a request for a long-term support contract. > *"Google uses FFmpeg at a scale probably you or I couldn't even contemplate—millions of CPU cores. And yes, they contribute in areas mostly regarding their own products. But in a wider sense, there's a disproportionate level of contribution."* — Kieran Kunhya ## [89:18] FFmpeg developers What motivates FFmpeg's volunteer engineers? Kempf identifies three drivers: passion for the subject matter (many contributors arrived because they loved anime), excellence of the craft ("this is the best school ever of programming"), and pride in impact ("you can tell your grandma: I do this so you can play video on your laptop"). Kunhya adds that Andrew Kelley, creator of the Zig programming language, was an FFmpeg developer who credits his time there as his real-world education. Teenagers have written thousands of lines of hand-optimized assembly for FFmpeg. Kieran's favorite quote, from John Collison: "The world is a museum of passion projects." > *"If you're good in C, if you know how to write assembly in FFmpeg, I assure you you're going to be one of the best programmers ever—even if you're working on writing TypeScript."* — Jean-Baptiste Kempf ## [95:55] VLC and FFmpeg Kunhya frames the FFmpeg-VLC relationship as a "binary star system": VLC is to FFmpeg as Android is to Linux—they depend on each other and succeed because of each other. Roughly 80% of FFmpeg pipelines depend on at least one VideoLAN project (most often x264). VLC gives FFmpeg exposure to a vast zoo of real-world broken files. When compiled for Windows, VLC links against about 16 million lines of code, of which only 1 million live in the VLC repository itself. The two projects share many developers and collectively demonstrate that complex software ecosystems can be built entirely from interdependent open-source components. > *"VLC is to FFmpeg as Android is to Linux. They depend on each other, but they coexist because of each other."* — Kieran Kunhya ## [100:29] History of FFmpeg The "eras tour" of FFmpeg begins with Fabrice Bellard creating the initial concept, followed by the Michael Niedermayer era of the early 2000s—exhaustive support for DivX, Xvid, Windows Media, and RealMedia, eliminating the need for bloated, spyware-ridden codec packs. The late 2000s brought H.264 maturity and the rise of high-definition video. Throughout, VLC served as FFmpeg's field test: millions of users exposing edge cases that no lab could anticipate. > *"At the time you needed a new player to play every different type of file format. Having a single library that was fast and open source—that was a massive achievement."* — Kieran Kunhya ## [103:46] Reverse engineering codecs The segment showcases the art of reverse engineering proprietary codecs. Kostya Shishkov—described as "borderline genius"—reverse-engineered 20–30 megabyte binary blobs (each megabyte representing roughly a month of normal work) for fun, producing decoders for Windows Media, RealMedia, and GoToMeeting formats. Kunhya explains the methodology: hook into the proprietary player to dump raw YUV data, open a disassembler, step through machine code instruction by instruction to infer the entropy coding, prediction, and IDCT stages, then validate bit-exactness against sample files. For months, the work produces no visible output—pure debugging in memory. > *"He looked at the world as a binary specification. He didn't need documentation or anything. He would go away and come back and do interesting stuff."* — Kieran Kunhya ## [117:01] FFmpeg testing FFmpeg's FATE (FFmpeg Automated Testing Environment) system runs a pivot table of test combinations: dozens of compilers (GCC, Clang, MSVC, Apple Clang, Intel Compiler), operating systems (Linux, macOS, Windows, BSD, Solaris), and CPU architectures (x86, ARM, RISC-V, PowerPC). All test machines are volunteer-hosted. The system catches compiler miscompilations—rare but devastating, since even a single wrong bit in a frame dependency chain can cascade into major visual corruption. Kunhya notes that the Macs at the top of the FATE dashboard are hosted in his own office. > *"It's not just a matrix at this point. It's like a pivot table of different combinations—all run by volunteers."* — Kieran Kunhya ## [121:08] Assembly code (handwritten) This extended chapter is the technical heart of the episode. Handwritten x86/ARM SIMD assembly in FFmpeg and x264 runs up to 62 times faster than equivalent C—a gap that modern compilers and auto-vectorization cannot close despite years of trying. VLC still supports Windows XP through Windows 11, macOS 10.7 through macOS 26, iOS 9 through the latest, BSD, Solaris, and even OS/2. Understanding assembly forces programmers to internalize CPU pipeline stages, SIMD registers, L1/L2/L3 cache, and memory bus constraints. Kempf and Kunhya introduce the x86inc framework built by Loren Merritt for x264 and JB's Assembly Lessons tutorial series, which have attracted contributions from teenagers learning directly from the source. > *"I believe it's necessary to understand assembly language, even if you don't do it much, to understand what's going on inside your computer. That will make you a better programmer."* — Jean-Baptiste Kempf ## [145:26] Rust programming language Kempf and Kunhya hold divergent opinions on Rust. Kunhya respects the memory-safety goal but finds the community self-important—"It has a very big Esperanto vibe"—and argues that Rust rewrites reaching only 85–90% of required feature coverage are insufficient; "the last 1% takes 99% of the time." Kempf has written Rust VLC modules and sees genuine value, but notes that the lack of training data for low-level SIMD work means AI tools cannot yet assist meaningfully. The discussion broadens to the two assembly wizards of the community: Henrik Gramner, whose knowledge of Intel x86 cycle counts exceeds Intel's own engineers, and Martin Storsjö, who writes ARM Neon assembly on a virtual keyboard while watching his kids play in the playground. > *"Rust reminds me of the Sinclair C5. In order to get people to move, you have to build something as good as, if not better than, what you have now."* — Kieran Kunhya ## [154:42] FFmpeg and Libav fork In 2011, FFmpeg split into FFmpeg and Libav, primarily over governance and leadership style rather than technical disagreements. Several Linux distributions temporarily shipped Libav instead of FFmpeg. Kempf describes open-source forks as healthy—they force projects to confront structural weaknesses. Eventually most of Libav's developers returned to FFmpeg, and the projects merged back. Kempf draws a parallel to the XZ Utils attack, where a lone maintainer, exhausted by coordinated social engineering, granted commit access to an attacker—highlighting how burnout creates the very single-point-of-failure vulnerabilities that make critical open-source infrastructure fragile. > *"Forks are important because they change the status quo of a community. FFmpeg today is better than it was before the fork."* — Jean-Baptiste Kempf ## [163:04] Open source burnout Kempf and Kunhya confront the mental health crisis among open-source maintainers. Kempf has received physical death threats—including a letter containing powder—over decisions such as dropping PowerPC support. The security community's habit of filing alarming CVEs for hobby-project edge cases adds psychological load without providing patches. Kempf now maintains several libraries whose original maintainers burned out. The conversation broadens to the systemic problem: critical infrastructure like libxml and XZ is maintained by one or two people, unknown to the trillion-dollar enterprises that depend on them. > *"The mental health of the open source maintainers is something that large corporations don't care or don't see."* — Jean-Baptiste Kempf ## [170:51] x264 and internet video H.264 transformed internet video by arriving exactly when Intel Core 2/Nehalem CPUs made real-time software decoding practical. The key innovation of x264 was psychovisual rate-distortion optimization—encoding decisions driven by visual quality metrics rather than mean squared error, producing sharper, more natural-looking video. This was driven by the anime community's high standards for perceived sharpness. AV1 offers 40–60% bandwidth savings over H.264 at the same quality, but encoding costs two orders of magnitude more CPU. YouTube therefore re-encodes only popular videos in AV1, making the extra compute worthwhile by amortizing it over millions of viewers. > *"Thirty percent of the video from Netflix is now in AV1, fifty percent of YouTube."* — Jean-Baptiste Kempf ## [184:07] Video compression basics The chapter clarifies I/P/B frame structure: I-frames are complete still images, P-frames reference only previous frames, and B-frames can reference both past and future frames. ProRes is an intra-only codec designed for nonlinear editing—no temporal dependencies, fast seeking. The segment also covers constant-bitrate versus constant-quality encoding, group-of-pictures length, and the thousands of engineers at Netflix, YouTube, and Meta whose entire job is tuning FFmpeg parameters for specific content types. A historical curiosity: Google Video originally used VLC as an ActiveX plugin inside Internet Explorer; today VLC is compiled to WebAssembly to run inside browser JavaScript engines. > *"You have I-frames that are complete frames, P-frames that depend only on I-frames, and B-frames that can depend on frames in front."* — Jean-Baptiste Kempf ## [191:04] CIA and fake VLC WikiLeaks' Vault 7 release revealed that the CIA built a modified version of VLC with an additional DLL (psapi.dll) that silently encrypted and exfiltrated documents while the victim watched a movie, using the expected high CPU load of video playback as cover. VideoLAN issued a press release directing users to download only from the official website. A separate incident involved Chinese state hackers distributing a fake VLC using legitimate signed VideoLAN DLLs to target Indian users, causing India to ban VLC until Kempf fought a successful legal battle to reverse the ban. The segment also surfaces a hidden feature: VLC can render movies as ASCII art in a terminal, useful for diagnosing multicast network paths via SSH. > *"If we had to compromise our software, we would shut it down. This is clear."* — Jean-Baptiste Kempf ## [201:39] Ultra low latency streaming Kempf explains adaptive streaming (HLS, DASH): the player downloads segments, times the download, and adjusts quality tier accordingly. The real engineering frontier is live broadcasting with strict CBR constraints—satellite uplinks cannot burst even for one second. Kempf describes his company Kyber, an open-source (AGPL dual-licensed) ultra-low-latency streaming stack targeting robotics and XR, streaming compressed video feeds to devices without onboard compute. The segment ends with a discussion of teleop for robots, where latency directly determines safety. > *"Kyber is open source. Everything on Kyber is open source. If you want to use it in your product and not open source it, you pay the commercial license."* — Jean-Baptiste Kempf ## [219:07] AV2 codec and video patents AV2, the successor to AV1 within the Alliance for Open Media (of which VideoLAN is a member), promises a further 30% bandwidth reduction. VideoLAN's dav1d decoder will be followed by "dav2d." The Alliance exists specifically to escape the HEVC/H.265 patent thicket: HEVC's three separate patent pools demanded fees so large that HP removed HEVC support from new laptops, and streaming giants calculated they could build a new royalty-free codec for less than the annual licensing cost. France's rejection of software patents means Kempf has never paid codec licensing fees—if he had to, the bill would exceed 200 euros per user. > *"At a hundred million per year, you know, I could create my own codec—and this is what they did."* — Jean-Baptiste Kempf ## [228:59] VLC backdoors Intelligence agencies from two different countries approached Kempf asking him to insert backdoors into VLC. He declined both, in terms he describes as "a lot less polite" than a simple no. The chapter broadens into a discussion of European entrepreneurship: Kempf argues that French startup culture has transformed over 15 years—failure stigma has fallen, AI companies are proliferating—while acknowledging that over-regulation remains a real drag. He closes by reflecting on his strategy for remaining calm under legal and political pressure: always ask "am I dying? Am I hurting someone?" If not, move on. > *"If we had to compromise our software, we would shut it down. Also because what we do is good and it's done for everyone."* — Jean-Baptiste Kempf ## [239:14] Video archiving Kieran profiles the archiving preservation community, led in part by Dave Rice of CUNY, which relies on FFmpeg as a "Rosetta Stone" for playing future-proof multimedia. The community funded FFV1, FFmpeg's lossless codec, to guarantee that archived footage loses no information—critical because lossy compression could destroy forensic or historical details visible only on close inspection. A famous cautionary tale: the BBC's 1986 New Domesday Book project archived content on BBC Micros, and within 20 years no one had working software to read it. There are now more historical video tapes in archives than functional tape heads in the world to digitize them, forcing painful triage decisions about what human history to preserve. > *"C will be like Latin. It will be a thing you learn from the past, but it will still be usable in certain contexts."* — Kieran Kunhya ## [245:51] Future of FFmpeg and VLC The closing chapter surveys where multimedia is heading: volumetric video, point-cloud codecs for robotics, RGBD depth streams, XR/VR streaming, and—speculatively—neural interfaces that may one day require codecs for compressed brain data. Kempf is confident FFmpeg will exist in 100 years; VLC he rates as "maybe." He closes with his personal philosophy: "Regrets are a tax on your mind. Learn from your mistakes, but don't regret." The episode ends with Lex reading Linus Torvalds: "Most good programmers do programming not because they expect to get paid or get adulation by the public, but because it is fun to program." > *"Regrets are a tax on your mind. Learn from your mistakes, but don't regret. Because you've done it, so unless you have a time machine, don't regret."* — Jean-Baptiste Kempf ## Entities - **Jean-Baptiste Kempf** (Person): President of VideoLAN, primary maintainer of VLC, founder of Kyber and several other companies; declined tens of millions of dollars to keep VLC ad-free. - **Kieran Kunhya** (Person): Veteran FFmpeg contributor, codec engineer, founder of Open Broadcast Systems, the voice behind the FFmpeg account on X. - **Lex Fridman** (Person): Host of the Lex Fridman Podcast, AI researcher, longtime VLC and FFmpeg advocate. - **Fabrice Bellard** (Person): Creator of FFmpeg, QEMU, and tcc; foundational figure of the project. - **Michael Niedermayer** (Person): Long-time FFmpeg maintainer who drove exhaustive codec support through the 2000s. - **Kostya Shishkov** (Person): Legendary FFmpeg reverse engineer who decoded proprietary binary blobs for Windows Media, RealMedia, and GoToMeeting codecs. - **Henrik Gramner** (Person): Assembly wizard with deeper knowledge of Intel x86 cycle counts than Intel's own engineers. - **Linus Torvalds** (Person): Creator of Linux and Git; referenced as a model of uncompromising code quality standards in open-source communities. - **FFmpeg** (Software): Open-source multimedia framework providing codecs, muxers, filters, and command-line tools; the invisible backbone of nearly all internet video. - **VLC** (Software): Open-source media player with 6.5+ billion downloads, built on libVLC and FFmpeg; plays virtually any format on any platform. - **x264** (Software): VideoLAN's open-source H.264 encoder; the dominant software encoder for internet video, famous for psychovisual optimizations. - **dav1d** (Software): VideoLAN's fast open-source AV1 decoder; widely deployed in browsers and streaming clients. - **VideoLAN** (Organization): French nonprofit that stewards VLC, x264, dav1d, and related open-source multimedia libraries. - **Alliance for Open Media** (Organization): Industry consortium including Google, Netflix, Apple, Amazon, and VideoLAN that created AV1 and is developing AV2 as royalty-free codec standards. - **FATE** (Software): FFmpeg Automated Testing Environment; volunteer-hosted CI grid testing hundreds of compiler/OS/architecture combinations. - **Kyber** (Organization): JB Kempf's startup building an ultra-low-latency open-source streaming stack for robotics and XR, dual-licensed AGPL/commercial. - **H.264 / AVC** (Concept): The dominant internet video codec standard; open-source implementation is x264; basis of Blu-ray and most MP4 files. - **AV1 / AV2** (Concept): Royalty-free next-generation video codec standards from the Alliance for Open Media; AV1 saves 40-60% bandwidth vs H.264; AV2 adds another 30%.

#ffmpeg#vlc#open-source
Claude Code란 무엇인가?
2:55
EN/ZH
Watch with Captions
ClaudeClaude Code 10121일 전

Claude Code란 무엇인가?

Anthropic의 공식 Claude Code 안내서——Claude Code가 무엇인지, Claude.ai와 어떻게 다른지, 그리고 LLM이 코드베이스에서 명령을 실행하기 전에 알아야 할 세 가지를 설명합니다. 터미널 도구를 처음 설치하려는 개발자를 대상으로 합니다. ## [00:04] Claude Code의 정의와 실행 환경 Claude Code는 에이전트형 코딩 도구로 포지셔닝됩니다. 코드베이스를 이해하고, 파일을 편집하며, 명령을 실행하고, 이미 사용 중인 개발자 도구와 통합됩니다. 터미널, VS Code, JetBrains IDE, Claude 데스크톱 앱, 웹 등 여러 환경에서 동작하지만, 이 안내서에서는 터미널을 기본 환경으로 다룹니다. > *Claude Code is an agentic coding tool that understands your code base, edits your files, run commands, and integrates with your existing developer tools to help you get things done faster.* ## [00:34] Claude.ai와의 차이점 핵심 차이는 모델 성능이 아니라 접근 방식에 있습니다. Claude Code는 터미널과 전체 코드베이스에 직접 접근하므로, 채팅창에 복사-붙여넣기하는 반복 작업이 사라지고 도구가 제자리에서 작업을 완료합니다. "AI 에이전트"라는 표현은 이 직접 실행 방식을 함축적으로 표현한 것입니다. > *Unlike Claude AI, Claude Code has direct access to your files in your terminal and your entire code base.* ## [00:51] AI 에이전트와 Claude Code로 할 수 있는 것들 여기서 AI 에이전트란 환경과 상호작용하고 정해진 목표를 달성하기 위해 행동을 취하는 소프트웨어를 의미합니다. 가장 기본적인 형태는 도구, 외부 서비스, 다른 에이전트에 접근할 수 있는 실시간 루프 속의 LLM입니다. Claude Code에서는 이것이 구체적인 기능으로 나타납니다. 코드베이스 읽기 및 설명, 파일 전체에서 버그 추적, 빌드 스크립트 및 테스트 실행, 패키지 설치, 그리고 다음 행동을 결정하기 위한 최신 API 문서 웹 검색 등입니다. > *An AI agent is a software that can interact with its environment and perform actions to complete a defined goal.* ## [01:45] 시작 전에 알아야 할 세 가지 개념 나레이터는 일상적인 사용에 영향을 미치는 세 가지 속성을 강조합니다. 첫째, **컨텍스트 윈도우**는 Claude의 작업 메모리로, 크지만 유한합니다. 그래서 에이전트는 코드베이스를 전부 불러오는 대신 전략적으로 탐색해야 합니다. 둘째, Claude Code는 명령을 실행하거나 파일을 변경하기 전에 **허가를 요청합니다**. 모든 단계를 직접 제어하고 싶든, 대부분 자율적으로 실행하게 하고 싶든 제어권은 항상 사용자에게 있습니다. 셋째, **틀릴 수 있습니다**. 의도를 잘못 파악하거나, 버그를 도입하거나, 수정을 과도하게 설계할 수 있습니다. 출력물은 다른 도구의 결과물과 마찬가지로 다루고, 무조건 신뢰하지 마십시오. > *By default, Claude Code will ask you before running commands or making changes to your code base.* ## [02:34] 요약 Claude Code는 코드베이스를 읽고, 파일을 편집하며, 명령을 실행하고, 외부 도구에 연결하여 더 빠르게 결과물을 만들 수 있도록 돕는 에이전트형 코딩 도구입니다. 현재 터미널, VS Code, JetBrains, Claude 데스크톱 앱에서 사용할 수 있습니다. > *Claude Code is an agentic coding tool. It reads your code base, edits your files, runs commands, and connects to external tools to help you ship faster.* ## 엔티티 - **Anthropic Tutorial Narrator** (Person): Claude Code 101 튜토리얼 시리즈의 Anthropic 공식 내레이터. - **Claude Code** (Software): Anthropic의 에이전트형 터미널 기반 코딩 어시스턴트로, 코드베이스에 직접 작동합니다. - **Claude.ai** (Software): 채팅 기반 Claude 제품으로, Claude Code의 환경 내 실행 방식과 대조됩니다. - **AI agent** (Concept): 정해진 목표를 추구하기 위해 도구, 외부 서비스, 다른 에이전트에 접근하며 실시간 루프에서 실행되는 LLM. - **Context window** (Concept): Claude의 작업 메모리. 유한하기 때문에 에이전트는 전체 코드베이스를 불러오는 대신 전략적으로 탐색합니다. - **VS Code / JetBrains IDEs** (Software): Claude Code가 터미널 및 Claude 데스크톱 앱과 함께 통합되는 에디터.

#claude-code#ai-agent#developer-tools
🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI
1:31:51
EN/ZH
Watch with Captions
Latent Space21일 전

🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI

Alex Lupsasca — 2024 New Horizons Breakthrough Prize winner and OpenAI resident scientist — recounts how GPT-5 resolved a year-long open problem in quantum field theory: proving that single-minus gluon tree amplitudes are non-zero and finding their compact closed form. He then describes how the publicly available GPT Pro, given the gluon paper as a seed, independently generalized the result to graviton amplitudes in under three days of human clock time. Throughout the conversation, Lupsasca reflects on what this trajectory means for how physics is done, how the next generation of physicists will be trained, and where the remaining bottlenecks — verification, creativity, and publishing infrastructure — still lie. ## [00:00] Introduction to AI's impact on physics research Lupsasca opens in medias res, framing the episode's central claim before the formal introduction: AI has crossed a threshold where it can resolve questions that stumped human experts for over a year. He describes this not as a curiosity for theoretical physicists but as a profound, if underappreciated, change in the nature of scientific discovery itself. > *"That's a certain milestone that we've passed, and I think maybe for the average person on the street who doesn't care about theoretical physics, this is not very noticeable, but I think it's a very profound change and we've really passed some kind of a threshold."* ## [00:43] Guest introduction: Alex Luposka The hosts — Brandon (Atomic AI) and RJ Honicky (Miro Omix) — introduce Lupsasca as a Vanderbilt professor and OpenAI fellow who holds both the 2024 New Horizons in Physics Breakthrough Prize (often called the "Oscars for science") and the IUPAP Young Scientist Award. Lupsasca immediately sets the narrative arc: a year ago, AI was useful for email but not for his work; ChatGPT o3 was the first model that genuinely helped with research math; then GPT-5 reproduced one of his hardest published results in 30 minutes. > *"When GPT-5 came out it was able to reproduce one of my best papers that took me a very long time to come up with in like 30 minutes. And that's when I really became AI pilled."* ## [02:49] Alex joining OpenAI and the shift in physics research After GPT-5's release, Lupsasca began evangelizing the shift to colleagues who were skeptical. Finding OpenAI equally excited, and being on sabbatical, he joined as resident scientist — the person physicists around the world now email when something astonishing happens. He describes receiving an inbound that week about Codex simulating the Sachdev-Ye-Kitaev (SYK) model in 10 minutes, a feat that many research groups had struggled to achieve due to the narrow Venn diagram of physicists with strong coding skills. > *"I talked to OpenAI. They were also really excited and I thought I have to get in on this and to understand that this is happening and not be a part of it is a huge mistake so I have to go to OpenAI."* ## [04:08] The release of GPT-5 and the shift in capabilities Lupsasca contrasts the lukewarm Twitter reception of GPT-5 (complaints that it was not better at writing email) with what he observed at the science frontier. He notes GPT-5.4 is another significant jump, and describes how AI capabilities for physics have been accelerating rapidly since o3, the first reasoning model strong enough for research-grade mathematics. He uses this as a bridge to the central technical story of the episode: a pair of new papers on gluon and graviton scattering amplitudes. > *"At the science frontier the capabilities were really taking off."* ## [10:05] Explaining Quantum Field Theory and amplitude calculations Lupsasca gives an accessible primer on quantum field theory (QFT), the framework that reconciles special relativity and quantum mechanics. The key objects in QFT are scattering amplitudes — complex-valued functions that encode the quantum probability for a set of incoming particles (with given energies, momenta, and polarizations) to scatter into a set of outgoing particles. These amplitudes are computed at particle colliders like the LHC, and knowing the n-point amplitude (for any number n of particles) encodes essentially the full content of the theory. > *"If you have a particular force and you're able to compute the n-point amplitudes... you know everything about the theory."* ## [14:20] Overview of gluons and the strong force Gluons are the force-carrying particles of the strong nuclear force — the force that, despite like-charge repulsion between protons, holds the atomic nucleus together. They are the QFT analog of photons for electromagnetism and gravitons for gravity. Like photons, gluons carry a polarization (helicity): positive (right-handed) or negative (left-handed). This helicity structure is central to the paper discussed next. > *"The strong force is mediated by the exchange of the particles of the strong force, which are called gluons, because they're what glues together the nucleus of the atom."* ## [14:38] Discussing the first research paper on single-minus gluon tree amplitudes Lupsasca unpacks the paper's title — "Single-Minus Gluon Tree Amplitudes Are Non-Zero" — piece by piece. Tree amplitudes are the leading-order (no-loop) contributions to scattering. All-plus-helicity amplitudes are exactly zero by a symmetry argument. Single-minus amplitudes — where all but one gluon have positive helicity — were assumed in textbooks to also be zero by the same argument. The paper proves they are not. The result involves collaboration with Alfredo Guevara (IAS), David Skinner (Cambridge), Andrew Strominger (Harvard), and Kevin Wheel. > *"If you look at the lecture notes and textbooks that have been written on this, the same argument that rules out the all-plus amplitudes also appears to rule out the single-minus amplitudes."* ## [20:56] How ChatGPT helped solve a year-long physics puzzle Strominger, Guevara, and Skinner had understood for about a year that the textbook argument has a loophole: when particles are collinear (exactly aligned in momentum), the standard dimensional-analysis reasoning fails, and single-minus amplitudes can be non-zero. But computing what those non-zero amplitudes equal had eluded them. Lupsasca invited Strominger to visit OpenAI and work on it with AI. The week before Strominger's flight, Lupsasca began using ChatGPT Pro. By the time Strominger landed, they had the answer. > *"Using ChatGPT we solved the problem before he even got off the plane."* ## [23:02] Complexity of manual calculations in physics Lupsasca shows the audience a concrete illustration of the difficulty: the six-point single-minus amplitude, worked out by hand by Alfredo Guevara, is a sum of 32 terms each of which is itself a product of four complicated factors. The number of terms grows factorially with the number of particles n — super-exponential growth. This is the messy representation that the group had been staring at for a year, seeking the analog of the elegant Parke-Taylor formula. > *"By the time you get to six terms, it explodes in your face."* ## [26:12] The history and mechanics of Feynman diagrams Feynman diagrams are a visual language introduced by Richard Feynman to organize perturbative QFT calculations: diagrams represent possible intermediate histories of a scattering process, and the full amplitude is a sum over all of them. Diagrams are organized by number of vertices (interaction points); each additional vertex is suppressed by the coupling constant, so tree diagrams (fewest vertices) dominate. Loop diagrams — where intermediate particles are created and annihilated — contribute smaller corrections. The combinatorial explosion of tree diagrams is the root cause of factorial growth. > *"In principle, there are infinitely many pictures to sum over."* ## [27:44] The Parke-Taylor formula and the quest for simplification In the 1980s, Parke and Taylor computed the "maximally helicity violating" (MHV, or double-minus) gluon amplitudes through a heroic Feynman diagram expansion. Despite the factorial number of terms, everything canceled to leave a single compact formula — the Parke-Taylor formula — that fits in half a line. Strominger, Guevara, and Skinner spent a year looking for the analogous compact formula for the single-minus case. Their search stalled at the level of the messy Feynman representation. > *"Andy, Alfredo and David spent the last year chasing the analog of the Parke-Taylor formula, the very simple answer that was obtained in the '80s for the double minus amplitudes."* ## [31:26] Using ChatGPT to find the simplification in the special phase space region When the five-point single-minus amplitude was fed to ChatGPT Pro, the model identified a special subregion of phase space (where one particle's frequency has opposite sign) in which the amplitude simplifies from eight terms to a product of just three. This appears not to have been a known fact; the model wrote Python code and tested thousands of possibilities to deduce it. Moving to the six-point amplitude (Guevara's hand calculation), ChatGPT simplified 32 terms to a product of 4. It then conjectured the general n-point formula — with only linear growth in the number of terms, the best possible behavior. GPT-5.2 Pro guessed the formula but could not prove it. > *"The formula that it proposed, instead of having this factorial growth... here it's actually linear. So if you double the number of particles, you only double the number of terms."* ## [38:07] Proving the formula from scratch to ensure validity To obtain a proof, Lupsasca used an internal OpenAI model with extended reasoning. He gave it the problem cold — without the conjectured formula — and asked it to find the general answer in the special phase-space region. After 12 hours of computation, the model independently rediscovered the same formula and produced a complete three-step proof. The proof constitutes the bulk of the published paper. The team kept the AI attribution to one paragraph, framing the paper as a physics result that stands on its own merits. > *"We gave it the whole problem from scratch... and it came back with the same formula which we had not given it. So it rediscovered the correct formula. But this time it also found the proof."* ## [41:00] Determining the scientific impact and future research Asked to compare the result to the Parke-Taylor formula, Lupsasca is candid that scientific impact is only assessable decades later, but argues the result is genuinely surprising and should open a line of attack toward deeper questions in quantum gravity. The conversation pivots naturally to the second paper. > *"I think the true value of a paper can only be assessed decades into the future based on how much future work it leads to and what developments it opens up."* ## [42:27] Introduction to the second paper on graviton amplitudes Gravitons are the hypothetical quanta of gravity — the spin-2 force carrier analogous to the spin-1 photon (electromagnetism) and gluon (strong force). Unlike gluons, gravitons have never been directly detected, but they are central to quantum gravity theory. The second paper, "Single-Minus Graviton Tree Amplitudes Are Non-Zero," shows the same loophole applies to gravity and that a compact formula extends there too — despite gravitons being mathematically more complex than gluons. > *"We wrote this paper which is called single minus graviton tree amplitudes are non-zero. So it's the same title almost, except with graviton instead of gluon."* ## [45:41] Defining particles, irreducible representations, and symmetry Lupsasca sketches the modern QFT definition of a particle (an irreducible representation of the Poincaré group, classified by Wigner according to mass, spin, and charge) and explains why gravitons are spin-2 while gluons and photons are spin-1, making graviton polarization data twice as rich. Crucially, the second paper was complete within three days of the first going public — most elapsed time was spent verifying correctness, not computing. > *"Most of the time was spent verifying the answer, not writing, which is insane, actually, if you take a step back."* ## [47:46] How GPT Pro generalized the research to gravity For the graviton paper, no internal model was needed — the publicly available ChatGPT GPT-5.2 Pro sufficed. Lupsasca provided the gluon paper as context plus two paragraphs describing the key mathematical changes, then said "Good luck. You're a brilliant theoretical physicist." Over a 110-page exchange, the model worked through the graviton calculation — applying the directed matrix tree theorem, a piece of known combinatorics that neither Lupsasca nor collaborators had thought to invoke — produced correct intermediate results, and wrote a draft paper very close to the final arXiv version from section 3 onward. > *"It's a real solid result in quantum gravity that was done pretty much completely by an AI with human steering it and asking kind of the right questions."* ## [53:57] The epistemological shift: Is this a new way of doing physics? The hosts raise the central epistemological question: if an undergraduate with domain knowledge and good prompting could have done this, what does graduate training mean now? Lupsasca agrees this is the hardest open question facing academia. He notes that arduous calculation trains not just skill but self-confidence, that the gap between coursework and the research frontier is growing, and that many "easy" problems professors once assigned to students are now solvable by AI in minutes. He offers two concrete ways AI has already changed his own workflow: dramatically reducing time spent confused between steps, and enabling parallel AI scouts that explore multiple research directions simultaneously. > *"With AI, actually, you can launch 10 instances of chat and have each one try a different route and send it as a scout that moves very fast into the unknown."* ## [59:27] The use of AI as a 'scout' for research directions Lupsasca elaborates on the scout metaphor: rather than carefully mapping a route from A to C before committing to it, a researcher can now dispatch many AI "scouts" in parallel, get rapid feedback on which directions are promising, and redirect human attention accordingly. Even when a scout makes errors, its signposts reduce orientation cost for the human following. This constitutes a qualitatively new mode of research — one where the bottleneck shifts from calculation to judgment about which directions matter. > *"Even if ChatGPT doesn't always get everything right, just kind of having a scout that signposts some key steps along the way that you can use to anchor your own movement is extremely helpful."* ## [61:44] The role of 'taste' and collaboration with AI The hosts push on the problem of "taste" — the ability to identify which questions are at the productive edge of knowledge. Lupsasca argues that working effectively with ChatGPT requires the same skill a professor develops advising students: knowing what question to give, at what level of detail. "Taste" — knowing where the frontier is and which questions there are tractable — is the last skill to develop and the one AI currently lacks. AI is, he says, like an extremely technically skilled graduate student: given a sharp, well-posed question, it can do incredibly hard computations correctly, but it does not yet know which question to ask. > *"The difference between a good physicist and a great physicist is knowing what is the right question to ask — that is actually the hardest part of being a scientist."* ## [70:23] Personal evolution from AI skeptic to resident scientist Lupsasca recapitulates his personal arc: skeptic → converted by o3 (which solved in 11 minutes a calculation that would have taken him days) → "AI-pilled" by GPT-5 (which reproduced, in 30 minutes, his best published result on black hole Love numbers and tidal symmetries — a paper whose training cutoff predated its arXiv release) → now resident scientist at OpenAI. He notes that no competing model at the time could match GPT Pro on that calculation. > *"In under 30 minutes, with one hint... it completely solved this problem, which is one of the nicest calculations that I've ever done."* ## [72:46] Solving a black hole perturbation problem with GPT-5 Lupsasca details the "Move 37" moment that converted him: his paper "Why Is There No Love in Black Holes?" establishes new symmetry generators for perturbations of a Kerr black hole (explaining why black hole Love numbers — tidal response coefficients, named after mathematician Augustus Love — are exactly zero). When GPT-5 Pro was first given the full problem cold, it failed. But after being primed with the simpler flat-space warm-up (a 200-year-old known result), it then solved the full Kerr black hole problem in 18 minutes. > *"GPT-5 was able to reproduce one of my hardest calculations, which I think the number of people in the world that could do that you could count on your hands."* ## [76:34] Discussing whether AI can make original, conceptual leaps The hosts ask whether AI is doing genuine recombination versus true creative leaps. Lupsasca cites Terry Tao, who has not yet seen an AI proof that cannot be traced to an obscure reference. But Lupsasca has been impressed and frames the distinction as one of degree rather than kind — humans may also be recombination machines. He believes continued scaling will produce feats of insight that look like creativity, and notes OpenAI is actively working on enabling models to take bigger, more out-of-distribution leaps suited to scientific discovery. > *"I'm not sure there's a qualitative difference. I think it's just a matter of degree — as we continue scaling the capabilities, I don't see why it's going to stop."* ## [80:09] Challenges of 'AI slop' and the future of academic publishing With models now capable of turning out a physics paper in 30 minutes when properly steered, the arXiv preprint server is being flooded with submissions. Lupsasca distinguishes legitimate use (expert steering + careful verification) from "AI slop" — poorly prompted outputs submitted without adequate checking. His proposed response: raise the bar rather than increase volume. The single-minus amplitude papers open a clear line of attack toward genuine quantum gravity questions; the goal should be to pursue harder problems, not to publish incrementally. > *"Instead, I think now that we have this new tool that gives us AI superpowers, I think we should just raise the bar for what it means to write a good paper."* ## [83:13] The bottleneck of writing academic papers Asked what single bottleneck he would remove, Lupsasca nominates the paper-writing process itself — finding it increasingly strange that researchers use AI to do calculations, compress results into a static paper, and then readers feed that paper back into AI to understand it. He envisions interactive, LLM-embedded papers as a plausible future. He also identifies two missing capabilities in current models: (1) the spark of creativity to identify the next important question, and (2) reliable self-verification, so that the onus of checking long AI-generated proofs does not fall entirely on humans. > *"Maybe some kind of interactive paper which lives in some LLM. Maybe your whole paper is some ChatGPT page... I think we're going to head in that direction."* ## [90:19] Final takeaways and looking ahead to the next year Lupsasca's closing message: pay attention. The trajectory from "useful for email" to "solves open problems in quantum gravity" has taken roughly 18 months. Models are solving open problems that expert communities spent years on. Extrapolating forward, with more scaling already in the pipeline, the next 6 to 12 months should bring further surprises. The right posture is excitement, careful verification, and a commitment to pursuing harder problems. > *"If you just extrapolate that into the future, imagine where we're going to be in 6 months or a year — I think it's kind of surreal to live through this time, but it's really happening."* ## Entities - **Alex Lupsasca** (Person): Theoretical physicist, Vanderbilt University professor and OpenAI resident scientist; 2024 New Horizons Breakthrough Prize and IUPAP Young Scientist Award winner; expert in black hole physics and scattering amplitudes. - **Andrew Strominger** (Person): Harvard professor and Lupsasca's former PhD advisor; pioneer of celestial holography; co-author of both single-minus amplitude papers. - **Alfredo Guevara** (Person): Postdoctoral researcher at the Institute for Advanced Study (IAS); performed the foundational hand calculations underpinning the AI-assisted breakthrough. - **David Skinner** (Person): Professor at Cambridge University; co-author of the single-minus gluon amplitude paper. - **Terry Tao** (Person): Fields Medal-winning mathematician at UCLA; referenced regarding the question of whether AI proofs involve genuine creativity. - **Scattering Amplitudes** (Concept): Complex-valued functions in quantum field theory encoding probabilities for particles to scatter; the central mathematical objects of both papers discussed. - **Single-Minus Gluon/Graviton Amplitudes** (Concept): Tree-level scattering amplitudes where all but one particle have positive helicity; previously assumed zero in textbooks but shown non-zero in a collinear phase-space region. - **Parke-Taylor Formula** (Concept): Compact closed-form result for maximally helicity violating (MHV, double-minus) gluon amplitudes derived in the 1980s; the template whose analog was sought for single-minus amplitudes. - **Feynman Diagrams** (Concept): Diagrammatic technique to organize perturbative QFT calculations; individual diagrams represent distinct intermediate-particle histories whose amplitudes are summed. - **Love Numbers** (Concept): Coefficients encoding tidal deformability; famously vanish for black holes, a fact connected to hidden symmetries studied in Lupsasca's "Why Is There No Love in Black Holes?" paper. - **Celestial Holography** (Concept): Research program exploring symmetries of quantum gravity via scattering amplitude structure; motivates studying graviton amplitudes. - **OpenAI** (Organization): AI research company where Lupsasca serves as resident scientist; developer of GPT-5 and the internal extended-reasoning model used for the amplitude proof. - **arXiv** (Organization): Open-access physics and mathematics preprint server; mentioned in the context of AI-generated "slop" flooding submissions. - **GPT-5 / ChatGPT Pro** (Software): OpenAI's frontier language model used as the primary AI tool in both amplitude papers; capable of extended reasoning steps of 20-34 minutes per prompt.

#theoretical-physics#quantum-field-theory#gpt-5
Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!
1:58:11
EN/ZH
Watch with Captions
The Diary Of A CEO22일 전

Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!

NYU Stern professor and serial entrepreneur Scott Galloway delivers a two-hour reality check on artificial intelligence: the doom-and-gloom predictions from AI CEOs are largely fundraising theatre, yet the technology poses a genuinely insidious risk that almost nobody is discussing — an epidemic of loneliness. Galloway argues that AI primarily benefits the already-wealthy, that tech leaders should not be trusted to self-regulate, and that the most valuable human skill in the AI era is not coding or Mandarin — it is the ability to endure rejection. The conversation weaves through geopolitics, investing, the masculinity crisis, and what it means to find purpose, closing with a raw reflection on grief and fatherhood. ## [00:00] Intro Host Stephen introduces Scott Galloway against a backdrop of rapid AI development and unsettling quotes from tech CEOs predicting total job replacement. Galloway opens with his central thesis: the two greatest brand collapses of the past 18 months are the United States' global reputation and artificial intelligence itself — both victims of overpromising and poor trust management. He signals that he is an AI optimist at the macro level, but insists the people building it do not have the public's best interests at heart. > *"These techs, they do not have our best interests at heart."* ## [02:45] What's Actually True About AI Galloway reveals a striking data point: approval of AI is directly correlated with income. Only households earning over $200,000 per year hold a net-positive view of the technology, because they benefit through rising portfolios and are the heaviest users. Everyone else sees higher electricity bills, no equity stake in the companies, and dismissive comments from leaders like Sam Altman telling people to stop complaining about energy costs. The AI brand, he argues, has shifted in 18 months from "scary but optimistic" to "scary and only good for the already rich." > *"Your view of AI is directly correlated to your wealth. The only cohort that has a positive rating of AI is people making over $200,000."* ## [05:00] Are AI CEOs Exaggerating The Future To Raise Billions? Galloway lays out the economic logic behind AI catastrophizing. These companies sit on astronomical valuations that can only be justified if either (a) a trillion dollars in incremental revenue materialises from AI-powered products, or (b) there is a massive wave of labour cost savings. Because option (a) is not yet visible — he sees no AI-driven products at meaningful scale — the CEOs amplify option (b), painting vivid pictures of job destruction to justify the efficiency gains enterprises need to believe in. He calls some of the doom talk "thinly veiled fundraising," noting that founders catastrophize and then take secondaries and leave for Santorini. > *"The catastrophizing is nothing more than a thinly veiled attempt to say my technology is so devastating that it's going to shift society and you should invest at this crazy valuation."* ## [09:00] What Would Prove The AI Skeptics Wrong? Asked where he could be wrong, Galloway is specific: if unemployment rises to 20% even temporarily, history shows civil unrest follows regardless of eventual job recovery. He points to radiologists and coders as cases where AI has augmented rather than eliminated roles — new coder job listings are up 11% year-on-year. His benchmark for being wrong is sustained destruction outpacing creation fast enough that the recovery "V" triggers social breakdown before the other side is reached. > *"At 20% unemployment, especially among youth, especially young men tend to get very angry and take to the streets."* ## [11:05] Could AI Move Too Fast For Society To Handle? The conversation turns to pace of change. Galloway uses the host's own media empire — 220 hires in 24 months — as a live counter-example to the apocalypse narrative. He notes a structural inversion: for the first time in decades, unemployment among non-college graduates is lower than among college graduates because AI data centres are driving a boom in trades. He praises the entrepreneurial wave unlocked by AI tools and flags Denmark's 2% GDP commitment to retraining versus America's inadequate equivalent as the real policy failure. > *"AI is not going to take your job. Someone who understands AI is going to take your job."* ## [16:05] What Happens When AI Combines With Robots? Galloway addresses Elon Musk's Optimus robot predictions and the convergence of physical automation with AI cognition. His 2026 stock pick is Amazon, which already holds more industrialised robots than the rest of the US combined and plans to double its retail operation by 2032 without additional headcount. He is sceptical of domestic humanoid robots but takes seriously the military application of weaponised autonomous systems as a genuinely dark unknown frontier. > *"Amazon is saying they're going to double their largest business, which is their retail business by 2032 without an incremental hire using robotics, industrialised robots."* ## [19:05] Is Elon Musk Selling Vision or Reality? Galloway separates Musk the innovator from Musk the stock promoter. He calls Starlink the best tech product of the past several years and credits Musk with inspiring the EV race. But Tesla should trade at 30x earnings, not 150x, and capital will migrate to SpaceX when it IPOs at a projected 90–110x revenues. The core insight: the modern CEO's job has inverted from underpromise-and-overdeliver to overpromise-and-underdel in order to access cheap capital and pull the future forward. > *"The key attribute of an innovator right now is storytelling — to make sure the promise is way ahead of the performance such you can access cheap capital and pull the future forward."* ## [24:05] Which Jobs Are First To Disappear In The AI Shift? Long-haul trucking is Galloway's clearest near-term casualty: autonomous trucks can run the 10 pm to 4 am window and trucking is the largest single employer of non-high-school-graduate males in America. Legal work at the junior associate level is already being displaced — he now routes contracts through two competing LLMs rather than a $400–$2,000 law firm review, projecting a third reduction in his annual legal spend. The pattern he observes is multiplication: one AI-fluent analyst replaces five, yet the resulting EBITDA funds expansion that creates new jobs elsewhere in the ecosystem. > *"AI is not going to take your job. Someone who understands AI is going to take your job. So have a second screen — always have a second screen open that has nothing but AI on it."* ## [30:05] What Skills Will Actually Matter In The Future? Storytelling tops Galloway's list — the ability to look at data, construct a narrative arc, and communicate it compellingly across every medium. He holds up Jeff Bezos's 1997 shareholder letter, Jensen Huang's stadium keynotes, and Alex Karp's walk-and-talk earnings calls as models. Relationships are the second pillar: as technology converges and products commoditise, the differentiator is whether people want to work with you. He is honest that predicting specific skills is unreliable — private schools doubled down on computer science and Mandarin a decade ago, and neither bet has paid off as expected. > *"The enduring skill is storytelling — your ability to look at data, create a narrative arc and then communicate that story in a compelling way via all the different mediums."* ## [33:45] Are Young People Losing The Ability To Handle Rejection? Galloway identifies the erosion of rejection-tolerance as the most underrated threat facing young people, especially young men. Frictionless online relationships offer a simulacrum of connection without the emotional labour of real-world risk. He mentors young men by assigning deliberate rejection exercises: approach a stranger for friendship, ask someone out for coffee. The goal is not the yes; it is learning that a no is survivable. He argues his own superpower is simply the willingness to mourn failure and try again. > *"The secret to my success is rejection. I ran for sophomore, junior, and senior class president of my high school. I lost all three times."* ## [39:55] Can You Trust The People Building AI? A sharp cultural critique: America has replaced declining religious institutions with tech idolatry, crowning each new CEO as a secular Jesus Christ. Steve Jobs, then Zuckerberg, then Sam Altman, now Dario Amodei — each is briefly positioned as the good guy before completing the villain's journey. Galloway's argument is not that these people are evil but that they are doing exactly what capitalism demands: maximising earnings regardless of wider harm. The answer is not more trustworthy tech founders; it is competent elected officials who regulate them. > *"Can we trust Sam Altman? No. But we shouldn't need to trust him. We should be able to trust that we have smart elected officials that will regulate these companies."* ## [44:50] Are Tech Leaders Quietly Preparing For The End? Galloway reveals that roughly one in three billionaires maintain a "go bag" — a fully funded escape plan, typically a private jet to Auckland and a fortified New Zealand bunker. He calls this nihilism: the ultra-wealthy have sequestered themselves so completely from ordinary infrastructure — private aviation, concierge medicine, private security, elite schools — that they are no longer invested in the health of society. Their disproportionate political donations are therefore not directed at making the system work for everyone. > *"The problem is the 0.1% are not invested in the health of America. They don't have to put up with TSA lines. They fly private."* ## [52:00] Do Some AI Leaders Believe The Risk Is Worth It? A secondhand but chilling account: a source with direct access to an AI CEO described someone who genuinely believes there is a roughly 7–10% chance their work ends in catastrophe, but considers being the person who summoned this new intelligence consequential enough to proceed regardless. Galloway connects this to widening inequality — the delta between middle-class and ultra-wealthy life has expanded so dramatically across healthcare, travel, and security that the incentives of the 0.1% are structurally misaligned with the rest of society. > *"The bottom 99% of Western societies are essentially being optimised and monetised to make the life of the 1% just unbelievable."* ## [58:04] Ads Sponsored segments for LinkedIn Hiring Pro and Function Health. ## [60:05] Could AI Make Us More Human? Galloway offers a surprising positive: unlike social media algorithms that push users toward political extremes, AI models appear to moderate views by seeking statistical medians. He sees genuine value in AI companionship for isolated elderly users. But he returns to his central fear: the biggest downside of AI is not weapons, not election contamination, not even income inequality — it is loneliness. Men aged 20 to 30 are spending less time outdoors than prison inmates, and 42% of men aged 18 to 24 have never asked a woman out in person. > *"The biggest downside of AI in my view is loneliness. AI is convincing people they can have a reasonable facsimile of life on a screen with an algorithm."* ## [65:00] What Happens When AI Becomes Your Closest Companion The conversation shifts to the Iran conflict as a case study in what happens when strategic incompetence meets operational excellence. Galloway credits the initial military strike as tactically credible but argues the absence of Congressional briefing, Gulf ally coordination, and clear exit objectives has produced a quagmire — and notes Iran's IRGC-produced propaganda is outperforming US information operations in the global war of memes. > *"The problem with wars is that the enemy has a say. And all the enemy needs to do — whether it's the Viet Cong or the Taliban or the IRGC — is survive, and they win."* ## [70:00] The Hidden Trade-Off Between Convenience And Real Relationships Galloway diagnoses America's Iran strategy as a product of a gutted diplomatic corps. When senior officials fly to Islamabad expecting a deal, 97% of the preparatory work that career diplomats would normally complete simply has not happened. The IRGC understands the game better: all they need to do is survive, and every day the conflict continues they look like the underdog who stood up to the superpower. His most optimistic scenario is a multinational force enforcing freedom of navigation through the Strait of Hormuz. > *"Do you know what we have done in the US to our diplomatic corps? We've absolutely gutted it."* ## [75:00] Why Loneliness Could Explode US stock markets hit an all-time high during active Middle East conflict — a sign that the wealthy are so insulated from geopolitical risk that war no longer registers in asset prices. The top 10% account for 50% of consumer spending, and that cohort does not care if gasoline hits six dollars a gallon. The pain is outsourced to lower-income households and oil-dependent nations. Galloway frames this dissociation from shared risk as one of the most dangerous structural features of contemporary inequality. > *"We've outsourced the downside of war to less wealthy nations who are very oil dependent, to the Gulf, which is incurring damage here."* ## [79:26] The Real Reason Human Connection Might Become More Valuable Extended discussion of AI market valuations and the historical pattern of infrastructure overbuild. Every great infrastructure boom — railroads, electrification, the internet — ended in a crash, and AI capex now constitutes a significant share of US GDP growth. Galloway argues there is a one-in-three chance AI ends up like jet aviation or vaccines: transformative for humanity but impossible to monetise exclusively for a small group of companies, because open-weight Chinese models could commoditise the entire stack through "AI dumping." > *"AI puts AI out of business. And that is if you look at the convergence of the technologies, all the models are converging."* ## [85:00] What This Means For The Next Generation Galloway argues that a market correction might actually benefit younger generations by making assets affordable again. He flags GLP-1 drugs as his technology pick over AI in terms of real-world human impact. His personal investment philosophy at age 61: aggressive diversification, no single position above 3% of net worth, rotation out of overheated US markets into Europe and Latin America. For young people, the only wealth-building path he trusts is compound interest through low-cost index funds, with money automatically invested before it can be spent. > *"The only answer I have is slowly — find out a way to start saving when you're a teenager, 25 bucks a month, then in your 20s 100, then 500."* ## [90:00] How Power, Politics, And AI Are Becoming Intertwined Drawing on his experience losing 70% of New York Times ad revenue in 60 days during 2008, Galloway warns that younger entrepreneurs have never experienced a true recession. He argues that the political class has systematically bailed out asset-owning baby boomers — COVID relief, corporate bailouts, perpetual market support — while denying younger generations the chance to buy assets at distressed prices. Recessions historically created entry points; that mechanism is now deliberately suppressed. > *"Your generation really doesn't know what a recession looks like. Like, everything stops."* ## [95:00] The Dangerous Gap Between Technology And Regulation Personal finance advice combined with a reflection on the limits of prediction. Galloway's investment rule for young people: put money in yourself first, then in relationships, then in diversified index funds. He is honest that picking winning sectors is largely futile, and that anyone claiming certainty does not know. His own investment in Pokemon cards with his son illustrates that the best investments compound in non-financial ways — relationships and shared experience accrue value that conventional ROI cannot measure. > *"The only answer I have is slowly and it requires some discipline. Save money, diversify, compound interest, invest in relationships early."* ## [100:00] What Happens If Governments Can't Keep Up With AI Asked what a 33-year-old should know that a 61-year-old has learned, Galloway offers three lessons: be humble in success because much of it is luck; forgive yourself in failure because much of it is also circumstance; and invest aggressively in relationships in your 30s, because he spent his prime years professionally focused and nearly ended up isolated. He frames every major disappointment as something people later regret not the thing itself but how upset they allowed themselves to be. > *"Nothing's ever as good or as bad as it seems. Be humble when you're successful. And forgive yourself and realise this will pass."* ## [105:00] The Future Of Work, Power, And Who Really Wins Fatherhood as purpose. Galloway confesses he did not want children and did not fall in love with his sons immediately after birth. What changed his view was discovering that fatherhood is the one investment where a positive financial return is structurally impossible — and that is precisely what makes it purposeful. The same logic applies to any cause large enough to demand more than you can ever get back: veterans, activism, caregiving. He closes with frank advice on partnership, timing, and the liberation of having no choice but to lean into your children's interests. > *"Finding your purpose is finding that thing that you can never get a real positive return on. I will never get a positive return for my children."* ## [110:00] Why The Biggest AI Risks Aren't What You've Been Told The final chapter opens with Galloway's emotional description of his sons' contrasting personalities — one a mirror of himself, one a "different species" he observes with fascination. He discusses his book *Notes on Being a Man*, framing it as letters he hopes his boys will read in 30 years. The closing question — the biggest setback and its lesson — draws the most emotionally raw answer of the episode: his mother's death. He says he has not gotten over it and does not want to, because grief is the receipt for love, and he hopes his sons will one day feel the same about losing him. > *"My mother dying. And you can never tell your parents how much you love them too much. The reverse of love is grief."* ## Entities - **Scott Galloway** (Person): NYU Stern Professor of Marketing, serial entrepreneur, author of *The Four*, *The Algebra of Happiness*, and *Notes on Being a Man*; host of the Prof G Pod and Pivot podcast - **Sam Altman** (Person): CEO of OpenAI; used as the primary case study in the recurring tech-leader idolisation and disillusionment cycle - **Elon Musk** (Person): CEO of Tesla, SpaceX, and xAI; discussed as visionary storyteller whose real products (Starlink, SpaceX) are transformative but whose timelines consistently overshoot - **Dario Amodei** (Person): CEO of Anthropic; cited as the current tech industry "good guy" before the inevitable villain turn - **Jensen Huang** (Person): CEO of Nvidia; held up as a model of storytelling-driven CEO performance via stadium keynotes - **OpenAI** (Organization): Developer of ChatGPT; primary subject of fundraising-hype and overvaluation critique - **Anthropic** (Organization): AI safety company; referenced as beneficiary of the "latest hero" investor narrative - **SpaceX** (Organization): Musk's rocket company; flagged as likely destination for capital migrating away from Tesla at IPO - **Amazon** (Organization): Galloway's top large-cap stock pick for 2026 due to robotics leadership and warehouse automation scale - **Tesla** (Organization): Great car company trading at an unjustifiable multiple that will correct when SpaceX IPOs - **GLP-1 drugs** (Concept): Weight-loss and metabolic medications (Ozempic/Wegovy class) that Galloway argues will create more real-world human impact and shareholder value than AI - **AI dumping** (Concept): Galloway's term for China flooding the US with cheap open-weight AI models to undermine American AI valuations and destabilise the economy - **Go bag / billionaire nihilism** (Concept): The practice among roughly one-in-three billionaires of maintaining funded escape plans as a symptom of disengagement from shared societal wellbeing - **Rejection tolerance** (Concept): Galloway's candidate for the most underrated skill of the AI era — the willingness to hear no, mourn briefly, and try again

#ai#economics#future-of-work
Robotics' End Game: Nvidia's Jim Fan
20:03
EN/ZH
Watch with Captions
Sequoia Capital26일 전

Robotics' End Game: Nvidia's Jim Fan

Jim Fan, lead of Nvidia's embodied AI research, outlines the transition from language-centric models to World Action Models (WAM) that simulate physical reality. He details a roadmap toward the 'Physical Turing Test' and autonomous factories by 2040, driven by video pre-training and human egocentric data scaling. ## [00:00] Introduction Host Sonya Huang introduces Jim Fan, who leads Nvidia's embodied autonomous research group. Fan reflects on his early days as an intern and the excitement surrounding the future of robotics. > *robots are just one of the most thrilling things that's going to happen.* > *[0, 12]* ## [00:30] DGX One Origin Story Jim Fan recounts the 2016 delivery of the first DGX-1 by Jensen Huang to Elon Musk and the OpenAI team. He highlights how this moment catalyzed the deep learning revolution that led to current AI breakthroughs. > *If you believe in deep learning, deep learning will believe in you.* > *[1, 26]* ## [01:42] The Great Parallel Fan proposes 'The Great Parallel,' applying the successful LLM scaling playbook to robotics. Instead of predicting the next token in a string, the goal is to predict the next physical world state through simulation and alignment. > *instead of simulating strings can we simulate next physical world state?* > *[2, 56]* ## [03:31] Robotics Endgame Setup The strategy for achieving the robotics end game is divided into two primary pillars: model strategy and data strategy. Fan notes that while LLMs are in their final 'boss fight,' robotics is just beginning its scaling journey. > *It boils down to two things, model strategy and data strategy.* > *[3, 32]* ## [03:39] Why VLA Falls Short Visual Language Action (VLA) models are criticized for being 'head-heavy' on language while lacking a fundamental grasp of physics and verbs. Fan argues they are better at encoding static knowledge than dynamic physical interaction. > *VLAs are great at encoding knowledge and nouns, but not so much at physics and verbs.* > *[4, 8]* ## [04:32] Video World Models Fan explains how video models like VEO3 learn internal physics—such as gravity and buoyancy—simply by predicting pixels at scale. These models act as simulators that can solve mazes and plan visual sequences internally. > *Physics emerge by predicting the next blob of pixels at scale.* > *[5, 15]* ## [06:09] DreamZero World Action Nvidia introduces 'Dreamer' and World Action Models (WAM), which jointly decode future world states and motor actions. This allows robots to perform zero-shot tasks by 'dreaming' the correct motion sequence before executing it. > *Dreamer jointly decodes the next world states and next actions.* > *[6, 29]* ## [07:46] Scaling Data Collection To overcome the physical limits of teleoperation, Fan discusses Universal Manipulation Interfaces (UMI) and exoskeletons like Dex-UMI. These tools allow humans to collect high-dexterity data directly without the robot being in the loop. > *we're able to break the curse of 24 hours per robot per day* > *[10, 6]* ## [11:06] EgoScale And Scaling Laws Fan introduces Ego-Exo, a policy trained on 21,000 hours of human egocentric video. This research uncovered a neural scaling law for dexterity, showing a mathematical relationship between pre-training volume and robot performance. > *we discovered this neural scaling law for dexterity.* > *[12, 39]* ## [15:39] DreamDojo And The Roadmap Fan outlines the roadmap to 2040, including the Physical Turing Test and 'lights-out' factories. He introduces Dream Dojo, a neural simulator that replaces classical physics engines with data-driven world models. > *I can say with 95% certainty that we'll get to the end of the end game... by 2040.* > *[19, 19]* ## Entities - **Jim Fan** (person): Lead of the embodied autonomous research group at Nvidia. - **Nvidia** (organization): The technology company developing the hardware and software for the robotics end game. - **Jensen Huang** (person): CEO of Nvidia, mentioned for delivering the first DGX-1 to OpenAI. - **OpenAI** (organization): The research lab that received the first DGX-1 for deep learning development. - **DGX-1** (product): The world's first deep learning supercomputer delivered in 2016. - **VEO3** (model): A video world model capable of simulating physics and visual planning. - **Dreamer** (model): A policy model that predicts future world states and actions simultaneously. - **Ego-Exo** (project): A robotics pre-training framework using large-scale human egocentric video data.

#robotics#nvidia#world-models
Andrej Karpathy: From Vibe Coding to Agentic Engineering
29:49
EN/ZH
Watch with Captions
Sequoia Capital27일 전

Andrej Karpathy: From Vibe Coding to Agentic Engineering

Andrej Karpathy explores the paradigm shift from traditional programming to Software 3.0, where LLMs act as programmable computers driven by context. He details the transition from 'vibe coding' to 'agentic engineering,' emphasizing that while AI handles execution, human taste and understanding remain the ultimate bottlenecks. ## [00:00] Introduction Stephanie Zhan introduces Andrej Karpathy, highlighting his foundational work at OpenAI and Tesla. She notes his unique ability to simplify complex AI shifts and introduces the concept of vibe coding. > *He has a rare gift of making the most complex technical shifts feel both accessible and inevitable. [00:22]* ## [00:44] Feeling Behind as a Coder Karpathy describes a turning point in December 2023 when agentic tools began producing perfect code without manual intervention. This shift led him to adopt vibe coding, trusting the AI to handle complex workflows autonomously. > *I just start to notice that with the latest models the chunks just came out fine. [01:29]* ## [02:28] Software 3.0 Explained Karpathy defines Software 3.0 as a paradigm where the LLM acts as a programmable computer and the context window serves as the primary programming lever. This follows Software 1.0's manual rules and Software 2.0's data-driven weight training. > *Software 3.0 is kind of about your programming now turns to prompting and what's in the context window is your lever. [03:20]* ## [03:44] Agents as the Installer Using the installation of OpenClaw as an example, Karpathy explains how agents replace rigid bash scripts with intelligent, environment-aware execution. This approach allows the AI to debug and adapt to specific system requirements autonomously. > *The agent has its own intelligence that it packages up and then it kind of like follows the instructions. [04:29]* ## [04:49] Menu Gen vs Raw Prompts Karpathy contrasts his custom-coded MenuGen app with raw prompts to models like Gemini, concluding that many traditional software layers are now redundant. He emphasizes that AI can now perform general information processing that was previously impossible with structured code. > *The software 3.0 paradigm is a lot more kind of raw. It just your neural network is doing more and more of the work. [06:11]* ## [07:37] What’s Obvious by 2026 Looking toward 2026, Karpathy envisions neural computers that process raw video and audio directly. These systems would use diffusion models to generate dynamic user interfaces, potentially making traditional UI code obsolete. > *You could imagine completely neural computers... a device that takes raw videos or audio into basically what's a neural net. [08:22]* ## [09:41] Verifiability and Jagged Skills AI models develop 'jagged' capabilities, peaking in verifiable domains like math and code due to reinforcement learning rewards. Karpathy notes the paradox where a model can refactor a massive codebase yet fail simple logic. > *state-of-the-art models today will tell you to walk [to a car wash] because it's so close... This is insane. [11:36]* ## [13:39] Founder Advice and Automation Model performance is heavily dictated by the specific data distributions chosen by frontier labs. Karpathy advises founders to explore the 'circuits' of these models to understand their strengths or use fine-tuning to fill gaps. > *we are slightly at the mercy of whatever the labs are doing, whatever they happen to put into the mix. [12:57]* ## [15:46] From Vibe Coding to Agent Engineering While 'vibe coding' raises the accessibility floor, 'agentic engineering' focuses on maintaining professional quality. This discipline involves coordinating powerful but stochastic agents to accelerate development without sacrificing the engineering bar. > *agentic engineering is about preserving the quality bar of what existed before in professional software. [16:07]* ## [25:17] Agents Everywhere and Learning Karpathy advocates for agent-native infrastructure, expressing frustration with human-centric documentation. He argues that while thinking can be outsourced to AI, human understanding remains a critical bottleneck for directing agents. > *You can outsource your thinking, but you can't outsource your understanding. [28:10]* ## Entities - **Andrej Karpathy** (person): AI researcher and former Director of AI at Tesla and founding member of OpenAI. - **Stephanie Zhan** (person): Partner at Sequoia Capital and host of the discussion. - **Software 3.0** (concept): A paradigm where LLMs act as programmable computers via prompting and context. - **Agentic Engineering** (concept): The professional discipline of coordinating AI agents to maintain software quality. - **MenuGen** (project): An app Karpathy built to OCR and visualize restaurant menus, used as a case study. - **OpenAI** (organization): AI research company co-founded by Karpathy. - **Gemini** (ai-model): Google's LLM used in Karpathy's software comparison. - **Vercel** (organization): A cloud platform used by Karpathy to deploy projects.

#vibe-coding#software-3-0#ai-agents
이방카 트럼프: 저는 9살 때 대부분의 사람들이 평생 배우지 못하는 것을 배웠습니다!
1:36:12
EN/ZH
Watch with Captions
The Diary Of A CEO약 2개월 전

이방카 트럼프: 저는 9살 때 대부분의 사람들이 평생 배우지 못하는 것을 배웠습니다!

이방카 트럼프가 유명한 부모와 극심한 미디어의 관심 속에서 형성된 독특한 유년 시절부터 비즈니스와 공직에서의 영향력 있는 경력까지 솔직하게 들려줍니다. 어머니에게 배운 교훈, 신뢰를 쌓는 데 따르는 어려움, 부모의 이혼과 아버지에 대한 암살 시도 같은 결정적 경험이 어떻게 회복력을 키워주었는지 이야기합니다. 또한 의도적으로 사는 철학, 과소평가의 힘, 그리고 모성과 심리 치료를 통한 개인적 성장의 여정을 공유하며, Planet Harvest를 통한 사명 중심의 활동으로 대화를 마무리합니다. ## [00:00] 신뢰가 쉽지 않은 이유와 그것이 드러내는 것 이방카 트럼프는 특히 아홉 살 때 부모의 대대적으로 보도된 이혼을 겪으며, 끊임없는 미디어의 관심과 공격적인 파파라치로 인해 진심 없는 관계를 일찍부터 경계하는 법을 배웠습니다. 어머니는 과소평가당하는 것의 힘과 압박 속에서 외부의 "잡음"을 걸러내는 중요성을 가르쳐주었습니다. 처음에는 타인을 신뢰하지 않는 강력한 방어 기제를 발달시켰지만, 이후 더 깊은 유대를 위해 의식적으로 신뢰하는 태도를 기르며 그에 따르는 위험을 받아들이고 있습니다. > *어머니는 과소평가당하는 것이 나쁜 게 아니라고 가르쳐주셨어요. 사실 매우 강력한 거라고요 [00:22]* > *저는 실제로 스스로에게 더 신뢰하는 법을 가르쳤어요. [05:48]* ## [03:32] 자신이 다르다는 것을 깨달았을 때 벌어지는 일 이방카 트럼프는 끊임없는 미디어의 관심과 대중의 시선으로 인해 어린 시절부터 자신의 삶이 평범하지 않다는 것을 깨달았으며, 이를 오늘날 소셜 미디어로 더욱 증폭된 아이들의 노출과 대비합니다. 부모가 그녀와 형제들을 이 강렬한 대중의 시선으로부터 보호하려 노력했다고 합니다. 그녀는 잦은 인터뷰보다 깊이 있는 대화를 선호합니다. > *항상 미디어의 관심과 감시가 많았던 것 같아요. 그걸 보고, 아주 일찍부터 경험하게 되죠. [06:24]* > *모든 아이들이 그런 건 아니지만, 어디를 가든 사람들이 손에 녹화 장치를 들고 있는 경험을 우리 아이들은 하고 있어요 [06:40]* ## [05:44] 닫힌 문 뒤에서 어머니의 진짜 모습 이방카 트럼프는 어머니 이바나를 전직 국가대표 스키 선수로서 스포츠의 가치를 심어주고 이방카가 발레를 하게 이끈 규율 있는 사람으로 묘사합니다. Michael Jackson이 자신의 호두까기 인형 공연에 참석한 특이한 어린 시절의 기억을 회상합니다. 이런 비범한 경험에도 불구하고 일상은 외할머니 "버비"가 무조건적인 사랑을 베풀고 요리로 사랑을 표현하며 안정감을 주었습니다. > *어머니는 놀라운 스키 선수였어요... 규율을 기르기 위한 스포츠의 중요성을 정말로 믿으셨어요 [07:07]* > *외할머니가... 정말로 우리를 키우셨어요... 무조건적인 사랑과 다정함을 가르쳐주셨어요 [08:44]* ## [11:47] 그녀를 만든 결정적 차이 이방카 트럼프의 성장은 무조건적인 사랑과 매일의 돌봄을 제공한 외할머니 "버비"와 선구적인 롤모델 역할을 한 어머니 이바나 모두에 의해 깊이 형성되었습니다. 이바나는 강인함, 야망, 회복력의 본보기를 보여주며 전문적 목표를 추구하면서도 사랑하는 어머니가 되는 법을 보여주었습니다. 이방카는 바쁜 부모의 커리어에도 불구하고 그들이 곁에 있었고 자신이 최우선이라는 느낌을 주었으며, 외할머니가 전통적인 양육자 역할을 채워주었다고 말합니다. > *어머니는 놀라운 선구자였어요... 강인함과 회복력, 우아함, 결단력, 야망의 놀라운 본보기였어요. [11:57]* > *제가 아버지의 최우선 순위이고, 아버지가 저에게 언제든 함께할 수 있다는 것에 한 번도 의심한 적이 없어요. [14:42]* ## [15:43] 도널드와 이바나 트럼프의 이혼이 그녀에게 의미한 것 도널드와 이바나 트럼프의 대대적으로 보도된 이혼은 이방카가 아홉 살 때 신문에서 알게 되었고, 그녀에게 깊은 영향을 미쳤습니다. 극심한 미디어의 관심에 두려움을 느꼈고 부모의 별거 중 아이로서 겪는 정상적인 공포를 경험했습니다. O.J. Simpson 재판보다 더 많은 헤드라인을 장식한 이 힘든 시기는 형제들과의 독특한 유대를 만들어주었습니다. 어머니가 세상을 떠난 후, 이방카는 공산주의 체코슬로바키아에서 자란 환경이 형성한 이바나의 복잡한 성격을 더 깊이 이해하게 되었고, 어머니가 살아 계실 때 더 많은 질문을 했으면 좋았을 것이라고 말합니다. > *이 이혼은 O.J. Simpson 재판보다 더 많은 헤드라인을 장식했대요. [20:04]* > *저와 형제들에게 좋은 점은 함께 겪고 있었기 때문에 다른 방식으로 정말 유대감이 생겼다는 거예요. [23:21]* ## [18:27] 트럼프의 딸로 산다는 것의 현실과 사람들의 오해 도널드 트럼프의 딸이라는 것은 어린 시절부터, 특히 부모의 이혼 동안 극심한 대중의 시선을 견뎌야 하는 것이었고, 이는 신뢰에 대한 필수적인 경계심을 가르쳐주었습니다. 이후 그녀는 "잡음 속에서 신호를 찾는" 법을 배우고 전투적인 소셜 미디어를 피하며 내면의 평화를 우선시합니다. 이방카는 부모의 깊은 진정성을 언급하며, 자신은 의사소통에서 더 섬세한 접근 방식을 취하지만 스토아 철학의 인도를 받아 진정성 있게 살고 외부 압력에 저항하는 강한 자아의식을 유지한다고 말합니다. > *그 교훈이 없었다면 강인해질 수 있었을지 모르겠어요. 그것은 누구도 믿지 말라고 가르쳐주었어요. [18:53]* > *저는 반격하지 않아요. 왜냐하면... 시간과 집중을 전투적으로 쓰거나 소셜 미디어의 불쾌한 소용돌이에 뛰어드는 것을 믿지 않거든요. [26:19]* ## [23:36] 권력과 명성에 둘러싸인 채 자아를 찾는 법 권력과 명성에 둘러싸인 가운데, 이방카 트럼프는 의도적인 자기 성장과 자신을 "열어젖힌" 모성의 변혁적 경험을 통해 자아를 찾았고, 이는 사랑의 능력을 더 깊게 만들어주었습니다. 그녀는 외부 압력에 저항하고 "군중이 이기지" 않도록 자신을 정의하는 자기 인식의 결정적 중요성을 강조합니다. 이 철학을 육아에 적용하여 자녀의 개성을 키우고 있으며, 자신의 부모가 존중하는 범위 내에서 반대 의견을 허용해준 덕분에 진정한 자아를 지킬 수 있었다고 감사를 표합니다. > *자신이 누구인지 모르면 군중이 이겨요. [29:55]* > *그들은 반대 의견이 괜찮은 환경을 만들어주었어요. [32:44]* ## [30:57] 과소평가가 최대의 무기가 된 이유 이방카 트럼프는 어머니에게서 과소평가당하는 것이 강력한 무기가 될 수 있다는 것을 배웠습니다. 부동산 커리어 초기에 성공한 부모의 자녀이자 남성 중심 업계의 젊은 여성으로서 종종 잘못 평가받았습니다. 그녀는 이 인식을 활용하여 더 열심히 일하고 철저히 준비하는 동기로 삼았고, 궁극적으로 자신을 과소평가한 사람들에게 유리하게 활용했습니다. > *어머니는 과소평가당하는 것이 나쁜 게 아니라고 가르쳐주셨어요. 사실 매우 강력한 거라고요 [00:22]* > *저는 그 두려움, 그 감정을 활용해서 저를 앞으로 나아가게 하는 데 사용했어요. [35:06]* ## [32:59] 채용할 때 실제로 보는 것과 그것이 중요한 이유 채용할 때 이방카 트럼프는 강한 자아의식, 주체성, 좋은 판단력, 그리고 타고난 감각인 "거리의 지혜"를 가진 사람을 우선시합니다. 이런 본질적인 자질은 가르치기 어렵기 때문입니다. 그녀는 신뢰하고 존경하는 "좋은 사람"과 함께 일하는 것의 중요성을 강조하며, 이러한 자질이 성공적인 업무 관계와 전체 팀 역학의 기본이라고 봅니다. > *사람들에게 가르치기 매우 어려워요. 똑똑한 사람이라도 좋은 판단력이 없거나 자기 주도적이지 않으면, 그걸 심어주기 매우 어렵죠. [38:15]* > *좋은 사람이라고 생각하지 않는 사람과 함께 일하고 싶지 않아요. 신뢰하지 않거나 존경하지 않는 사람과 시간을 보내고 싶지 않으니까요. [39:00]* ## [37:49] 패션을 떠나 정부로 향한 이유 Wharton 졸업 후 Anna Wintour로부터 Vogue에서의 명망 있는 직업 제안이 있었음에도 불구하고, 이방카 트럼프는 평생의 열정이었던 부동산을 추구했습니다. 이후 IvankaTrump.com이라는 성공적인 패션 브랜드를 구축하여 연간 약 8억 달러의 매출을 올렸습니다. 그러나 아버지의 행정부에서 일해달라는 요청을 수락하면서 정부 윤리 규정을 준수하기 위해 이 번창하는 사업을 의도적으로 폐업하는 결정을 내렸습니다. 그녀는 이 기회를 막대한 개인적, 직업적 희생에도 불구하고 부정할 수 없는 특권이자 국가에 대한 의무로 보았습니다. > *정부에 들어가면서 사업을 접었을 때 연간 약 8억 달러의 매출을 올리고 있었어요. [42:30]* > *아버지가 우리에게 사랑하는 나라를 위해 봉사할 기회를 준 것에 믿을 수 없을 정도로 감사해요. [43:30]* ## [41:06] 트럼프가 출마를 결심했을 때 실제로 일어난 일 도널드 트럼프의 2015년 대통령 출마 결정은 Bedminster에서의 가족 회의에서 발표되었으며, 1980년대부터 오래되었지만 공개적으로 표명되지 않았던 정치적 야심에도 불구하고 그 신속함에 이방카는 놀랐습니다. 16살 때 아버지가 출마할 것이라는 두려움에 패닉에 빠졌다가 안심시켜 주었던 기억을 회상합니다. 대통령 선거 정치에 뛰어든 것은 가족에게 "급진적인 전환"이었으며, 이방카의 세계관을 뉴욕시의 "버블" 너머로 크게 확장시키고 공직 봉사라는 "특별한 여정"을 시작하게 했습니다. > *한 번 진짜라고 생각한 적이 있어요. 16살이었고 기숙학교에 있었는데 아버지에게 전화해서... '이건 내 인생을 망칠 거야.'라고 했어요. [51:48]* > *아버지의 선거 캠페인이 제게 그걸 열어젖혔고, 제가 있던 버블을 깨달았어요 [48:02]* ## [46:23] 트럼프의 대선 출마가 모든 것을 바꾸다 도널드 트럼프의 대통령 출마 결정은 이방카에게 모든 것을 근본적으로 바꾸었고, 온 가족에게 "급진적인 전환"이었습니다. 전통적인 경력 경로를 우회한 파격적인 정치 진출은 "소방 호스로 물을 마시는 것"과 같았습니다. 선거 캠페인은 이방카가 느꼈던 뉴욕시의 "버블"을 산산조각 내고 세계관을 깊이 확장시켰으며, 국가를 위해 봉사하는 특권을 받아들이게 만들었습니다. > *우리 모두에게 소방 호스로 물을 마시는 것 같았어요. [47:08]* > *아버지의 선거 캠페인이 제게 그걸 열어젖혔고, 제가 있던 버블을 깨달았어요 [48:02]* ## [48:52] Ads 이 부분은 온라인 쇼핑몰 구축, 소셜 미디어 판매, AI 도구를 통한 운영 관리를 간소화하는 전자상거래 플랫폼 Shopify의 광고를 소개합니다. 또한 호스트가 사용하는 지능형 CRM인 Pipe Drive를 소개하며, 판매 프로세스를 한 대시보드에서 시각적으로 보여주는 파이프라인 기능을 강조합니다. > *Shopify는 쉽게 시작할 수 있어요. 스토어를 만들고, 소셜에서 판매하고, 결제를 받고, AI 도구를 사용하고, 모든 것을 한 곳에서 관리할 수 있으니까요. [49:22]* > *Pipe Drive는 사용하기 쉬운 지능형 CRM이에요... 하나의 대시보드로 판매 프로세스를 시각적으로 보여줘요. [50:17]* ## [51:04] 아버지가 정말로 해낼 거라고 생각했을까 도널드 트럼프가 1980년대부터 대통령 출마를 고려했지만, 이방카는 어린 시절 이 야심이 명시적으로 논의된 적은 없었다고 말합니다. 16살 때 아버지가 출마한다고 믿고 패닉에 빠졌다가 안심시켜 주었던 순간을 생생히 기억합니다. 무역 정책 같은 문제에 대한 아버지의 견해는 수십 년간 변하지 않았다고 합니다. > *한 번 진짜라고 생각한 적이 있어요. 16살이었고 기숙학교에 있었는데 아버지에게 전화해서... '이건 내 인생을 망칠 거야.'라고 했어요. [51:48]* > *무역 정책에 대한 아버지의 관점은 시간이 지나도 변함없이 일관되었고 오늘날까지 그대로예요 [52:35]* ## [54:26] 백악관을 떠나는 것은 안도였을까, 아니면 다른 무엇이었을까 백악관을 떠나는 것은 후회의 의미에서의 안도는 아니었습니다. 이방카 트럼프는 "경기장에 모든 것을 쏟았다"고 느끼며 4년간의 공직 봉사에서의 성과에 자부심을 가지고 있습니다. 봉사의 기회를 "놀라운 특권"으로 여기지만 정치로 돌아갈 의향은 없으며, 자녀를 최우선으로 생각하고 더 이상의 공적 생활의 대가를 아이들이 치르게 하고 싶지 않습니다. 자신의 기여에 만족하며 아버지에게는 이제 지지해줄 훌륭한 팀이 있다고 봅니다. > *경기장에 모든 것을 쏟았어요. 돌아보면서... 후회는 없어요. [53:33]* > *저의 첫 번째 책임은 아이들의 엄마가 되는 것이에요. [56:49]* ## [58:08] 백악관 생활에 진정으로 준비된 사람이 있었을까 이방카 트럼프는 고위 정치와 백악관 생활의 강렬한 경험에 진정으로 준비시켜주는 것은 아무것도 없다고 인정합니다. 부와 마찬가지로 권력은 사람들의 본질적인 특성을 증폭시키는 경향이 있다고 관찰했습니다. 군주부터 선출된 지도자까지 세계 지도자들과의 교류를 통해 그들의 신비가 벗겨졌고, 그들의 핵심은 평범한 고민을 가진 "그냥 사람"이라는 것을 깨달으며 느꼈던 위압감이 사라졌습니다. > *그 경험을 위해 준비시켜주는 것은 아무것도 없어요. [58:26]* > *결국 사람은 사람이라는 걸 깨닫게 되죠. [59:03]* ## [59:44] 암살 시도가 영원히 바꿔놓은 것 2024년 7월 아버지에 대한 암살 시도는 이방카 트럼프의 삶을 근본적으로 바꿔놓았고, 보안 우려를 강화시켜 미국 비밀경호국의 보호가 필요하게 되었습니다. 아이들과 함께 실시간으로 사건을 목격하며 첫 반응은 아이들을 돌려세우는 것이었지만, 아버지가 괜찮을 것이라는 직감이 있었습니다. 이 충격적인 경험과 다른 가족의 건강 위기는 삶의 소중함에 대한 믿음을 강화시켰고, 공직과 폭력의 우려스러운 상관관계에도 불구하고 긍정을 선택하고 매 순간을 소중히 여기기로 한 결심을 굳혔습니다. > *제 첫 반응은 아이들을 돌려세우는 것이었어요. [62:02]* > *인생에서 어떻게 반응할지에만 선택권이 있어요. 저는 긍정적인 결과를 보기로 해요. [66:05]* ## [1:07:20] 정치에서 물러난 후의 삶 2022년 정치에서 물러난 후, 이방카 트럼프의 삶은 이제 어린 자녀들과 가정생활을 최우선으로 합니다. 정치의 "어두운 세계"가 자신의 본성과 맞지 않았기 때문입니다. 대중의 비판을 "독수리와 까마귀" 비유를 사용해 헤쳐나가며, 싸우기보다 부정적인 것 위로 날아오르기를 택합니다. 아버지의 거의 죽을 뻔한 경험을 포함한 극심한 공적 시선의 시기는 개인적 성장의 "약"이 되었고, 통제할 수 있는 범위 안에서 내면의 평화와 조화를 찾고 삶의 축복에 감사하는 데 집중하도록 가르쳐주었습니다. > *정치는 꽤 어두운 세계예요. 어둠이 많고, 부정적인 것이 많고, 인간으로서 좋다고 느끼는 것과 정말 맞지 않아요. [67:45]* > *독수리의 반응은... 비틀거나 돌려서 까마귀를 떨어뜨리거나 방어하는 게 아니에요... 그냥 더 높이 나는 거예요. [69:28]* ## [1:11:04] Ads 이 챕터는 팟캐스트 내의 짧은 광고 시간입니다. ## [1:14:24] 심리 치료가 모든 것을 보는 방식을 바꾸다 이방카 트럼프는 "성장 지향적 사고방식"과 중요한 삶의 사건들을 처리하려는 욕구에서 비롯되어 성인 심리 치료를 시작했으며, 이를 "내면의 재고 조사" 도구로 봅니다. 주요 계기에는 남편 Jared의 두 번째 갑상선암 진단, 워싱턴에서의 퇴임, 그리고 어머니의 갑작스러운 타계가 포함됩니다. 치료는 감정을 구획화하기보다 자신을 돌보고 감정을 처리하는 데 도움을 주었으며, 궁극적으로 자기 이해와 앞으로 나아가는 것에 대한 관점을 바꾸었습니다. > *저는 매우 성장 지향적인 사고방식을 가지고 있어요... 항상 자신과 세상에 대해 배우려고 해요 [74:35]* > *Jared가 두 번째로 갑상선암 진단을 받았어요. 그리고... 어머니가 돌아가셨어요 [75:59]* ## [1:20:28] 어머니의 상실이 가르쳐준 것 이방카 트럼프는 2022년 어머니 이바나 트럼프의 갑작스럽고 비극적인 죽음을 회상하며, 예기치 않은 부모의 상실이 주는 독특한 충격을 이야기합니다. 그녀는 불편함에 직면하고 감정을 처리하며 제대로 된 애도 과정을 거치기로 결심했습니다. 부모로서 이제 자녀들에게 어머니의 긍정적인 면을 보여주면서 어머니의 어려움을 전하지 않도록 의식적으로 노력하며, 어머니의 삶에 대해 더 명확한 어른의 시각을 갖게 되었습니다. > *그래도 좋은 삶을 사셨어요. [81:07]* > *그녀를 완전히 우상화하던 아이의 눈이 아니라, 명확하게 보는 어른의 눈으로 어머니를 생각하는 시간을 정말 가졌어요. [83:15]* ## [1:26:28] 성공과 행복을 정의하는 3가지 원칙 이방카 트럼프는 진정한 성공과 행복이 세 가지 핵심 원칙으로 정의된다고 믿으며, 특히 기업가 정신에 있어 딸 Arabella에게 전하고 싶은 것이라고 합니다. 첫째, 하는 일을 진정으로 사랑해야 합니다. 열정이 헌신의 필수 조건이기 때문입니다. 둘째, 진정성이 가장 중요합니다. 자기 자신이 되어 자신만의 길을 개척하는 것이 핵심이며, 모방은 패배로 이어집니다. 셋째, 가장 근본적으로, 세상이 믿기 전에 자신을 먼저 믿어야 합니다. 이것이 모든 성취의 출발점이기 때문입니다. 또한 전통적인 "일과 삶의 균형"은 잡기 어려우며, 대신 우선순위와의 조화를 추구한다고 말합니다. > *정상에 있으면서 자기가 하는 일을 정말로 사랑하지 않는 사람을 본 적이 없어요. [92:46]* > *세상이 당신을 믿기 전에 자기 자신을 먼저 믿어야 해요. [94:48]* ## [1:28:37] Planet Harvest란 무엇이며 왜 생각보다 중요한가 Planet Harvest는 음식물 쓰레기를 줄이고 미국 농부를 지원하는 것을 목표로 한 이방카 트럼프의 사명 중심 사업입니다. 이 사업은 코로나19 팬데믹 동안 공급망 문제로 대량의 부패하기 쉬운 농산물이 버려지는 것을 목격하면서 영감을 받았습니다. Planet Harvest는 엄격한 외관 기준을 충족하지 못한다는 이유로 소매업체에 의해 거부되는 완벽하게 좋은 식품의 지속적인 문제를 해결하여 농부들에게 추가 수입을 제공하고 환경에도 이롭습니다. > *Planet Harvest는... 팬데믹 초기에 보았듯이 사람들이 식품을 필요로 할 때 밭의 음식이 갈아엎어져 낭비되지 않도록 하는 데서 탄생했어요. [89:18]* > *매년 4억 파운드의 딸기가 밭에 버려져요... 불완전해서가 아니에요. 정말 엄격한 외관 규격에 맞지 않을 뿐이에요. [90:57]* ## 등장인물·개념 - **Ivanka Trump** (인물): 도널드와 이바나 트럼프의 딸, 사업가이자 전 정부 관료. - **The Diary Of A CEO** (단체): 인터뷰를 진행한 팟캐스트. - **Donald Trump** (인물): 이방카 트럼프의 아버지, 전 미국 대통령. - **Ivana Trump** (인물): 이방카 트럼프의 어머니, 전 체코슬로바키아 스키 선수. - **Michael Jackson** (인물): 미국의 유명 가수, 작곡가, 댄서. - **O.J. Simpson** (인물): 전 미국 풋볼 선수, 방송인, 배우, 유죄 판결 범죄자. - **Marcus Aurelius** (인물): 로마 황제이자 스토아 철학자. - **Shopify** (단체): 온라인 쇼핑몰 구축을 위한 전자상거래 플랫폼. - **Pipe Drive** (단체): 지능형 CRM(고객 관계 관리) 소프트웨어. - **Anna Wintour** (인물): Vogue 편집장. - **Vogue** (단체): 패션 및 라이프스타일 잡지. - **Wharton School of Business** (단체): 펜실베이니아 대학교 경영대학원. - **Office of Government Ethics** (단체): 이해 충돌 방지를 담당하는 미국 정부 기관. - **Jared Kushner** (인물): 이방카 트럼프의 남편, 역시 정부에서 근무함. - **US Secret Service** (단체): 이방카 트럼프와 그 가족의 보호를 담당하는 정부 기관. - **Planet Harvest** (단체): 이방카 트럼프가 공동 창립한 음식물 쓰레기 감소 및 농부 지원 사업. - **Arabella** (인물): 이방카 트럼프의 장녀. - **Stoicism** (철학): 고대 그리스의 스토아 철학. - **Buddhism** (철학): 동양 철학. - **Daoism** (철학): 동양 철학. - **Czechoslovakia** (장소): 중앙유럽의 구 국가. - **New York City** (장소): 미국의 주요 도시. - **Bedminster, New Jersey** (장소): 이방카 트럼프가 아버지에 대한 암살 시도 소식을 들은 장소. - **Child Tax Credit** (정책): 자녀가 있는 가정을 위한 미국 세액공제. - **Great American Outdoors Act** (정책): 이방카 트럼프가 지지한 법안. - **Human Trafficking Legislation** (정책): 이방카 트럼프가 공직 재직 중 추진한 법안. - **Vocational Education and Skills Training** (정책): 이방카 트럼프가 미국 근로자의 직업 교육 및 재교육을 위해 추진한 프로그램. - **Meditations** (서적): Marcus Aurelius의 개인적 저술.

#ivanka-trump#family#childhood
The Explore → Plan → Code → Commit workflow in Claude Code
3:11
EN/ZH
Watch with Captions
ClaudeClaude Code 101약 2개월 전

The Explore → Plan → Code → Commit workflow in Claude Code

Anthropic's three-minute walkthrough of the loop they consider the single most important habit when working with Claude Code: research first in plan mode, define what "done" looks like before any file is touched, then have a subagent review the diff before you push. ## [00:03] Why explore-plan-code-commit beats jumping straight in The opening pitch is blunt — if you only adopt one habit from the course, make it this workflow. The failure mode it's fighting is the reflex of pasting a task into Claude and watching it generate code immediately, which front-loads speed but back-loads correction cost. > *Without this, most people jump straight to pasting in Claude to write code, which means more course correcting later on.* ## [00:21] Plan mode: read-only research before any edits Plan mode is how you collapse explore and plan into a single move. Claude can read files and run web searches but is forbidden from writing — Shift+Tab cycles into it from the prompt. The narrator demos with a real ask (add WebP conversion to an image upload pipeline, figure out where it belongs, what dependencies are needed, how to approach it). Claude returns a plan; you read it, ask for revisions if it misses something. This is the cheapest place in the whole cycle to change direction, because nothing has been written yet. > *With plan mode, Claude can't edit files. It just reads files to gather research on how to tackle this implementation.* ## [01:11] Approve the plan, then course-correct as Claude codes Once the plan looks right, Approve hands execution back to Claude to tick through the checklist. You choose whether file edits auto-accept or prompt every time. Claude will troubleshoot on its own, but expect to intervene — and the reason plan mode pays off here is that the agent now carries the research context that produced the plan, so mid-flight corrections land in the right place instead of starting from scratch. > *This is the benefit of working with plan mode because after the plan is finished, we also have the context of how it got to the results to help it guide its next decision.* ## [01:39] Make success criteria explicit and give Claude real tools A plan without a definition of "correct" leaves Claude guessing. Spell out what success looks like, then equip the agent to actually verify it: the Claude+Chrome extension lets it drive a browser tab to test a UI it just built; a test suite gives it something to validate against on every loop, and Claude can author the tests too — but only if you've already vetted them as ground truth. A quick durability tip: when Claude keeps re-hitting the same problem, have it persist the fix into the CLAUDE.md file so it stops relearning. > *In order for Claude to be confident in its results, it has to be clear on what it deems correct.* ## [02:24] Subagent review, commit, recap Before pushing, spin up a subagent code reviewer over the diff — a second pass with no attachment to the implementation. Then have Claude draft the commit message in your style and ship it. The recap reframes each step: Explore feeds context, Plan defines success, Code is the back-and-forth that converges on the plan, Commit reviews and pushes so you can move on. > *A tip before you commit, run a sub agent code reviewer to look at your code.* ## Entities - **Anthropic Tutorial Narrator** (Person): Anthropic's official voice-over for the Claude Code 101 course. - **Claude Code** (Software): Agentic terminal coding tool whose recommended day-to-day loop is the subject of this episode. - **Plan mode** (Feature): Read-only mode toggled with Shift+Tab — Claude researches and proposes a plan but cannot edit files. - **Claude + Chrome extension** (Software): Lets Claude Code drive a Chrome tab to verify UI changes before declaring a task done. - **CLAUDE.md** (File): Project memory file used here as a persistence target for recurring fixes Claude keeps relearning. - **Subagent code reviewer** (Pattern): Pre-commit Claude subagent that reviews the diff before the human pushes.

#claude-code#plan-mode#agentic-coding
Context Management in Claude Code
3:51
EN/ZH
Watch with Captions
ClaudeClaude Code 101약 2개월 전

Context Management in Claude Code

Anthropic's Claude Code 101 walkthrough on context — what fills the window, when auto-compaction kicks in, and the practical levers (/compact, /clear, /context, claude.md, MCP toggles, skills, sub agents) for keeping a session lean enough to keep working. ## [00:03] Why context is finite — and why it matters Context is Claude's working memory: every prompt, every file read, every tool call result lands in the same window. The window is large but finite, so optimizing what goes in is non-negotiable once you start running multi-step sessions. > *Every file it reads, every command it runs, every message you send, it all takes up space in the context window.* ## [00:39] Auto-compaction and the /compact command As you near the limit, Claude Code auto-compacts: it summarizes the important bits and drops noisy tool-call results to free space. You can also trigger `/compact` manually — useful when you want headroom but still want to remember what you've been working on. Tradeoff: compaction can lose detail from earlier turns. > *Compaction will summarize important details and remove the unnecessary tool call results and free up a lot of space in your context window.* ## [01:11] /clear and /context: starting over, seeing what's used If you want a true reset with no memory of the prior session, `/clear` wipes everything. To see where your space is actually going, `/context` shows total size, the categories eating the most, and a graphic of the breakdown — the diagnostic before you decide between compact and clear. > *To check the state of your context, run the /context command.* ## [01:35] The rule of thumb: compact mid-feature, clear between features The narrator gives a clean heuristic: still working on one feature and bumping the ceiling? Compact — you want the relevant history to carry over. Done with the plan, moving to something new? Clear — old conversation will bias the new work. > *If you have finished the plan and want to start on a new feature, then clear. You don't want the previous conversation to present bias in anything new that you want to create.* ## [01:57] claude.md, prompt specificity, and writing less by writing more Anything Claude should remember across sessions belongs in `claude.md` so it doesn't rediscover the same facts every time. And counterintuitively, terse prompts cost more context: when the ask is vague, Claude grep-walks the codebase and reasons more, all of which fills the window. A sentence or two of specificity buys back a lot of space downstream. > *The irony behind writing a smaller prompt is that it in the long run, it will take up more context.* ## [02:26] MCP servers, skills, and sub agents as context tools MCP servers load every tool they expose into context by default — fine if relevant, expensive if not, so turn off the ones unrelated to the project. Skills behave like MCP servers but don't dump the whole surface into context. Sub agents run in parallel with their own separate window, so for fact-finding tasks ("where are the auth endpoints?") you can dispatch a sub agent and get back just the answer instead of the whole journey. > *Sub agents run in parallel with your main agent but has a complete separate context window.* ## [03:06] Recap Managing context in Claude Code is the difference between a long productive session and a stalled one. Use `/compact` to summarize long sessions, `/clear` to start fresh, be specific in prompts, check `/context` to see what's eating the window, and delegate answer-only work to sub agents. > *Managing context within cloud code is crucial. Use slash compact to summarize long sessions and slashclear to start fresh.* ## Entities - **Anthropic Tutorial Narrator** (Person): Anthropic's official voice-over for the Claude Code 101 tutorial series. - **Claude Code** (Software): Anthropic's agentic terminal coding assistant whose context window is the subject of this episode. - **Context window** (Concept): Claude's working memory — finite, filled by prompts, file reads, and tool-call results. - **/compact** (Command): Slash command (and auto-trigger) that summarizes history and drops tool-call noise to free space. - **/clear** (Command): Slash command that wipes the session entirely for a clean start on new work. - **/context** (Command): Slash command that reports total context size and which categories are consuming it. - **claude.md** (File): Project-level memory file Claude reads across sessions so it doesn't rediscover the same facts. - **MCP servers** (Software): Tool providers that load all exposed tools into context by default — toggle off when unrelated. - **Skills** (Feature): Lighter-weight alternative to MCP servers that avoids loading the whole tool surface into context. - **Sub agents** (Feature): Parallel agents with their own context windows used to answer scoped questions without polluting the main window.

#claude-code#context-window#compact
AI는 아직 수학자를 대체하지 않는다 – Terence Tao
4:12
EN/ZH
Watch with Captions
Dwarkesh Patel약 2개월 전

AI는 아직 수학자를 대체하지 않는다 – Terence Tao

Terence Tao는 수학에서 AI가 맡게 될 진화하는 역할을 논하면서, AI가 많은 정형 업무를 자동화하겠지만 인간 수학자를 완전히 대체하지는 않고 오히려 그들이 새로운 영역에 집중하도록 만든다고 주장한다. 그는 인간과 AI의 협업이 열어갈 미래, 그리고 AI가 과학적 발견에 미칠 장기적 영향의 예측 불가능성을 강조한다. ## [00:10] 프런티어 수학에서 AI의 현재 역할 Terence Tao는 AI가 이미 인간은 할 수 없는 '프런티어 수학'을 수행하고 있지만, 그 프런티어는 우리가 익숙했던 것과는 다른 종류라고 설명한다. 그는 이를 과거에 계산기가 인간의 능력을 뛰어넘는 작업을 전문화된 방식으로 처리하며 수학의 가능성을 확장했던 방식에 비유한다. > *어떤 면에서 그것들은 이미 인간이 할 수 없는 초지능적인 프런티어 수학을 수행하고 있지만, 우리가 익숙한 프런티어와는 다른 종류의 프런티어입니다.* ## [00:52] AI는 대체가 아닌 자동화 도구 Tao는 10년 안에 AI가 현재 수학자들이 수행하는 많은 정형 업무를 대신 처리하면서, 인간은 더 복잡하고 중요한 문제에 집중할 수 있게 될 것이라고 전망한다. 그는 과거에 컴퓨터가 '인간 계산수'의 업무를 자동화했거나, 유전체 분석이 자동화된 뒤에도 유전학이라는 학문이 새로운 규모로 계속 진화한 역사적 전환을 예로 든다. > *10년 안에 지금 수학자들이 하는 많은 일들이… AI에 의해 수행될 수 있을 것입니다. 하지만 그것이 우리 작업에서 가장 중요한 부분은 아니었다는 것을 우리는 알게 될 것입니다.* ## [02:46] 수학에서의 인간-AI 협업의 미래 Dwarkesh Patel은 AI가 밀레니엄 난제를 자율적으로 풀 수 있는지 묻는다. Terence Tao는 '인간+AI 하이브리드'가 앞으로도 오랫동안 수학을 지배할 것이라고 본다. 현재의 AI는 지적 작업을 완전히 대체할 모든 요소를 갖추지 못했기에 보완적 도구로 기능한다는 설명이다. > *인간과 AI의 하이브리드가 앞으로도 오랫동안 수학을 지배할 것이라고 저는 믿습니다.* ## [03:43] 과학적 발견에 미칠 예측 불가능한 영향 Tao는 AI가 과학과 새로운 발견을 가속화하는 동시에, '우연성을 파괴함'으로써 특정 유형의 진보를 저해할 가능성도 있음을 인정한다. 그는 AI가 과학적 발견에 미칠 미래의 영향은 매우 예측 불가능하다고 결론짓는다. > *AI가 어떤 식으로든 우연성을 파괴함으로써 실제로 특정 유형의 진보를 저해할 가능성도 있습니다.* ## 등장인물·개념 - **Terence Tao (테렌스 타오)** (인물): 게스트이자 당대를 대표하는 수학자. - **Dwarkesh Patel** (인물): 해당 팟캐스트의 호스트. - **AI** (개념): 인공지능. 수학과 과학적 발견에서의 역할을 논의함. - **Mathematica / Wolfram Alpha** (소프트웨어): 수학 자동화의 예시로 언급된 계산 도구. - **밀레니엄 난제 (Millennium Prize Problems)** (개념): 수학의 7대 미해결 난제. 각 문제에 100만 달러의 상금이 걸려 있음.

#ai#mathematics#terence-tao
서브에이전트를 효과적으로 활용하기
4:44
EN/ZH
Watch with Captions
ClaudeClaude Code subagents2개월 전

서브에이전트를 효과적으로 활용하기

서브에이전트는 중간 작업이 메인 스레드에 속하지 않을 때 강력한 도구가 됩니다. 하지만 무분별하게 위임하면 오히려 상황이 나빠집니다. 이 튜토리얼은 유용한 위임(리서치, 코드 리뷰, 도메인별 시스템 프롬프트)과 컨텍스트를 소모하고 꼭 필요한 정보를 잃게 만드는 안티패턴(전문가 페르소나, 순차 파이프라인, 테스트 러너) 사이의 선을 명확히 그어줍니다. ## [00:03] 도입: 서브에이전트가 도움이 될 때와 역효과가 날 때 시리즈에서는 지금까지 서브에이전트를 만들고 설계하는 법을 다뤘습니다. 마지막 편은 배포 관점의 질문으로 넘어갑니다. 어떤 작업이 별도 에이전트를 띄울 때 진짜 이득이 되고, 어떤 작업이 오히려 손해를 보는가? 답은 하나의 검증으로 귀결됩니다. 중간 작업이 메인 스레드에 중요한가? 탐색과 실행이 분리되어 있을 때 서브에이전트는 값어치를 합니다. 각 단계가 이전 단계의 발견에 의존할 때는 인계 비용이 꼭 필요한 세부 내용을 앗아갑니다. > *"간단히 말해, 중간 작업이 메인 스레드에 중요한지 여부가 핵심 차이입니다."* ## [00:32] 리서치 작업: 탐색을 격리된 상태로 유지하기 인증 추적은 구체적인 예시입니다. 메인 스레드가 알아야 할 것은 JWT 검증이 어디서 일어나는가 — 중간에 읽은 수십 개의 파일이 아닙니다. 리서치 서브에이전트는 코드베이스 전체를 스캔하고, 파일을 넘나들며 함수 호출을 추적해 정확한 답 하나를 돌려줄 수 있습니다. JWT 검증은 middleware/auth.js의 42번째 줄에 있고, route/api.js에서 호출됩니다. 그 모든 탐색은 서브에이전트의 컨텍스트 안에 고스란히 남습니다. 메인 스레드는 결론만 받고, 검색 기록이 컨텍스트 창을 어지럽히지 않은 채 앞으로 나아갑니다. > *"메인 스레드는 이렇게 받습니다: JWT 검증은 middleware/auth.js의 42번째 줄에 있고, Express 라우터와 route/api.js에서 호출된다 — 뭐 이런 식으로."* ## [01:15] 코드 리뷰 서브에이전트: 새로운 시각으로 피드백 받기 Claude가 스스로 작성에 참여한 코드를 리뷰하면 편향이 생깁니다. 모든 결정 과정에 있었기 때문에 외부 시각에서 무엇이 이상해 보이는지 쉽게 포착하지 못합니다. 리뷰어 서브에이전트는 이를 완전히 우회합니다. 코드가 어떻게 발전해왔는지에 대한 이력 없이, diff와 수정된 파일만 봅니다. 이 깨끗한 출발점은 두 번째 이점도 만들어냅니다. 프로젝트 고유의 리뷰 기준 — 명명 규칙, 보안 패턴, 아키텍처 규칙 — 을 서브에이전트의 시스템 프롬프트에 한 번 새겨두면 매번 메인 스레드가 기억에 의존하지 않고도 일관되게 적용됩니다. > *"리뷰어 서브에이전트는 별도 컨텍스트에서 변경 사항을 봅니다. git diff를 실행하고 수정된 파일을 읽은 뒤, 코드가 작성된 이력 없이 전문화된 리뷰 기준을 적용합니다."* ## [01:59] 커스텀 시스템 프롬프트: 카피라이팅과 스타일링 Claude Code의 기본 프롬프트는 간결하고 기술적인 출력에 최적화되어 있습니다. 랜딩 페이지나 마케팅 이메일에는 정반대가 필요합니다. 카피라이팅 서브에이전트는 톤, 대상 독자, 구조에 대해 완전히 다른 지침을 받아 메인 스레드의 기본값으로는 절대 나오지 않을 결과물을 만들어냅니다. CSS에도 같은 논리가 적용됩니다. 디자인 시스템 파일을 언급하는 스타일링 서브에이전트는 한 줄을 쓰기 전에 컬러 변수, 간격 규칙, 컴포넌트 패턴을 자동으로 컨텍스트에 불러옵니다. 모든 스타일 결정이 합리적 추측이 아닌 실제 시스템을 반영하도록 보장합니다. > *"Claude Code의 기본 프롬프트는 간결하고 기술적인 글쓰기 쪽으로 치우쳐 있어서, 랜딩 페이지나 이메일 캠페인에는 어울리지 않습니다 — 고객을 잠들게 하고 싶지 않다면요."* ## [02:57] 안티패턴: 전문가 주장, 파이프라인, 테스트 러너 세 가지 패턴이 반복적으로 상황을 악화시킵니다. 첫째, 페르소나 프롬프트 — "당신은 Python 전문가입니다" 또는 "당신은 Kubernetes 전문가입니다" — 는 아무것도 더하지 않습니다. Claude는 이미 그 지식을 갖고 있기 때문입니다. 전문가 레이블을 붙이기 위해 서브에이전트를 띄우는 것은 메인 스레드가 할 수 있는 일을 위해 격리 비용만 낭비하는 셈입니다. 둘째, 순차 파이프라인은 단계들이 진정으로 독립적이지 않을 때마다 무너집니다. 세 에이전트 흐름 — 버그 재현, 디버그, 수정 — 은 깔끔해 보이지만 실제로는 실패합니다. 디버그 에이전트에게는 재현 에이전트의 라이브 컨텍스트가 필요하지, 압축된 요약이 아닙니다. 셋째, 테스트 러너 서브에이전트는 정보를 능동적으로 숨깁니다. 테스트가 실패하면 무엇이 잘못됐는지 파악하려면 날것의 출력이 필요합니다. "테스트 실패"만 돌려주는 서브에이전트는 직접 출력에서 바로 보였을 세부 정보를 얻기 위해 추가 디버그 스크립트를 강요합니다. > *"'테스트 실패'만 반환하는 서브에이전트는 직접 출력에서 바로 보였을 세부 정보를 얻기 위해 추가 디버그 스크립트를 만들게 합니다."* ## [04:10] 시리즈 정리와 핵심 판단 기준 시리즈 전반에 걸쳐: 서브에이전트는 요약을 돌려주는 격리된 스레드이며, /agents로 만들고, 구조화된 출력과 구체적인 설명으로 설계합니다. 리서치, 코드 리뷰, 커스텀 시스템 프롬프트가 필요한 작업에 활용하세요. 전문가 페르소나, 다단계 의존 파이프라인, 테스트 실행에는 쓰지 마세요. 모든 판단 틀은 한 가지 질문으로 수렴합니다. 중간 작업이 중요한가? 답이 아니라면 위임하세요. > *"핵심 질문: 중간 작업이 중요한가? 그렇지 않다면 위임하세요."* ## 등장 인물 - **Anthropic Tutorial Narrator** (인물): Claude Code 서브에이전트 튜토리얼 시리즈 진행자, Anthropic - **Claude Code** (소프트웨어): Anthropic의 AI 코딩 어시스턴트; 서브에이전트가 만들어지고 조율되는 환경 - **Subagent** (개념): 메인 컨텍스트에서 실행되는 격리된 Claude 스레드. 전체 작업 컨텍스트를 노출하는 대신 압축된 요약을 반환함 - **JWT (JSON Web Token)** (개념): 코드베이스 전반의 인증 로직을 추적하는 리서치 서브에이전트의 실습 예시로 사용됨 - **System prompt** (개념): Claude Code의 기본 프롬프트와 다른 도메인 특화 동작을 가능하게 하는 서브에이전트별 지침 세트 - **Anthropic** (조직): Claude 및 Claude Code 서브에이전트 튜토리얼 시리즈 개발사

#claude-code#subagents#ai-agents
서브에이전트 만들기
3:45
EN/ZH
Watch with Captions
ClaudeClaude Code subagents2개월 전

서브에이전트 만들기

Claude Code에는 기본 내장 서브에이전트가 있지만, 커스텀 서브에이전트를 만들면 특정 작업에 맞는 전문화된 동작을 직접 설정할 수 있습니다. 이 튜토리얼은 코드 리뷰 서브에이전트를 처음부터 만드는 과정을 다룹니다. `/agents` 명령어, 도구 선택, 모델 결정, 그리고 Claude가 언제 어떻게 위임하는지 제어하는 설정 파일의 필드까지 차례로 살펴봅니다. ## [00:03] 커스텀 서브에이전트란 무엇인가 Claude Code에는 내장 서브에이전트가 포함되어 있지만, 특정 작업을 전담하는 서브에이전트를 직접 만들 수도 있습니다. 커스텀 서브에이전트는 YAML front matter가 있는 마크다운 파일입니다. front matter는 Claude에게 해당 에이전트로 라우팅할 시점과 에이전트가 가진 기능을 알려주고, 마크다운 본문은 서브에이전트가 실행되는 시스템 프롬프트가 됩니다. > *"Custom sub aents are markdown files with YAML front matter. These markdown files contain configuration that helps claude understand when to use the sub aent and provides directions to the sub aent itself."* ## [00:28] /agents로 서브에이전트 만들기 `/agents` 명령어를 실행하면 에이전트 관리 패널이 열립니다. "새 에이전트 만들기"를 선택하면 두 가지를 묻습니다. 범위(현재 프로젝트 또는 머신의 모든 프로젝트에서 공유)와 생성 방법입니다. 권장 방법은 Claude가 자동으로 에이전트를 생성하도록 맡기는 것입니다. 내레이터가 코드 품질과 보안 문제를 검토하는 서브에이전트를 평범한 말로 요청하면 Claude가 나머지를 처리합니다. > *"Now, the easiest way to create a sub agent is with the / agents command. Next, you can create a sub agent manually, but we recommend using claw code to automatically generate it for you."* ## [00:56] 도구, 모델, 색상 설정하기 Claude가 파일을 작성하기 전에 서브에이전트가 접근할 수 있는 도구를 선택합니다. 코드 리뷰 에이전트는 편집 도구가 꼭 필요하지 않지만, 실행을 활성화해 두면 대기 중인 변경 사항을 더 쉽게 확인할 수 있습니다. 도구 선택 후 모델을 고릅니다. 속도 우선이면 haiku, 깊이 있는 분석은 opus, 그 중간은 sonnet입니다. 마지막으로 색상을 선택합니다. UI에서 서브에이전트를 한눈에 알아볼 수 있게 해주는 색상입니다. > *"Now, given that our sub agent is only responsible for reviewing code, you might decide to disallow tools for editing, but I'll leave an execution to allow the sub agent to more easily identify pending changes."* ## [01:43] 설정 파일 이해하기 생성된 파일은 요약 창에 표시된 경로의 프로젝트 내에 저장됩니다. 핵심 필드는 네 가지입니다. `name`은 고유 식별자로, 메시지에 `@agent-code-quality-reviewer`를 입력해 참조할 수 있습니다. `description`은 Claude가 읽고 위임 여부를 결정하는 내용으로, 한 줄로 작성해야 합니다(이스케이프된 `\n`은 그대로 literal 문자입니다). description에 "proactively"를 추가하면 Claude가 에이전트를 더 자주 사용하고, 예시 대화를 추가하면 라우팅이 더 정확해집니다. `tools`는 생성 시 부여된 접근 권한을 반영하지만 파일에서 직접 편집할 수 있습니다. > *"If you want Claude to use the sub agent automatically more often, add in the word proactively to the description."* ## [02:41] 시스템 프롬프트와 Claude의 활용 방식 `model` 필드는 `haiku`, `sonnet`, `opus`, `inherit` 중 하나를 받습니다. `inherit`는 서브에이전트를 상위 대화와 같은 모델로 실행합니다. front matter 아래의 모든 내용이 시스템 프롬프트입니다. 서브에이전트가 작업을 수행하는 방법과 결과를 메인 에이전트에게 돌려주는 방법을 안내합니다. > *"The system prompt will provide guidance to the sub agent, helping it understand how to complete its task and how it should return information back to the main agent."* ## [03:15] 서브에이전트 테스트하기 설정을 저장한 뒤 코드를 수정하고 Claude에게 검토를 요청합니다. 서브에이전트가 예상대로 트리거되지 않으면 `description` 필드부터 조정하세요. 더 구체적인 예시를 추가하면 Claude가 언제 위임해야 할지를 더 정확하게 파악합니다. > *"If the sub agent isn't being used when you expect, check your description. Adding more specific examples helps Claude understand when to delegate."* ## 등장인물 - **Anthropic Tutorial Narrator** (사람): 이 에피소드의 단독 진행자; Anthropic 공식 YouTube 채널에서 Claude Code 서브에이전트 튜토리얼 시리즈를 진행함 - **Claude Code** (소프트웨어): Anthropic의 AI 코딩 어시스턴트; 내장 서브에이전트와 사용자가 만든 커스텀 서브에이전트를 모두 지원 - **커스텀 서브에이전트** (개념): YAML front matter가 있는 마크다운 파일로, Claude Code가 특정 작업을 전문화된 에이전트 인스턴스에 위임하도록 설정 - **/agents command** (개념): 서브에이전트를 만들고 관리하는 Claude Code UI 진입점; 프로젝트 범위 또는 전역 범위 제공 - **시스템 프롬프트** (개념): 서브에이전트 설정 파일의 마크다운 본문; 런타임에 서브에이전트에게 작업 지침과 출력 형식 안내를 제공 - **Anthropic** (조직): Claude 및 Claude Code 플랫폼의 개발사

#claude-code#subagents#ai-agents
효과적인 서브에이전트 설계하기
3:42
EN/ZH
Watch with Captions
ClaudeClaude Code subagents2개월 전

효과적인 서브에이전트 설계하기

Anthropic의 Claude Code 시리즈 튜토리얼로, 신뢰할 수 있는 서브에이전트와 방향을 잃거나 멈추거나 건드려서는 안 되는 파일을 건드리는 서브에이전트를 구분하는 네 가지 구체적인 패턴을 다룬다. 내레이터는 코드 리뷰어와 웹 검색 서브에이전트를 예시로 삼아 각 패턴을 설명하며, 어떤 설정을 왜 바꿔야 하는지 직접 보여준다. ## [00:03] 이름과 설명으로 서브에이전트 동작 제어하기 메인 컨텍스트 윈도우 에이전트에게 보내는 모든 메시지에는 시스템 프롬프트를 통해 등록된 각 서브에이전트의 이름과 설명이 포함된다. 따라서 설명은 두 가지 역할을 동시에 한다. 오케스트레이터에게 서브에이전트를 *언제* 실행할지 알려주고, 입력 프롬프트 작성 시 사용할 템플릿을 제공한다. 튜토리얼은 코드 리뷰어 서브에이전트로 이를 보여준다. 원래 설정에서는 오케스트레이터가 서브에이전트에게 직접 `git diff`를 실행하라고 일반적인 프롬프트를 작성한다. 설명을 "리뷰할 파일을 에이전트에게 정확히 알려줘야 한다"로 바꾸면 파일 선택의 책임이 오케스트레이터로 넘어가고, 다음 실행에서 입력 프롬프트가 눈에 띄게 구체적으로 바뀐다. 웹 검색 서브에이전트도 마찬가지다. 설명에 "인용 가능한 출처를 반환하라"를 추가하면 메인 에이전트가 작업을 위임할 때 그 지시를 자동으로 포함시킨다. > *"메인 에이전트가 서브에이전트를 자동으로 실행하는 시점을 더 잘 제어하려면 이름과 설명을 수정해야 합니다."* ## [01:41] 출력 형식 정의하기 내레이터는 출력 형식을 단일 개선 사항 중 효과가 가장 큰 것으로 꼽는다. 형식이 없으면 서브에이전트는 언제 충분히 했는지 명확한 신호를 받지 못하고 계속 실행되면서 컨텍스트를 쌓고 토큰을 소모한다. 구조화된 출력 형식은 자연스러운 종료 지점을 만들어준다. 서브에이전트는 필수 필드가 채워지면 작업이 끝났음을 안다. 실질적으로는 서브에이전트의 시스템 프롬프트에 명확한 스키마를 직접 추가하는 것을 의미한다. 요약 블록, 발견 목록, 상태 필드 등이 그 예다. > *"출력 형식이 정의되지 않으면 서브에이전트는 연구가 충분히 됐는지 판단하는 데 어려움을 겪고, 출력 형식이 주어진 서브에이전트보다 훨씬 오래 실행되는 경향이 있습니다."* ## [02:04] 요약에서 장애물 보고하기 서브에이전트가 문제를 해결했을 때 — 의존성 충돌, 예상치 못한 플래그가 필요한 명령, 환경의 특이사항 등 — 메인 에이전트는 그 정보가 필요하다. 없으면 다음 단계에서 같은 벽에 부딪힌다. 해결책은 출력 형식 자체에 장애물 보고를 필수로 넣는 것이다. 내레이터는 항상 드러나야 할 카테고리를 나열한다. 마주친 장애물, 설정 문제, 발견한 우회 방법, 특별한 플래그나 설정이 필요했던 명령, 문제를 일으킨 임포트나 의존성. 이것들을 필수 출력 스키마에 포함시키면 메인 에이전트는 서브에이전트가 힘들게 얻은 발견을 그대로 물려받아 처음부터 다시 발견하지 않아도 된다. > *"그렇지 않으면 메인 에이전트가 같은 해결책을 다시 발견해야 합니다. 마주친 장애물, 설정 문제, 발견한 우회 방법이나 환경 특이사항, 특별한 플래그나 설정이 필요했던 명령, 문제를 일으킨 의존성이나 임포트가 모두 해당됩니다."* ## [02:42] 역할별 도구 접근 제한하기 도구 접근 제어는 단순한 보안 장치가 아니라 명확성 도구이기도 하다. `glob`, `grep`, `read`만 가진 읽기 전용 서브에이전트는 실수로 파일을 수정할 수 없어서, 설정을 읽는 누구에게든 역할이 명확하게 전달된다. 내레이터는 세 가지 접근 단계를 세 가지 서브에이전트 역할에 대응시킨다. 리서치 서브에이전트는 코드베이스 탐색에 쓰기가 필요 없으므로 읽기 전용 접근을 받는다. 리뷰어는 `git diff`용 `bash`를 받되 파일 편집 도구는 없다. CSS 업데이트를 적용하는 에이전트처럼 코드 변경이 명시적으로 요구되는 서브에이전트만 `edit`와 `write`를 받는다. 서브에이전트가 여럿 있을 때 도구 목록은 각각이 무엇을 해야 하는지를 기계가 읽을 수 있는 형태로 요약해준다. > *"edit와 write는 CSS 업데이트를 적용하는 스타일링 에이전트처럼 실제로 코드를 변경해야 하는 서브에이전트에게만 주세요."* ## [03:27] 효과적인 서브에이전트를 위한 네 가지 패턴 튜토리얼은 네 가지 패턴을 한 문장으로 정리하며 마무리된다. 구조화된 출력, 장애물 보고, 구체적인 설명, 제한된 도구 접근. 각 패턴은 나머지를 강화한다. 정확한 설명은 입력 프롬프트의 모호함을 줄이고, 출력 형식은 종료 지점을 만들며, 장애물 보고는 에이전트 경계를 넘어 컨텍스트를 보존하고, 최소한의 도구 접근은 남은 모호함을 증폭시킬 수 있는 부작용을 막는다. > *"효과적인 서브에이전트는 구조화된 출력을 사용하고, 장애물을 보고하고, 구체적인 설명을 갖추고, 도구 접근을 제한합니다."* ## 등장 항목 - **Anthropic Tutorial Narrator** (인물): Claude Code 서브에이전트 튜토리얼 시리즈 진행자, Anthropic을 대표하여 발표 - **Claude Code** (소프트웨어): 다단계 엔지니어링 작업을 수행하기 위해 서브에이전트를 오케스트레이션하는 Anthropic의 에이전트형 코딩 도구 - **Subagent** (개념): 오케스트레이터 에이전트가 실행하는 특화된 Claude 인스턴스로, 고유한 시스템 프롬프트, 도구 접근 권한, 입력 프롬프트를 가짐 - **Output format** (개념): 서브에이전트의 시스템 프롬프트에 정의된 필수 스키마로, 종료 조건을 만들고 메인 에이전트에 반환되는 정보를 구조화함 - **Obstacle reporting** (개념): 서브에이전트가 우회 방법, 의존성 문제, 환경 특이사항을 출력에 포함시키도록 요구하는 패턴으로, 오케스트레이터가 이를 다시 발견하지 않아도 됨 - **Tool access scoping** (개념): 각 서브에이전트를 역할에 필요한 도구만으로 제한하는 것 — 리서치는 읽기 전용, 리뷰는 bash, 파일을 변경해야 하는 에이전트만 edit/write - **Anthropic** (조직): Claude와 Claude Code 에이전트형 코딩 플랫폼을 만든 회사

#claude-code#subagents#ai-agents
서브에이전트란 무엇인가?
2:48
EN/ZH
Watch with Captions
ClaudeClaude Code subagents2개월 전

서브에이전트란 무엇인가?

서브에이전트는 Claude Code가 작업을 위임할 수 있는 전문화된 보조 에이전트입니다. 각 서브에이전트는 독립된 컨텍스트 창에서 실행되어 작업을 자율적으로 처리한 뒤, 핵심 요약만 반환하고 중간 과정 전체는 삭제됩니다. Anthropic의 이 2분짜리 튜토리얼은 해당 격리가 메인 컨텍스트 창을 사용 가능한 상태로 유지하는 데 왜 중요한지 설명하고, 코드 탐색 시나리오를 통해 트레이드오프를 보여주며, Claude Code에 기본 내장된 서브에이전트 목록을 소개합니다. ## [00:03] 서브에이전트란 무엇인가 서브에이전트는 직접 정의한 커스텀 시스템 프롬프트로 초기화된 별도의 대화 컨텍스트 창에서 실행됩니다. 상위 에이전트(메인 스레드의 Claude Code)는 요청 내용을 바탕으로 서브에이전트에게 작업 설명을 전달합니다. 서브에이전트는 이를 자율적으로 처리한 뒤 메인 스레드에 요약을 반환하고, 중간 작업은 모두 격리된 채로 남습니다. > *"Sub-agents are specialized assistants that Claude can delegate tasks to."* 핵심 설계 원칙: 서브에이전트가 작업을 마치면 해당 대화 스레드 전체가 완전히 삭제됩니다. 반환된 요약만 메인 대화에 남습니다. ## [00:24] 컨텍스트 창 관리 Claude가 메인 스레드에서 수행하는 모든 도구 호출 — 파일 읽기, 검색, 함수 추적 — 은 메인 컨텍스트 창에 쌓입니다. 긴 세션에서는 금방 가득 차게 됩니다. 서브에이전트는 개별 조사 및 실행 작업을 오프로드하여 그 비용이 메인 창에 부과되지 않도록 하기 위해 존재합니다. > *"Each sub-agent runs in its own conversation contacts window with a custom system prompt that you define."* 트레이드오프는 명확합니다. 메인 창은 깔끔한 컨텍스트를 유지하지만, 서브에이전트가 어떻게 결론에 도달했는지, 과정에서 무엇을 발견했는지는 볼 수 없습니다. 답만 받을 뿐, 추론 과정은 알 수 없습니다. ## [01:13] 구체적인 예시: 결제 시스템 낯선 코드베이스에서 어떤 서비스가 환불을 처리하는지 Claude Code로 파악하는 상황을 생각해 보세요. 서브에이전트 없이는 Claude가 파일 15개를 읽고, 여러 번 검색하고, 여러 함수 호출을 추적할 수 있으며, 사실 하나만 필요했음에도 그 모든 과정이 메인 컨텍스트 창을 채웁니다. > *"With a sub-agent, you get the answer without the journey."* 서브에이전트가 코드베이스를 탐색하고 답을 찾아 집중된 요약을 반환하므로 메인 컨텍스트가 깔끔하게 유지됩니다. 잃는 것은 가시성입니다. 어떤 파일을 읽었는지, 어떤 추적 경로를 밟았는지는 확인할 수 없습니다. ## [02:00] Claude Code의 기본 내장 서브에이전트 Claude Code는 즉시 사용 가능한 세 가지 기본 내장 서브에이전트를 제공합니다. - **범용 서브에이전트** — 탐색과 실행이 모두 필요한 다단계 작업을 위한 에이전트. - **Explore 서브에이전트** — 전체 작업 루프 없이 코드베이스를 빠르게 검색하는 에이전트. - **Plan 서브에이전트** — 플랜 모드에서 코드베이스를 조사·분석한 뒤 계획을 제시하는 에이전트. > *"And you can also create your own sub-agents with custom system prompts and tool access."* 이 세 가지 외에도, 특정 워크플로에 맞게 자체 시스템 프롬프트와 도구 접근 목록을 갖춘 커스텀 서브에이전트를 직접 정의할 수 있습니다. ## [02:30] 서브에이전트를 써야 할 때 서브에이전트는 메인 창에 많은 중간 컨텍스트를 쌓을 수밖에 없는 독립적이고 자기 완결적인 질문이나 작업이 있을 때 효과를 발휘합니다. > *"Sub-agents like Claude Code break work into focused pieces, keep your main context window clean, and bring back just what you need, whether you're using the built-in ones or creating your own."* 컨텍스트 창 압박이 누적되는 긴 Claude Code 세션에서 특히 유용합니다. 서브 작업을 서브에이전트에게 넘기면 메인 스레드에 흘러들어오는 부담이 줄어들어, 세션이 효과적으로 지속되는 시간이 늘어납니다. ## 등장 인물 - **Anthropic Tutorial Narrator** (인물): Anthropic이 제작한 "Claude Code subagents" 튜토리얼 시리즈의 나레이터 - **Claude Code** (소프트웨어): Anthropic의 에이전트 기반 코딩 어시스턴트; 서브에이전트가 동작하는 호스트 환경 - **Claude** (소프트웨어): Claude Code와 서브에이전트를 구동하는 기반 AI 모델 - **서브에이전트** (개념): Claude Code가 작업을 위임하는 전문화된 보조 에이전트로, 자체 시스템 프롬프트를 갖춘 격리된 컨텍스트 창에서 실행 - **컨텍스트 창** (개념): 모든 대화 기록, 도구 호출, 결과를 담는 유한한 토큰 버퍼; 서브에이전트는 중간 작업으로 채워지는 것을 방지 - **범용 서브에이전트** (소프트웨어): 다단계 탐색·실행 작업을 위한 기본 내장 Claude Code 서브에이전트 - **Explore 서브에이전트** (소프트웨어): 코드베이스 빠른 검색에 최적화된 기본 내장 Claude Code 서브에이전트 - **Plan 서브에이전트** (소프트웨어): 플랜 모드에서 계획 제시 전 코드베이스를 조사하는 기본 내장 Claude Code 서브에이전트 - **Anthropic** (조직): Claude와 Claude Code의 개발사; 이 튜토리얼 시리즈의 제작사

#claude-code#subagents#context-window
테런스 타오 – 세계 최고의 수학자가 AI를 활용하는 방법
1:23:44
EN/ZH
Watch with Captions
Dwarkesh Patel2개월 전

테런스 타오 – 세계 최고의 수학자가 AI를 활용하는 방법

타오와 드와케시는 케플러의 행성 운동 발견을 렌즈 삼아, AI가 과학에서 실제로 무엇을 바꾸고 있는지를 살펴본다. 타오는 가설 생성 비용이 이제 거의 0에 가까워졌기 때문에 병목이 평가, 동료 심사, 그리고 시간의 검증으로 이동했다고 주장한다. 현재 AI는 폭(모든 문제에 모든 표준 기법 시도)에서 우위를 점하고, 인간은 깊이(부분적 진전을 쌓아 올리는 능력)에서 앞서기 때문에, 하이브리드 방식이 적어도 앞으로 10년간 수학을 지배할 것이라고 본다. ## [00:00] 케플러는 고온 LLM이었다 타오는 케플러가 행성 운동의 세 법칙에 이르게 된 과정을 다시 풀어낸다. 케플러는 틀렸지만 아름다운 이론, 즉 행성 궤도 사이에 플라톤 입체를 내접시키는 이론에서 출발했다. 그는 티코 브라헤의 육안 관측 데이터를 수년간 씨름한 끝에야 그 이론을 포기했다. 타원 궤도, 면적 법칙, 조화의 법칙은 10년에 걸친 데이터 분석에서 나왔고, 뉴턴의 설명은 한 세기 뒤에야 등장했다. 드와케시의 프레임: 케플러는 검증 가능한 데이터셋에 대해 무작위 관계를 순환하는 고온 LLM과 닮았다. 타오는 메커니즘에는 동의하지만 병목에 대해서는 반박한다. 아이디어 생성은 이미 싸고 풍부했다. 케플러에게 부족했던 것은 브라헤의 한 차원 높은 데이터와, 데이터가 틀렸다고 말하는 아이디어를 버리는 인내심이었다. > *하지만 말씀하셨듯이, 그에 상응하는 검증이 뒷받침되지 않으면 그것은 슬롭에 불과합니다.* ## [11:44] AI 슬롭 더미 속에 새로운 통합 개념이 있다면 어떻게 알아챌 수 있을까? 타오: AI가 아이디어 생성 비용을 거의 0으로 낮췄다면, 동료 심사와 시간의 검증이 새로운 제약이 된다. 학술지는 이미 AI가 생성한 논문 투고에 허덕이고 있다. 어떤 아이디어의 위상은 이후 과학이 그것을 어떻게 활용하느냐에 달려 있다. 코페르니쿠스는 케플러가 그림을 완성하기 전까지 프톨레마이오스보다 정확도가 낮았다. 그래서 현재 시점에서 그 평가를 자동화하기란 어렵다. 드와케시는 수백만 편의 평범한 논문 속에 파묻힌 벨 연구소식 통합 개념, 즉 샤넌의 비트나 트랜스포머 같은 개념을 과학이 어떻게 찾아낼 수 있을지 묻는다. 타오의 답은 인간이 남을 수 있는 영역을 가리킨다. 과학자들은 단순히 이론을 생산하는 것이 아니라, 다른 과학자들이 수년간 후속 연구에 투자하도록 설득하는 이야기를 만들어낸다. 다윈의 산문이 뉴턴의 라틴어 방정식이 하지 못한 일을 해냈다. > *AI는 아이디어 생성 비용을 거의 0에 가깝게 낮췄습니다. 인터넷이 소통 비용을 거의 0으로 낮춘 것과 아주 비슷한 방식으로요.* ## [26:10] 연역적 오버행 타오는 기존 데이터 속에 아직 발굴되지 않은 신호에 대해 말한다. 천문학은 수세기 동안 최소한의 데이터에서 최대한의 정보를 끌어내는 학문이었다. 퀀트 헤지펀드가 천문학 박사를 선호하는 이유도 여기에 있다. 그가 좋아하는 사례 하나: 연구자들이 인용 사슬을 따라 오타가 전파되는 방식을 추적해서, 과학자들이 인용하는 논문을 실제로 읽는지 측정했다. 그는 AI 진보 자체에도 같은 과학사회학적 분석을 적용해, 인용 패턴, 학회 언급, 그리고 다른 흔적을 발굴하여 어떤 결과가 실제 진보였는지 시간의 검증을 기다리지 않고 탐지할 수 있다고 제안한다. > *한 가지 시사점은, 많은 분야에서 연역적 오버행이 사람들이 인식하는 것보다 훨씬 클 수 있다는 것이었습니다.* ## [30:31] 보고된 AI 발견의 선택 편향 AI는 약 1,100개의 에르되시 문제 중 약 50개를 풀었고, 그 이후 정체되었다. 타오는 선택 효과를 설명한다. 그 50개는 기존 문헌이 거의 없었다. 하나의 잘 알려지지 않은 기법과 하나의 알려진 결과만 있으면 충분했고, AI 도구는 "모든 표준 조합 시도하기"에 탁월하다. 기존 방법으로 80%가 완성된 문제라면 AI가 해결한다. 진정으로 새로운 기법이 필요한 문제에서는 도구가 멈추고, 체계적 탐색에서 문제당 성공률은 1-2%다. 타오의 비유: AI 도구는 어두운 산악 지형에 풀어놓은 점프 로봇 같다. 인간이 닿지 못하는 낮은 벽은 넘을 수 있지만, 손잡이를 잡고 버티면서 부분적 진전을 발판 삼아 올라오지는 못한다. 낙관적 해석, 즉 AI가 특정 수준에 도달하면 수백만 개의 병렬 복사본을 수백만 개의 문제에 실행할 수 있다는 점은, 과학이 폭을 실제로 활용하는 새로운 패러다임을 필요로 하는 구조적 이유이기도 하다. > *AI는 폭에서 탁월하고, 인간은, 적어도 전문가 인간은 깊이에서 탁월합니다.* ## [46:43] AI는 논문을 더 풍부하고 넓게 만들지만, 더 깊게 만들지는 않는다 타오는 자신의 작업 방식을 설명한다. 부수적 작업 비용이 약 5배 낮아졌기 때문에, 논문에는 이제 더 많은 코드, 더 많은 그림, 더 깊은 문헌 조사가 담긴다. 실제 핵심, 즉 문제의 가장 어려운 부분을 푸는 작업은 여전히 종이와 펜으로 이루어진다. 그는 자신이 "2배 더 생산적"이라고 선뜻 말하기 어렵다고 한다. 달라진 것은 쓰는 논문의 유형이지, 처음 제기한 질문에 답하는 속도가 아니기 때문이다. 영리함과 지성의 구분도 같은 지점에 닿는다. 두 인간이 수학 문제를 함께 풀 때, 각각의 실패한 시도는 다음 시도를 위한 발판이 된다. 현재 AI는 새로운 세션을 시작하면 이전 세션에서 파악한 것을 잊는다. 점진적 발판 쌓기 단계가 없다. 남은 것은 무작위 시행착오와, 결국 다음 학습 실행에 흡수되는 것뿐이다. > *논문이 더 풍부하고 넓어졌습니다. 하지만 반드시 더 깊어진 것은 아닙니다.* ## [53:00] AI가 문제를 풀면 인간은 거기서 이해를 얻을 수 있을까? AI가 Lean으로 리만 가설을 증명하고 우리는 아무것도 이해하지 못하는 상황이 올 수 있을까? 타오는 크게 걱정하지 않는다. Lean은 어떤 증명이든 원자적으로 분해할 수 있는 성질을 가진다. 각 보조 정리를 독립적으로 검사하고, 제거하고, 테스트할 수 있다. 3,000줄짜리 생성된 증명도 원자재가 된다. 다른 AI가 우아함을 위해 재구성하고, 다른 인간이 개념적 내용을 추출할 수 있으며, 원래 도출 과정이 불투명했더라도 결과물은 여전히 유용하다. 그는 거대한 Lean 생성 증명을 분해해서 그 안의 아이디어를 찾아내는 일, 일종의 증명 고고학을 직업으로 삼는 수학자 집단이 생겨날 것이라고 예측한다. 여기서 인간의 판단력과 AI의 절제 도구가 함께 쓰인다. > *인간이 이 도구들과 협력하는 상호작용에서 훨씬 더 많은 것을 얻을 수 있을 겁니다.* ## [59:20] 과학자들이 실제로 소통하는 방식을 담을 반형식 언어가 필요하다 드와케시는 수학적 증명이 아닌 수학적 전략을 위한 반형식 언어가 어떤 모습일지 묻는다. 타오는 가우스의 소수 정리, 즉 어떤 증명도 존재하기 전에 원시 데이터에서 도출된 수학 최초의 대규모 통계적 추측을 거쳐, 쌍둥이 소수 추측까지 이야기를 이어간다. 수학자들이 쌍둥이 소수 추측을 믿는 이유는 소수의 무작위 모델이 그것을 예측하기 때문이다. 수학에는 엄밀한 증명과 엄밀한 발견법이 모두 있다. 그런데 증명 쪽만 Lean이 검증할 수 있는 형태로 형식화되었다. 발견법 쪽이 형식화되지 않은 이유: RL로 검증 가능한 채점자가 있으면 그 채점자가 공략 대상이 되고, "이 논증이 설득력 있다"는 주관적 판단은 아직 해킹 가능한 프레임워크를 허용하지 않는다. 타오는 장난감 수학적 우주에서 소규모 AI를 실행하며 어떤 전략이 출현하는지 관찰하는 방식으로 추측 생성과 전략 선택을 대규모로 벤치마킹하는 방법을 원한다. > *우리가 AI를 유용한 방식으로 삽입할 수 있는 방법을 아직 모르는 과학의 주관적인 측면이 있습니다.* ## [69:48] 테리가 시간을 쓰는 방법 타오는 새로운 하위 분야를 어떻게 흡수하는지 설명한다. 그는 스스로를 벌린의 의미에서 여우로 위치시킨다. 모든 것에 대해 조금씩 알고, 필요할 때만 고슴도치가 된다. 원동력은 완결주의적 집착이다. 다른 수학자가 자신이 모르는 기법으로 결과를 증명한다면, 그 기법이 무엇인지 반드시 추적해야 한다. 같은 이유로 그는 비디오 게임도 그만두어야 했다. 다른 수학자들과의 협업이 주된 수단이고, 블로그에 글을 쓰는 것은 여섯 달 뒤에 자신이 유도한 논증을 잊고 다시 같은 논쟁을 반복하지 않기 위해 개발한 기억 보조 수단이다. 일정에서 타오는 의도적으로 우연의 여지를 남긴다. 편안한 영역 밖의 회의에 전혀 참석하지 않을 만큼 시간을 촘촘하게 최적화하는 것은 피하고 싶다고 한다. 고등연구소에서 보낸 1년이 그 함정을 확인해 주었다. 순수 연구 2주는 훌륭했지만, 그 뒤로는 영감이 고갈되었다. 다음 서가에서 우연히 발견한 책, 복도에서 나눈 가벼운 대화, 마지못해 참석한 회의가 사실 훨씬 더 많은 일을 하고 있었다. > *그런 우연한 만남들이 최적이 아닌 것처럼 보일 수 있지만, 실제로는 정말 중요합니다.* ## [77:05] 인간-AI 하이브리드가 수학을 훨씬 더 오래 지배할 것이다 AI가 언제쯤 수학을 홀로 할 수 있을까? 타오는 프레임을 바꾼다. AI는 이미 인간이 할 수 없는 수학을 하고 있다. 계산기가 그랬던 것처럼, 다만 다른 영역에서. 앞으로 10년 안에 대학원생이 현재 하는 일의 상당 부분, 즉 표준 기법 적용과 문헌 탐색이 AI로 이전될 것으로 본다. 하지만 분야 자체는 컴퓨터 대수 시스템이 기호 적분을 흡수했을 때처럼 한 단계 올라갈 것이다. 염기서열 분석이 저렴해졌다고 유전학이 끝나지 않았다. 생태계 규모로 확장되었을 뿐이다. 수학도 같은 길을 걸을 것이다. 지금 수학에 진입하는 학생들에게 그의 조언은 이렇다. 변화를 전제하되, 자격증은 옛날 방식으로 취득하라. 지금은 아직 전통적인 방식으로 수학을 공부하는 것의 대안이 없다. 동시에, 아직 존재하지 않는 것들을 포함해 완전히 새로운 연구 방식이 등장하면 그것을 활용할 수 있을 만큼 유연해져야 한다. AI 도구와 Lean 덕분에 오늘날 고등학생도 실제 수학 연구에 기여할 수 있다는 사실은 5년 전에는 없던 일이다. > *저는 인간과 AI의 하이브리드가 수학을 훨씬 더 오래 지배할 것이라고 믿는 것 같습니다.* ## 등장인물 - **Terence Tao** (인물): 필즈메달리스트(2006), UCLA 수학자. AI가 수학 연구에서 맡는 역할에 대해 정기적으로 글을 쓴다. - **Dwarkesh Patel** (인물): Dwarkesh Podcast 진행자. AI, 과학, 기술에 관한 장시간 인터뷰를 진행한다. - **Johannes Kepler** (인물): 천문학자(1571-1630). 티코 브라헤의 관측 데이터를 바탕으로 행성 운동의 세 법칙을 도출했다. - **Tycho Brahe** (인물): 덴마크의 육안 천문학자. 수십 년간의 행성 관측 데이터가 케플러에게 필요한 데이터셋이었다. - **Lean** (소프트웨어): 수학적 증명을 형식화하여 검증, 분해, 절제를 원자적으로 수행할 수 있는 증명 보조 도구. - **에르되시 문제** (개념): Paul Erdős가 제기한 약 1,100개의 미해결 문제. AI는 그중 약 50개를 풀었으며, 거의 모두 기존 문헌이 거의 없는 것들이었다. - **연역적 오버행** (개념): 기존 데이터에 이미 도출 가능한 지식이 훨씬 더 많이 내포되어 있다는 생각. 천문학이 그 모범 사례다. - **리만 가설** (개념): 소수 분포에 관한 미해결 추측. AI 증명이 인간의 수학적 이해를 실제로 진전시킬지를 가늠하는 시험 사례.

#ai-for-math#terence-tao#kepler
스킬이란 무엇인가?
2:54
EN/ZH
Watch with Captions
ClaudeClaude Code skills3개월 전

스킬이란 무엇인가?

Claude Code 스킬은 전문 지식을 한 번만 담아두는 재사용 가능한 마크다운 파일입니다. 요청이 일치하면 Claude가 자동으로 스킬을 활성화하므로, 사용자가 지시를 반복하거나 슬래시 명령어를 입력할 필요가 없습니다. 이 3분짜리 튜토리얼은 스킬이 무엇인지, 어디에 저장되는지, CLAUDE.md 파일과 어떻게 다른지, 그리고 스킬을 작성해야 할 시점을 알려주는 신호가 무엇인지 설명합니다. ## [00:03] 스킬이 해결하는 반복 문제 팀의 코딩 표준을 설명하거나, PR 피드백 구조를 다시 안내하거나, Claude에게 선호하는 커밋 메시지 형식을 상기시킬 때마다 같은 말을 반복하게 됩니다. 내레이터는 세 가지 연속 사례로 시작하며 스킬이 해소하는 바로 그 마찰 지점을 짚어냅니다. > *"Claude에게 팀의 코딩 표준을 설명할 때마다, 당신은 자신을 반복하고 있습니다."* ## [00:20] 스킬의 정의와 Claude의 선택 방식 스킬은 Claude에게 무언가를 한 번 가르쳐두는 마크다운 파일입니다. Claude는 그 지시를 저장한 뒤, 상황이 맞을 때 자동으로 적용합니다. Claude Code에서 이 파일은 SKILL.md입니다. 그 파일의 description 필드가 핵심 메커니즘입니다. PR 리뷰를 요청하면 Claude가 요청 내용을 사용 가능한 모든 스킬 설명과 비교해 일치하는 스킬을 활성화합니다. > *"Claude는 요청을 읽고, 사용 가능한 모든 스킬 설명과 비교한 뒤, 일치하는 스킬을 활성화합니다."* ## [01:05] 스킬 저장 위치: 개인용 vs. 프로젝트용 스킬은 누가 필요로 하느냐에 따라 두 곳에 저장됩니다. 개인 스킬은 ~/.claude/skills에 두면 모든 프로젝트에서 따라다닙니다. 커밋 메시지 스타일, 문서 형식, 코드 설명 방식 같은 것들이 여기에 해당합니다. 프로젝트 스킬은 저장소 루트의 .claude/skills에 두면, 해당 저장소를 클론하는 누구든 자동으로 받게 됩니다. 이 두 번째 위치가 팀 표준이 자리하는 곳입니다. 브랜드 가이드라인, 웹 디자인에서 선호하는 폰트와 색상 같은 것들이 그 예입니다. > *"저장소를 클론하는 누구든 이 스킬을 자동으로 받습니다."* ## [01:42] 스킬 vs. CLAUDE.md: 자동 실행과 컨텍스트 효율 Claude Code는 여러 커스터마이징 레이어를 제공하며, 스킬은 그 중 고유한 위치를 차지합니다. CLAUDE.md 파일은 모든 대화에 조건 없이 로드됩니다. "항상 TypeScript strict mode를 사용하라"처럼 전역 규칙에 적합합니다. 스킬은 온디맨드로 로드되며, 현재 요청과 일치할 때만 활성화되고, 그 시점에는 이름과 설명만 컨텍스트에 들어옵니다. 스킬 전체 본문은 실제로 트리거될 때만 로드됩니다. 덕분에 디버깅 중에는 PR 리뷰 체크리스트가 컨텍스트 창 밖에 머물고, 실제로 리뷰를 요청할 때만 불러와집니다. 슬래시 명령어는 직접 입력해야 하지만, 스킬은 그럴 필요가 없습니다. > *"스킬은 자동으로 실행되고 작업에 특화되어 있다는 점에서 독보적입니다."* ## [02:27] 스킬을 작성해야 할 때 스킬은 특정 작업에 연결된 전문 지식에 가장 잘 맞습니다. 팀의 코드 리뷰 기준, 커밋 메시지 형식, 브랜드 가이드라인 같은 것들이 그 예입니다. 마지막 규칙은 단순하고 실용적입니다. 같은 내용을 Claude에게 반복해서 설명하고 있다면, 그것이 바로 스킬로 만들어야 할 신호입니다. > *"같은 내용을 Claude에게 반복해서 설명하고 있다면, 그건 작성을 기다리는 스킬입니다."* ## 등장인물 - **Anthropic Tutorial Narrator** (인물): Claude Code 스킬 튜토리얼 시리즈의 내레이터 겸 진행자 - **Claude Code** (소프트웨어): Anthropic의 AI 코딩 어시스턴트; 스킬이 발견되고 적용되는 런타임 환경 - **SKILL.md** (개념): 스킬을 정의하는 마크다운 파일 — Claude를 위한 이름, 설명, 지시 사항이 담겨 있음 - **CLAUDE.md** (개념): 모든 Claude Code 대화에 조건 없이 로드되는 프로젝트 수준 또는 전역 지시 파일; 스킬과 대비되는 개념 - **Anthropic** (기관): Claude와 Claude Code를 만든 회사

#claude-code#ai-tools#developer-productivity
Skills 공유하기
3:53
EN/ZH
Watch with Captions
ClaudeClaude Code skills3개월 전

Skills 공유하기

한 명의 엔지니어가 사용하는 PR review skill은 유용하다. 같은 skill을 팀 전체에 배포하면 코드 리뷰가 표준화되고 조직 전체에 일관된 경험이 만들어진다. 이 튜토리얼은 네 가지 구체적인 배포 방법 — repository 커밋, plugins, enterprise managed settings, custom sub-agents — 을 살펴보고 각각 언제 쓰는지 정확히 설명한다. Sub-agent 섹션에는 직관에 반하는 주의사항이 있다: sub-agents는 skills를 자동으로 상속하지 않으며, 내장 agents는 skills에 전혀 접근할 수 없다. ## [00:01] 공유가 skill 가치를 배가시키는 이유 한 개발자에게만 머무는 skill은 제 역할을 한다. 같은 skill을 팀에 배포하면 기준이 고정되고, 개인별 편차가 사라지며, 모든 리뷰가 같은 모습과 느낌을 갖게 된다. 진행자는 개인 사용과 팀 규모 사용의 직접적인 대비로 시작한 뒤 네 가지 공유 메커니즘을 열거한다. > *"A PR review skill that only you use is helpful. The same skill shared across your team standardizes code review and provides a consistent experience amongst your organization which is much better."* ## [00:18] Repository에 skills 커밋하기 가장 마찰이 적은 방법: project repo 내부 `.claude/skills`에 skills를 두면 된다. Repository를 clone한 누구든 즉시 그 skills를 갖게 된다 — 별도의 설치 단계도, 추가 도구도 필요 없다. 업데이트는 일반적인 `git pull` 사이클로 전달된다. 팀 코딩 표준, 프로젝트 특화 워크플로, 코드베이스 자체 구조를 참조하는 skills에 적합한 방식이다. > *"Anyone who clones the repository gets these skills automatically. No extra installation, it's just what you're doing already."* ## [00:45] Plugins을 통한 skills 배포 Plugins는 단일 프로젝트를 넘어 이동하도록 설계된 맞춤 기능으로 Claude Code를 확장한다. Plugin 프로젝트 내부에서 `skills/` 디렉토리는 `.claude/`의 구조 — skill 이름, `SKILL.md` — 를 그대로 반영한다. Marketplace에 게시되면 어떤 Claude Code 사용자든 plugin을 다운로드해 활성화할 수 있다. 한 팀의 관례보다 더 넓은 커뮤니티를 위할 만큼 범용적인 skills에 적합한 채널이다. > *"Think of plugins as ways to extend Claude Code with custom functionality, but designed to be shared across teams and projects."* ## [01:26] Managed settings로 전사 배포 관리자는 managed settings를 통해 조직의 모든 개발자에게 skills를 배포할 수 있다. Enterprise skills는 최고 우선순위를 가진다: 같은 이름의 개인, 프로젝트, plugin skills를 모두 덮어쓴다. 의도된 용도는 필수 기준 — 보안 요구사항, 컴플라이언스 워크플로, 균일해야 하는 코딩 관행 — 이다. 진행자는 "반드시"라는 표현을 명시적으로 강조한다: 제안이 아니다. > *"This is for mandatory standards, security requirements, compliance workflows, or coding practices that must be consistent across the organization."* ## [01:52] Custom sub-agents와 명시적 skill 로딩 Sub-agents는 메인 대화의 skills를 상속하지 않는다. 내장 agents(explorer, planner, verify)는 skills에 전혀 접근할 수 없다. `.claude/agents`의 `agent.md` 파일로 정의된 custom sub-agents만 skills를 사용할 수 있으며, 그것도 해당 파일의 `skills:` 필드에 명시적으로 나열된 것만 가능하다. Skills는 sub-agent가 시작될 때 로드되며 필요할 때가 아니므로, 목록은 간결하게 유지해야 한다: 에이전트의 목적에 항상 필요한 skills만 포함해야 한다. 튜토리얼은 Claude Code sub-agent 생성기로 sub-agent를 만들고 기존 `agent.md`에 skills를 연결하는 방법을 시연한다. > *"Built-in agents like the explorer, planner, and verify can't access skills at all. Only custom sub-agents you define can use them, and only when you explicitly list them."* ## [03:18] 마무리: 올바른 배포 방법 선택하기 마지막 부분은 각 방법을 해당 시나리오에 매핑한다: 팀 접근을 위한 프로젝트 디렉토리, 저장소 간 공유를 위한 plugins, 전사 필수 기준을 위한 enterprise 배포, 격리된 작업 위임을 위한 명시적 sub-agent skill 목록. Sub-agent 주의사항이 다시 한번 나온다 — 특정 에이전트의 업무에 항상 필요한 skills만 나열해야 한다. 시작 시 로드되지, 지연 로딩되지 않기 때문이다. > *"Share skills through project directories for team access, plugins for cross-repository distribution, or enterprise deployment for organization-wide standards."* ## 등장인물 - **Anthropic Tutorial Narrator** (인물): Claude Code skills 튜토리얼 시리즈의 단독 진행자 - **Claude Code** (소프트웨어): Anthropic의 AI 코딩 어시스턴트; skills가 작성되고 배포되는 런타임 환경 - **Skills** (개념): `.claude/skills`에 배치된 재사용 가능한 명령어 집합으로 Claude Code의 동작을 확장 - **Plugins** (개념): 팀과 marketplace 사용자 간 공유를 위해 skills를 번들로 묶는 배포 가능한 패키지 - **Managed settings** (개념): 최고 우선순위 재정의로 skills를 조직 전체에 배포하는 enterprise 관리자 메커니즘 - **Sub-agents** (개념): `.claude/agents`의 `agent.md`로 정의된 맞춤형 Claude Code 에이전트; skills를 로드할 수 있는 유일한 에이전트 유형이며, 명시적으로 나열된 경우에만 가능 - **Anthropic** (조직): Claude Code를 만들고 Claude Code skills 튜토리얼 시리즈를 제작하는 회사

#claude-code#skills#developer-tools
설정과 멀티 파일 스킬
4:04
EN/ZH
Watch with Captions
ClaudeClaude Code skills3개월 전

설정과 멀티 파일 스킬

Claude Code skills 시리즈의 4분짜리 튜토리얼로, 기본 스킬을 신뢰할 수 있고 컨텍스트를 효율적으로 사용하는 도구로 만들어주는 고급 설정 필드를 다룬다. agentskills.io 표준의 전체 필드 세트 — `name`, `description`, `allowed_tools`, `model` — 를 살펴보고, progressive disclosure를 이용해 대형 스킬을 구조화하는 방법을 설명한다. 참조 자료와 스크립트가 매번 호출될 때마다가 아니라 실제로 필요할 때만 로드되도록 하는 방식이다. ## [00:02] 고급 스킬 필드 개요 agentskills.io 오픈 스탠다드는 필수 `name`과 `description` 외에도 여러 필드를 정의한다. `name`은 소문자와 하이픈으로 구성하고 64자 이하여야 하며, 디렉터리 이름과 일치해야 한다. `description`은 최대 1,024자로, Claude가 스킬 매칭에 사용하는 핵심 신호다. 두 개의 선택적 필드가 설정을 완성한다: 스킬이 호출할 수 있는 도구를 제한하는 `allowed_tools`와, 스킬을 특정 Claude 버전에 고정하는 `model`이다. > *"A basic skill works with just a name and description, but here are some other advanced tips that can make your skills really effective in Claude Code."* ## [00:39] 효과적인 description 작성하기 "강아지 도움"처럼 모호한 description은 Claude가 범위와 트리거를 추측하게 만든다. 좋은 description은 딱 두 가지 질문에 답한다: 이 스킬은 무엇을 하는가, 그리고 Claude는 언제 이를 사용해야 하는가? 사용자 요청의 자연스러운 표현에 맞는 키워드를 선택하는 것이 트리거되지 않는 스킬을 고치는 핵심이다. > *"A good description answers two questions. What does this skill do? And when should Claude use it?"* ## [01:20] allowed_tools로 도구 제한하기 `allowed_tools`는 스킬을 정해진 범위로 제한하는 메커니즘이다. 예를 들어 보안에 민감한 워크플로에서 읽기 전용 접근만 허용할 수 있다. 이 필드를 설정하면 Claude는 권한 요청 없이 해당 도구만 호출할 수 있으며, 편집·쓰기·Bash는 불가능하다. 필드를 생략하면 Claude의 기본 권한 모델이 그대로 유지된다. > *"When this skill is active, Claude can only use those tools without asking permission. No editing, no writing, no bash commands."* ## [01:49] 멀티 파일 스킬을 위한 progressive disclosure 스킬은 진행 중인 대화와 Claude의 컨텍스트 윈도우를 함께 사용한다. 모든 내용을 2만 줄짜리 `SKILL.md` 하나에 몰아넣으면 매번 호출 시 컨텍스트가 부풀고 파일 유지보수도 힘들어진다. 해결책: 핵심 지침은 `SKILL.md`에 두고, 참조 자료는 사용자 요청이 실제로 필요로 할 때만 Claude가 읽는 별도 파일로 옮기는 것이다. 스탠다드는 세 가지 지원 디렉터리를 제안한다 — 실행 코드용 `scripts/`, 문서용 `references/`, 이미지와 템플릿용 `assets/`. `SKILL.md`의 링크는 목차 항목처럼 작동하며, 해당 주제가 나오지 않으면 파일은 로드되지 않는다. 스킬 디렉터리의 스크립트는 소스 코드를 컨텍스트에 로드하지 않고 실행되어 출력만 토큰을 소비한다. `SKILL.md`를 500줄 이하로 유지하길 권장하며, 초과하면 스킬을 분할해야 한다는 신호다. > *"It's like having a table of contents in the context window rather than fitting the whole entire document in there."* ## [03:18] 정리: 스킬 메타데이터와 모범 사례 튜토리얼은 전체 설정 면을 다시 정리하며 마무리한다: `name`과 `description`은 필수, `allowed_tools`는 도구 범위를 제한, `model`은 Claude 버전을 고정한다. description에는 구체적인 행동 동사와 트리거 문구가 있어야 안정적으로 매칭된다. 대형 스킬에는 progressive disclosure로 `SKILL.md`를 500줄 이하로 유지하고 지원 파일은 실제 필요 시까지 미룬다. 스크립트는 소스를 로드하지 않고 실행되어 컨텍스트를 가볍게 유지한다. > *"Scripts can execute without loading their contents, keeping context efficient."* ## 엔티티 - **Anthropic Tutorial Narrator** (인물): Claude Code 스킬 설정을 설명하는 이 튜토리얼 시리즈의 단독 진행자. - **Claude Code** (소프트웨어): agentskills.io 표준에 따라 스킬을 로드하고 실행하는 Anthropic의 CLI 도구. - **agentskills.io** (조직): `name`, `description`, `allowed_tools`, `model` 및 디렉터리 규칙을 포함한 스킬 매니페스트 스키마를 정의하는 오픈 스탠다드. - **SKILL.md** (개념): Claude Code 스킬의 기본 매니페스트 파일. 지원 파일 링크를 포함해 500줄 이하를 유지해야 한다. - **allowed_tools** (개념): 특정 Claude 도구를 화이트리스트에 올려 읽기 전용 또는 샌드박스 스킬 모드를 가능하게 하는 선택적 스킬 필드. - **Progressive disclosure** (개념): 멀티 파일 스킬을 구조화하는 방식으로, 참조 파일과 스크립트가 활성 요청에서 실제로 필요할 때만 컨텍스트에 로드된다. - **Context window** (개념): 대화와 Claude가 로드하는 스킬 파일 간에 공유되는 토큰 예산. progressive disclosure가 절약하도록 설계된 핵심 자원.

#claude-code#skills#configuration
첫 번째 스킬 만들기
3:47
EN/ZH
Watch with Captions
ClaudeClaude Code skills3개월 전

첫 번째 스킬 만들기

이 3분짜리 튜토리얼은 Claude Code 개인 스킬을 처음부터 만드는 과정을 안내합니다. SKILL.md 파일이 담긴 디렉터리를 생성하고, 시작 시 스킬이 로드되는지 확인하고, Claude가 실제 요청에 스킬을 적용하는 모습을 직접 확인할 수 있습니다. 후반부에서는 Claude의 스킬 로딩 파이프라인이 어떻게 동작하는지 상세히 설명합니다. 네 가지 스캔 위치와 이름 전용 시작 패스, 확인 게이트, 이름 충돌을 해결하는 4단계 우선순위 체계까지 다룹니다. ## [00:03] 이 튜토리얼에서 만드는 것 진행자는 구체적인 목표로 시작합니다. 시각적 다이어그램과 비유를 사용해 코드를 설명하도록 Claude를 가르치는 스킬입니다. 스킬을 만든 뒤 Claude가 스킬을 인식하고 실행할 때 내부에서 어떤 일이 벌어지는지도 따라가 봅니다. > *"이 스킬은 Claude가 시각적 다이어그램과 비유를 사용해 코드를 설명하는 방법을 가르쳐 줄 것입니다."* ## [00:18] 스킬 파일 만들기 개인 스킬은 프로젝트 안이 아닌 홈 디렉터리에 위치합니다. 따라서 첫 번째 단계는 `~/.claude/skills/` 안에 스킬 이름으로 새 디렉터리를 만드는 것입니다. 그 안에 `SKILL.md` 파일 하나가 들어갑니다. 세 섹션이 핵심입니다. `name`(시작 시 Claude가 저장하는 식별자), `description`(스킬 호출 여부를 판단하는 매칭 기준), 그리고 두 번째 `---` 구분자 이후의 모든 내용(스킬이 발동될 때 Claude가 따르는 실제 지침)입니다. > *"skills 디렉터리 안에 스킬 이름으로 디렉터리를 만들고 있다는 점을 염두에 두세요."* ## [00:52] 스킬 로드 및 테스트 Claude Code는 요청이 들어올 때가 아닌 시작 시에 스킬을 스캔합니다. 따라서 파일을 만든 후 세션을 재시작해야 합니다. `/skills`를 실행하면 "PR description"(또는 방금 만든 스킬)이 목록에 표시되어야 합니다. 테스트하려면 몇 가지 변경 사항이 담긴 브랜치를 만들고 "Write a PR description for my changes."라고 요청을 보내세요. Claude는 PR description 스킬을 호출하고 있다고 알리고, diff를 읽은 뒤 매번 동일한 형식으로 설명을 작성합니다. > *"그러면 Claude가 PR description 스킬을 사용하고 있다고 보여줄 것입니다."* ## [01:25] Claude의 스킬 로드 내부 구조 시작 시 Claude Code는 네 곳을 스캔합니다. 엔터프라이즈 관리 설정, 개인 `~/.claude/skills/`, 프로젝트의 `.claude/` 디렉터리, 설치된 플러그인입니다. 전체 내용이 아닌 `name`과 `description`만 로드합니다. 요청이 들어오면 Claude는 저장된 설명과 비교합니다. "이 함수가 하는 일을 설명해 줘"는 "시각적 다이어그램으로 코드 설명하기"와 겹치므로 스킬이 매칭됩니다. 전체 SKILL.md를 읽기 전에 Claude는 확인을 요청해 어떤 컨텍스트가 주입되는지 사용자가 인지할 수 있게 합니다. > *"각 스킬의 이름과 설명만 로드합니다. 전체 내용은 로드하지 않습니다. 이 점이 나중에 중요합니다."* ## [02:02] 우선순위 규칙과 이름 충돌 자체 스킬이 포함된 저장소를 클론하면 이름 충돌이 생길 수 있습니다. Claude는 고정된 우선순위 체계로 이를 해결합니다. 엔터프라이즈(최상위) → 개인 → 프로젝트 → 플러그인(최하위) 순입니다. 엔터프라이즈 `code-review` 스킬은 항상 개인 `code-review` 스킬보다 우선합니다. 현실적인 해결책은 설명적인 이름을 사용하는 것입니다. 범용적인 `review` 대신 `security-review`나 `frontend-pr-review`처럼 구체적으로 지으면 충돌 자체를 방지할 수 있습니다. > *"회사에 엔터프라이즈 code review 스킬이 있고 개인 code review 스킬을 만든다면, 엔터프라이즈 버전이 우선합니다."* ## [02:52] 스킬 업데이트와 삭제 스킬 업데이트는 파일을 직접 편집하면 됩니다. SKILL.md를 열어 수정하고 저장합니다. 스킬 삭제는 해당 디렉터리를 지우면 됩니다. 두 작업 모두 변경 사항을 적용하려면 Claude Code를 재시작해야 합니다. 스킬 목록은 세션 시작 시 한 번 만들어지며 실시간 변경 사항은 감지되지 않습니다. > *"스킬을 업데이트하려면 skill.md 파일을 편집하고 변경 사항을 적용하려면 Claude Code를 재시작하세요."* ## 엔티티 - **Anthropic 튜토리얼 진행자** (인물): Claude Code skills 시리즈의 스킬 생성 튜토리얼을 진행하는 단독 호스트 - **Claude Code** (소프트웨어): Claude를 위한 Anthropic의 CLI. 시작 시 스킬을 스캔하고 사용자 요청이 스킬 설명과 일치하면 적용함 - **SKILL.md** (개념): 스킬을 정의하는 단일 파일. YAML 프론트매터(name, description)와 두 번째 `---` 구분자 이후의 자유형 지침 텍스트로 구성됨 - **Skills** (개념): Claude에게 일관된 행동 패턴을 가르치는 재사용 가능한 이름 있는 지침 세트. SKILL.md 파일이 들어있는 디렉터리 형태로 저장됨 - **Enterprise Skills** (개념): 4단계 우선순위 체계의 최상위를 차지하는 조직 관리 스킬. 개인, 프로젝트, 플러그인 스킬을 모두 재정의함 - **Anthropic** (조직): Claude와 Claude Code의 창시자. claude.com/resources/courses에서 이 튜토리얼 시리즈를 제공함

#claude-code#skills#developer-tools
Skills와 Claude Code의 다른 기능들을 비교하면
3:01
EN/ZH
Watch with Captions
ClaudeClaude Code skills3개월 전

Skills와 Claude Code의 다른 기능들을 비교하면

Claude Code는 개발자에게 Skills, CLAUDE.md, subagents, hooks, MCP 서버라는 다섯 가지 커스터마이징 수단을 제공한다. 각각 다른 용도로 설계된 도구들이다. 이 3분짜리 튜토리얼은 각 옵션을 올바른 사용 사례에 연결해서, Skills가 필요한 자리에 CLAUDE.md를 쓰거나 subagent가 필요한 자리에 hook을 연결하는 실수를 막아준다. ## [00:02] 다섯 가지 커스터마이징 옵션, 하나의 선택 문제 Claude Code가 동작 방식을 조정하는 다섯 가지 방법은 Skills, CLAUDE.md, subagents, hooks, MCP 서버다. 나레이터는 이 다섯 가지를 빠르게 나열하고 곧바로 질문의 초점을 "이게 뭔가요?"에서 "여기서 어떤 게 맞나요?"로 옮긴다. > *"각각 다른 문제를 해결합니다. 언제 무엇을 쓸지 알면 잘못된 것을 만드는 실수를 피할 수 있습니다."* 튜토리얼의 나머지는 본질적으로 이 한 문장에 대한 답이다. ## [00:18] CLAUDE.md vs Skills: 항상 켜짐 vs 필요할 때만 CLAUDE.md는 Claude가 모든 대화 시작 시 자동으로 읽는 파일이다. 별도 활성화가 필요 없다. 절대 잊어서는 안 되는 프로젝트 전반의 제약 — 프레임워크 선택, 코딩 스타일, 데이터베이스 규칙 — 을 담아두기에 적합하다. Skills는 반대로 필요할 때 로드된다. PR 리뷰 체크리스트는 실제로 리뷰를 요청할 때만 컨텍스트에 들어오고, 새 코드를 작성하는 동안에는 끼어들지 않는다. > *"Claude MD는 항상 적용되는 프로젝트 전반의 기준에 쓰세요 — 데이터베이스 스키마를 절대 수정하지 않기, 프레임워크 선호도, 코딩 스타일 같은 제약들이요."* 경계선은 영속성 대 관련성이다. 프로젝트의 모든 프롬프트에서 지켜져야 하는 지침은 CLAUDE.md에, 가끔만 유용한 것은 Skill에 넣는다. ## [01:03] Skills vs Subagents: 공유 컨텍스트 vs 독립 실행 Skills는 현재 대화에 지식을 주입한다 — 지침이 기존 컨텍스트와 합쳐진다. Subagents는 다르게 작동한다. 작업을 받아서 별도 실행 컨텍스트를 만들고, 독립적으로 작업한 뒤 메인 대화를 건드리지 않고 결과를 돌려준다. > *"작업을 별도 실행 컨텍스트에 위임하고 싶을 때 subagents를 쓰세요. 메인 대화와 다른 도구 접근이 필요하거나, 위임한 작업과 메인 컨텍스트 사이의 격리가 필요할 때도 마찬가지입니다."* 진행 중인 대화 전반에 걸쳐 Claude의 추론에 전문성을 불어넣고 싶을 때는 Skills를 쓴다. 메인 세션과 위임 작업 사이에 명확한 경계가 필요할 때 — 다른 도구, 오염 없음 — 는 subagents를 쓴다. ## [01:42] Hooks vs Skills: 이벤트 기반 vs 요청 기반 Hooks는 이벤트에 자동으로 반응한다 — Claude가 파일을 저장할 때마다 linter 실행, 특정 도구 호출 전 입력 검증. 사용자가 무엇을 요청하느냐가 아니라 Claude가 무엇을 하느냐가 트리거다. Skills는 정반대다. 요청 기반으로, 질의가 매칭될 때 활성화된다. > *"hook은 Claude가 파일을 저장할 때마다 linter를 실행하거나 특정 도구 호출 전에 입력을 검증할 수 있습니다. 모두 이벤트 기반이고, skills는 요청 기반입니다. 사용자가 무엇을 묻느냐에 따라 활성화됩니다."* 시스템 이벤트에 무조건 실행되어야 하는 동작이라면 hook이다. Claude가 질문을 받을 때 사고 방식을 형성해야 한다면 Skill이다. ## [02:15] 다섯 가지를 조합해 완전한 커스터마이징 완성하기 잘 설정된 Claude Code 환경은 각 도구를 제 역할에 맞게 쓴다. CLAUDE.md는 항상 켜져 있는 프로젝트 기준, Skills는 매 프롬프트를 어지럽히지 않아야 하는 작업별 전문성, hooks는 자동화된 사이드 이펙트, subagents는 격리된 위임 작업, MCP 서버는 외부 도구 접근. 이들은 대안이 아니라 조합해서 쓰는 것이다. > *"다른 옵션이 더 잘 맞을 때 모든 것을 skills에 욱여넣지 마세요. 여러 개를 동시에 쓸 수 있습니다."* Skills는 관련 주제가 나올 때 자동으로 활성화되고, CLAUDE.md는 항상 존재하며, subagents는 격리된 상태로 실행되고, hooks는 이벤트에 반응하며, MCP는 외부 도구를 제공한다. 각 관심사에 맞는 레이어를 고르고 자유롭게 조합하면 된다. ## 엔티티 - **Anthropic Tutorial Narrator** (인물): Anthropic을 대표해 이 Claude Code skills 튜토리얼 시리즈를 진행하는 호스트. - **Claude Code** (소프트웨어): Anthropic의 AI 기반 코딩 어시스턴트; 튜토리얼 시리즈의 주제. - **Skills** (개념): Claude가 사용자 요청을 인식할 때 활성화되는 온디맨드 지식 패키지; 현재 대화 컨텍스트에 지침을 주입한다. - **CLAUDE.md** (개념): 모든 Claude Code 대화에 자동으로 로드되는 설정 파일; 항상 켜져 있는 프로젝트 전반의 기준과 제약에 사용된다. - **Subagents** (개념): 메인 대화와 격리된 상태로 위임 작업을 처리하기 위해 생성되는 별도 실행 컨텍스트. - **Hooks** (개념): Claude의 특정 동작 — 파일 저장이나 도구 호출 등 — 에 반응하는 이벤트 기반 자동화. 사용자 요청과 무관하게 실행된다. - **MCP Servers** (소프트웨어): Claude Code 세션에 외부 도구를 제공하는 Model Context Protocol 서버. - **Anthropic** (조직): Claude Code의 개발사이자 Claude Code skills 튜토리얼 시리즈의 발행자.

#claude-code#skills#claude-md