LaiDub

Podcasts

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496
4:18:22
EN/ZH
Watch with Captions
Lex Fridmanhá 20 dias

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496

Lex Fridman sits down with Jean-Baptiste Kempf, president of VideoLAN and lead developer of VLC, and Kieran Kunhya, longtime FFmpeg contributor and the voice behind the infamous FFmpeg account on X, for a four-hour deep dive into the invisible machinery behind virtually all video on the internet. Together they trace the full arc from raw bytes and container formats through hand-written assembly and codec reverse-engineering, confronting the open-source sustainability crisis along the way. The conversation is both a technical masterclass and a meditation on why brilliant volunteers—many of them teenagers—quietly build infrastructure that powers billions of devices every day. ## [00:00] Episode highlight The episode opens with a rapid-fire highlight reel that captures the spirit of what follows. Kempf distills the FFmpeg community's core value: code quality is the only credential that matters—"Maybe you're a dog. I don't care. I need to look at your code." Kunhya adds the scale: FFmpeg is running on roughly 100 million CPUs at any moment, with three billion devices continuously decoding video, and FFmpeg's x86 assembly hand-optimization runs 62 times faster than equivalent C. The segment also previews the CIA-VLC spy story, the intelligence-agency backdoor request Kempf flatly refused, and Kieran's "no regrets" Twitter philosophy. > *"We care about excellent code. We don't care who you are. Like maybe you're a dog. I don't care, right? I need to look at your code."* — Jean-Baptiste Kempf ## [02:17] Introduction Lex sets the scene: FFmpeg is the invisible backbone behind YouTube, Netflix, Chrome, VLC, Discord, and nearly every platform that touches video or audio. VLC has been downloaded more than 6.5 billion times. Both projects are built entirely by volunteers. Lex frames the episode not merely as a technical discussion but as a tribute to engineers who work for the craft rather than for fame or money—"one of the great examples of human beings quietly collaborating across borders to build something useful, durable, and elegant." > *"It is one of the most incredible software systems ever developed, and it's all done by volunteers."* — Lex Fridman ## [05:35] Weirdest things VLC opens The conversation lightens up with playful examples of VLC's legendary tolerance for exotic formats. Kempf describes users capturing VHS tapes via capture cards, support for DVD-Audio with custom encryption, and the Lucasfilm Star Wars game codec that FFmpeg implemented for a single 10-second opening sequence. At a VideoLAN conference, a competition to create the most broken file ever—an MKV where every frame changed resolution, aspect ratio, and rotation—ended with VLC playing it perfectly. The orange traffic-cone logo is discussed: so recognizable that 25% of VLC's website traffic arrives from people searching "cone player." > *"There was a file that's a valid ZIP and a valid MP3 at the same time or something like that—and VLC opened all of the stupid files."* — Kieran Kunhya ## [09:59] How video playback works Kempf and Kunhya walk through what happens the moment you press play: the player fetches a byte stream from a URL, the demuxer separates audio, video, and subtitle tracks, entropy decoding removes mathematical compression, intra prediction reconstructs still-image frames (I-frames), motion-compensation handles temporal redundancy (P- and B-frames), and the final raw pixels are handed to the GPU or audio card. Video compression achieves 100x to 200x reduction by exploiting how human eyes perceive luminance versus color—working in YUV space rather than RGB—and by reusing unchanged background regions across frames. Kunhya warns that every single sentence in this pipeline represents someone's lifetime of work. > *"Everything we've just said in the past couple of minutes, every sentence is someone's lifetime's work. There are books about every sentence."* — Kieran Kunhya ## [19:20] Video codecs and containers The hosts clarify the often-confused distinction between containers and codecs. A container (MP4, MKV, MOV) multiplexes audio, video, and subtitle tracks; the codec (H.264, AV1) compresses the content inside. VLC and FFmpeg deliberately ignore the file extension and probe the actual bytes—because in the real world, extensions lie. The segment covers how AVI was Microsoft's format, MOV became MP4 via Apple, and the Matroska/MKV format emerged from the open-source community. Modern codecs like AV1 are not single algorithms but collections of tools that adapt to content type—screen share, animation, live video—each requiring different coding strategies. > *"We discard the file format. We look into the file to understand what's in it because so many people say, 'Oh, it's a video, it must be MP4,' but technically it's an MOV or maybe it's a MKV."* — Jean-Baptiste Kempf ## [30:07] FFmpeg explained FFmpeg is described as a low-level library suite—libavcodec, libavformat, libavfilter—plus a command-line tool so expressive that Kempf calls it a full programming language. Every person watching a YouTube video, recording with OBS, or editing in a professional broadcast box is likely touching FFmpeg. Kunhya notes that trillion-dollar corporations and grandmothers with home videos operate on exactly the same technology stack. The segment dives into open-source licensing—MIT, GPL, LGPL, AGPL—as "social contracts" that define community norms. Kempf recounts the painstaking process of re-licensing VLC's core from GPL to LGPL, requiring him to track down more than 350 contributors, including visiting the factory-worker father of a deceased contributor to obtain permission for two lines of code. > *"From a philosophical level, it's incredible that your grandmother's home videos and trillion-dollar corporations are on a level playing field using the same technology stack."* — Kieran Kunhya ## [51:07] Linus Torvalds Kempf offers a nuanced defense of Linus Torvalds's legendary harshness. The Linux kernel's core community is tiny—as is FFmpeg's (10–15 active maintainers)—and those few people must maintain every line of code forever. "We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code." Kunhya adds that terseness is often simply fatigue: volunteers arrive home after a full day of work and review patches without the bandwidth to hand-hold. Kempf also points out that most community members are non-native English speakers, and cultural misreadings amplify perceived hostility. > *"We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code."* — Jean-Baptiste Kempf ## [55:46] Turning down millions to keep VLC ad-free Kempf traces VLC's unlikely origin: a French engineering school (École Centrale Paris) whose student-run campus built a satellite video-streaming system in 1995—a decade before YouTube—just to enable faster networks for video games. From that Network 2000 project grew VideoLAN, and VLC emerged as its client. Kempf joined in 2003 when the project had nearly died, grew it from hundreds of thousands to billions of installs, and along the way repeatedly refused "obscene" offers to bundle toolbars, change search engines, or insert advertisements. His reasoning: "I need to go to bed at night and be happy about what I've done. If I had sold out, I would have betrayed so many other people who work here." > *"I refuse dozens of millions of dollars, yes, several times. Yes, I could be a multimillionaire and be somewhere on the beach. But I did not do it because I thought it was not moral and it was not the right thing to do."* — Jean-Baptiste Kempf ## [70:04] FFmpeg & Google drama Kunhya recounts a public controversy in which Google's security team used AI to auto-generate bug reports for FFmpeg, filing them under tight 90-day deadlines—with some vulnerability reports going to the press before patches could be written—without contributing corresponding fixes or meaningful funding. Kunhya compares it to "a denial of service by AI-generated bug reports" on obscure 1990s game codecs. The saga escalated via spicy FFmpeg tweets (a "rap battle" in Kunhya's words), but produced concrete results: Google began sending patches and established a financial reward system for fixes. A parallel incident saw Microsoft Teams engineers file a high-priority bug on the volunteer tracker, name-dropping their product's scale, and offering a one-time payment of a few thousand dollars in response to a request for a long-term support contract. > *"Google uses FFmpeg at a scale probably you or I couldn't even contemplate—millions of CPU cores. And yes, they contribute in areas mostly regarding their own products. But in a wider sense, there's a disproportionate level of contribution."* — Kieran Kunhya ## [89:18] FFmpeg developers What motivates FFmpeg's volunteer engineers? Kempf identifies three drivers: passion for the subject matter (many contributors arrived because they loved anime), excellence of the craft ("this is the best school ever of programming"), and pride in impact ("you can tell your grandma: I do this so you can play video on your laptop"). Kunhya adds that Andrew Kelley, creator of the Zig programming language, was an FFmpeg developer who credits his time there as his real-world education. Teenagers have written thousands of lines of hand-optimized assembly for FFmpeg. Kieran's favorite quote, from John Collison: "The world is a museum of passion projects." > *"If you're good in C, if you know how to write assembly in FFmpeg, I assure you you're going to be one of the best programmers ever—even if you're working on writing TypeScript."* — Jean-Baptiste Kempf ## [95:55] VLC and FFmpeg Kunhya frames the FFmpeg-VLC relationship as a "binary star system": VLC is to FFmpeg as Android is to Linux—they depend on each other and succeed because of each other. Roughly 80% of FFmpeg pipelines depend on at least one VideoLAN project (most often x264). VLC gives FFmpeg exposure to a vast zoo of real-world broken files. When compiled for Windows, VLC links against about 16 million lines of code, of which only 1 million live in the VLC repository itself. The two projects share many developers and collectively demonstrate that complex software ecosystems can be built entirely from interdependent open-source components. > *"VLC is to FFmpeg as Android is to Linux. They depend on each other, but they coexist because of each other."* — Kieran Kunhya ## [100:29] History of FFmpeg The "eras tour" of FFmpeg begins with Fabrice Bellard creating the initial concept, followed by the Michael Niedermayer era of the early 2000s—exhaustive support for DivX, Xvid, Windows Media, and RealMedia, eliminating the need for bloated, spyware-ridden codec packs. The late 2000s brought H.264 maturity and the rise of high-definition video. Throughout, VLC served as FFmpeg's field test: millions of users exposing edge cases that no lab could anticipate. > *"At the time you needed a new player to play every different type of file format. Having a single library that was fast and open source—that was a massive achievement."* — Kieran Kunhya ## [103:46] Reverse engineering codecs The segment showcases the art of reverse engineering proprietary codecs. Kostya Shishkov—described as "borderline genius"—reverse-engineered 20–30 megabyte binary blobs (each megabyte representing roughly a month of normal work) for fun, producing decoders for Windows Media, RealMedia, and GoToMeeting formats. Kunhya explains the methodology: hook into the proprietary player to dump raw YUV data, open a disassembler, step through machine code instruction by instruction to infer the entropy coding, prediction, and IDCT stages, then validate bit-exactness against sample files. For months, the work produces no visible output—pure debugging in memory. > *"He looked at the world as a binary specification. He didn't need documentation or anything. He would go away and come back and do interesting stuff."* — Kieran Kunhya ## [117:01] FFmpeg testing FFmpeg's FATE (FFmpeg Automated Testing Environment) system runs a pivot table of test combinations: dozens of compilers (GCC, Clang, MSVC, Apple Clang, Intel Compiler), operating systems (Linux, macOS, Windows, BSD, Solaris), and CPU architectures (x86, ARM, RISC-V, PowerPC). All test machines are volunteer-hosted. The system catches compiler miscompilations—rare but devastating, since even a single wrong bit in a frame dependency chain can cascade into major visual corruption. Kunhya notes that the Macs at the top of the FATE dashboard are hosted in his own office. > *"It's not just a matrix at this point. It's like a pivot table of different combinations—all run by volunteers."* — Kieran Kunhya ## [121:08] Assembly code (handwritten) This extended chapter is the technical heart of the episode. Handwritten x86/ARM SIMD assembly in FFmpeg and x264 runs up to 62 times faster than equivalent C—a gap that modern compilers and auto-vectorization cannot close despite years of trying. VLC still supports Windows XP through Windows 11, macOS 10.7 through macOS 26, iOS 9 through the latest, BSD, Solaris, and even OS/2. Understanding assembly forces programmers to internalize CPU pipeline stages, SIMD registers, L1/L2/L3 cache, and memory bus constraints. Kempf and Kunhya introduce the x86inc framework built by Loren Merritt for x264 and JB's Assembly Lessons tutorial series, which have attracted contributions from teenagers learning directly from the source. > *"I believe it's necessary to understand assembly language, even if you don't do it much, to understand what's going on inside your computer. That will make you a better programmer."* — Jean-Baptiste Kempf ## [145:26] Rust programming language Kempf and Kunhya hold divergent opinions on Rust. Kunhya respects the memory-safety goal but finds the community self-important—"It has a very big Esperanto vibe"—and argues that Rust rewrites reaching only 85–90% of required feature coverage are insufficient; "the last 1% takes 99% of the time." Kempf has written Rust VLC modules and sees genuine value, but notes that the lack of training data for low-level SIMD work means AI tools cannot yet assist meaningfully. The discussion broadens to the two assembly wizards of the community: Henrik Gramner, whose knowledge of Intel x86 cycle counts exceeds Intel's own engineers, and Martin Storsjö, who writes ARM Neon assembly on a virtual keyboard while watching his kids play in the playground. > *"Rust reminds me of the Sinclair C5. In order to get people to move, you have to build something as good as, if not better than, what you have now."* — Kieran Kunhya ## [154:42] FFmpeg and Libav fork In 2011, FFmpeg split into FFmpeg and Libav, primarily over governance and leadership style rather than technical disagreements. Several Linux distributions temporarily shipped Libav instead of FFmpeg. Kempf describes open-source forks as healthy—they force projects to confront structural weaknesses. Eventually most of Libav's developers returned to FFmpeg, and the projects merged back. Kempf draws a parallel to the XZ Utils attack, where a lone maintainer, exhausted by coordinated social engineering, granted commit access to an attacker—highlighting how burnout creates the very single-point-of-failure vulnerabilities that make critical open-source infrastructure fragile. > *"Forks are important because they change the status quo of a community. FFmpeg today is better than it was before the fork."* — Jean-Baptiste Kempf ## [163:04] Open source burnout Kempf and Kunhya confront the mental health crisis among open-source maintainers. Kempf has received physical death threats—including a letter containing powder—over decisions such as dropping PowerPC support. The security community's habit of filing alarming CVEs for hobby-project edge cases adds psychological load without providing patches. Kempf now maintains several libraries whose original maintainers burned out. The conversation broadens to the systemic problem: critical infrastructure like libxml and XZ is maintained by one or two people, unknown to the trillion-dollar enterprises that depend on them. > *"The mental health of the open source maintainers is something that large corporations don't care or don't see."* — Jean-Baptiste Kempf ## [170:51] x264 and internet video H.264 transformed internet video by arriving exactly when Intel Core 2/Nehalem CPUs made real-time software decoding practical. The key innovation of x264 was psychovisual rate-distortion optimization—encoding decisions driven by visual quality metrics rather than mean squared error, producing sharper, more natural-looking video. This was driven by the anime community's high standards for perceived sharpness. AV1 offers 40–60% bandwidth savings over H.264 at the same quality, but encoding costs two orders of magnitude more CPU. YouTube therefore re-encodes only popular videos in AV1, making the extra compute worthwhile by amortizing it over millions of viewers. > *"Thirty percent of the video from Netflix is now in AV1, fifty percent of YouTube."* — Jean-Baptiste Kempf ## [184:07] Video compression basics The chapter clarifies I/P/B frame structure: I-frames are complete still images, P-frames reference only previous frames, and B-frames can reference both past and future frames. ProRes is an intra-only codec designed for nonlinear editing—no temporal dependencies, fast seeking. The segment also covers constant-bitrate versus constant-quality encoding, group-of-pictures length, and the thousands of engineers at Netflix, YouTube, and Meta whose entire job is tuning FFmpeg parameters for specific content types. A historical curiosity: Google Video originally used VLC as an ActiveX plugin inside Internet Explorer; today VLC is compiled to WebAssembly to run inside browser JavaScript engines. > *"You have I-frames that are complete frames, P-frames that depend only on I-frames, and B-frames that can depend on frames in front."* — Jean-Baptiste Kempf ## [191:04] CIA and fake VLC WikiLeaks' Vault 7 release revealed that the CIA built a modified version of VLC with an additional DLL (psapi.dll) that silently encrypted and exfiltrated documents while the victim watched a movie, using the expected high CPU load of video playback as cover. VideoLAN issued a press release directing users to download only from the official website. A separate incident involved Chinese state hackers distributing a fake VLC using legitimate signed VideoLAN DLLs to target Indian users, causing India to ban VLC until Kempf fought a successful legal battle to reverse the ban. The segment also surfaces a hidden feature: VLC can render movies as ASCII art in a terminal, useful for diagnosing multicast network paths via SSH. > *"If we had to compromise our software, we would shut it down. This is clear."* — Jean-Baptiste Kempf ## [201:39] Ultra low latency streaming Kempf explains adaptive streaming (HLS, DASH): the player downloads segments, times the download, and adjusts quality tier accordingly. The real engineering frontier is live broadcasting with strict CBR constraints—satellite uplinks cannot burst even for one second. Kempf describes his company Kyber, an open-source (AGPL dual-licensed) ultra-low-latency streaming stack targeting robotics and XR, streaming compressed video feeds to devices without onboard compute. The segment ends with a discussion of teleop for robots, where latency directly determines safety. > *"Kyber is open source. Everything on Kyber is open source. If you want to use it in your product and not open source it, you pay the commercial license."* — Jean-Baptiste Kempf ## [219:07] AV2 codec and video patents AV2, the successor to AV1 within the Alliance for Open Media (of which VideoLAN is a member), promises a further 30% bandwidth reduction. VideoLAN's dav1d decoder will be followed by "dav2d." The Alliance exists specifically to escape the HEVC/H.265 patent thicket: HEVC's three separate patent pools demanded fees so large that HP removed HEVC support from new laptops, and streaming giants calculated they could build a new royalty-free codec for less than the annual licensing cost. France's rejection of software patents means Kempf has never paid codec licensing fees—if he had to, the bill would exceed 200 euros per user. > *"At a hundred million per year, you know, I could create my own codec—and this is what they did."* — Jean-Baptiste Kempf ## [228:59] VLC backdoors Intelligence agencies from two different countries approached Kempf asking him to insert backdoors into VLC. He declined both, in terms he describes as "a lot less polite" than a simple no. The chapter broadens into a discussion of European entrepreneurship: Kempf argues that French startup culture has transformed over 15 years—failure stigma has fallen, AI companies are proliferating—while acknowledging that over-regulation remains a real drag. He closes by reflecting on his strategy for remaining calm under legal and political pressure: always ask "am I dying? Am I hurting someone?" If not, move on. > *"If we had to compromise our software, we would shut it down. Also because what we do is good and it's done for everyone."* — Jean-Baptiste Kempf ## [239:14] Video archiving Kieran profiles the archiving preservation community, led in part by Dave Rice of CUNY, which relies on FFmpeg as a "Rosetta Stone" for playing future-proof multimedia. The community funded FFV1, FFmpeg's lossless codec, to guarantee that archived footage loses no information—critical because lossy compression could destroy forensic or historical details visible only on close inspection. A famous cautionary tale: the BBC's 1986 New Domesday Book project archived content on BBC Micros, and within 20 years no one had working software to read it. There are now more historical video tapes in archives than functional tape heads in the world to digitize them, forcing painful triage decisions about what human history to preserve. > *"C will be like Latin. It will be a thing you learn from the past, but it will still be usable in certain contexts."* — Kieran Kunhya ## [245:51] Future of FFmpeg and VLC The closing chapter surveys where multimedia is heading: volumetric video, point-cloud codecs for robotics, RGBD depth streams, XR/VR streaming, and—speculatively—neural interfaces that may one day require codecs for compressed brain data. Kempf is confident FFmpeg will exist in 100 years; VLC he rates as "maybe." He closes with his personal philosophy: "Regrets are a tax on your mind. Learn from your mistakes, but don't regret." The episode ends with Lex reading Linus Torvalds: "Most good programmers do programming not because they expect to get paid or get adulation by the public, but because it is fun to program." > *"Regrets are a tax on your mind. Learn from your mistakes, but don't regret. Because you've done it, so unless you have a time machine, don't regret."* — Jean-Baptiste Kempf ## Entities - **Jean-Baptiste Kempf** (Person): President of VideoLAN, primary maintainer of VLC, founder of Kyber and several other companies; declined tens of millions of dollars to keep VLC ad-free. - **Kieran Kunhya** (Person): Veteran FFmpeg contributor, codec engineer, founder of Open Broadcast Systems, the voice behind the FFmpeg account on X. - **Lex Fridman** (Person): Host of the Lex Fridman Podcast, AI researcher, longtime VLC and FFmpeg advocate. - **Fabrice Bellard** (Person): Creator of FFmpeg, QEMU, and tcc; foundational figure of the project. - **Michael Niedermayer** (Person): Long-time FFmpeg maintainer who drove exhaustive codec support through the 2000s. - **Kostya Shishkov** (Person): Legendary FFmpeg reverse engineer who decoded proprietary binary blobs for Windows Media, RealMedia, and GoToMeeting codecs. - **Henrik Gramner** (Person): Assembly wizard with deeper knowledge of Intel x86 cycle counts than Intel's own engineers. - **Linus Torvalds** (Person): Creator of Linux and Git; referenced as a model of uncompromising code quality standards in open-source communities. - **FFmpeg** (Software): Open-source multimedia framework providing codecs, muxers, filters, and command-line tools; the invisible backbone of nearly all internet video. - **VLC** (Software): Open-source media player with 6.5+ billion downloads, built on libVLC and FFmpeg; plays virtually any format on any platform. - **x264** (Software): VideoLAN's open-source H.264 encoder; the dominant software encoder for internet video, famous for psychovisual optimizations. - **dav1d** (Software): VideoLAN's fast open-source AV1 decoder; widely deployed in browsers and streaming clients. - **VideoLAN** (Organization): French nonprofit that stewards VLC, x264, dav1d, and related open-source multimedia libraries. - **Alliance for Open Media** (Organization): Industry consortium including Google, Netflix, Apple, Amazon, and VideoLAN that created AV1 and is developing AV2 as royalty-free codec standards. - **FATE** (Software): FFmpeg Automated Testing Environment; volunteer-hosted CI grid testing hundreds of compiler/OS/architecture combinations. - **Kyber** (Organization): JB Kempf's startup building an ultra-low-latency open-source streaming stack for robotics and XR, dual-licensed AGPL/commercial. - **H.264 / AVC** (Concept): The dominant internet video codec standard; open-source implementation is x264; basis of Blu-ray and most MP4 files. - **AV1 / AV2** (Concept): Royalty-free next-generation video codec standards from the Alliance for Open Media; AV1 saves 40-60% bandwidth vs H.264; AV2 adds another 30%.

#ffmpeg#vlc#open-source
O que é o Claude Code?
2:55
EN/ZH
Watch with Captions
ClaudeClaude Code 101há 21 dias

O que é o Claude Code?

O guia oficial da Anthropic sobre o Claude Code — o que é, como difere do Claude.ai e as três coisas que você deve saber antes de deixar um LLM executar comandos na sua base de código. Voltado para desenvolvedores prestes a instalar a ferramenta de terminal pela primeira vez. ## [00:04] O que é o Claude Code e onde ele roda O Claude Code é posicionado como uma ferramenta de codificação agêntica: entende sua base de código, edita arquivos, executa comandos e se integra às ferramentas de desenvolvimento que você já usa. Ele funciona em várias superfícies — terminal, VS Code, JetBrains IDEs, o aplicativo de desktop Claude e a web — mas este guia usa o terminal como experiência canônica. > *Claude Code is an agentic coding tool that understands your code base, edits your files, run commands, and integrates with your existing developer tools to help you get things done faster.* ## [00:34] Como ele difere do Claude.ai A distinção principal não é a capacidade do modelo, mas o acesso: o Claude Code acessa diretamente seu terminal e toda a sua base de código, eliminando o ciclo de copiar e colar no chat — a ferramenta realiza o trabalho no lugar. Chamá-lo de "agente de IA" é uma forma resumida de descrever essa superfície de execução direta. > *Unlike Claude AI, Claude Code has direct access to your files in your terminal and your entire code base.* ## [00:51] Agentes de IA e o que o Claude Code pode fazer Um agente de IA aqui significa software que interage com seu ambiente e toma ações para atingir um objetivo definido — em sua forma mais básica, um LLM em um loop em tempo real com acesso a ferramentas, serviços externos e outros agentes. Para o Claude Code, isso se traduz em capacidades concretas: ler e explicar sua base de código, rastrear bugs entre arquivos, executar scripts de build e testes, instalar pacotes e buscar a documentação de API mais recente na web para decidir o que fazer a seguir. > *An AI agent is a software that can interact with its environment and perform actions to complete a defined goal.* ## [01:45] Três conceitos para saber antes de começar O narrador destaca três propriedades que moldam o uso diário. Primeiro, a **janela de contexto** é a memória de trabalho do Claude — grande, mas finita — por isso o agente precisa navegar estrategicamente pela base de código em vez de carregá-la toda. Segundo, o Claude Code **pede permissão** antes de executar comandos ou modificar arquivos; você mantém o controle, seja conduzindo cada etapa ou deixando-o funcionar de forma mais autônoma. Terceiro, **ele pode errar**: interpretar mal a intenção, introduzir bugs ou engenheirar demais uma solução. Trate os resultados como faria com os de qualquer outra ferramenta, não como verdade absoluta. > *By default, Claude Code will ask you before running commands or making changes to your code base.* ## [02:34] Recapitulação O Claude Code é uma ferramenta de codificação agêntica que lê sua base de código, edita arquivos, executa comandos e se conecta a ferramentas externas para ajudá-lo a entregar mais rápido — disponível hoje no terminal, VS Code, JetBrains e no aplicativo de desktop Claude. > *Claude Code is an agentic coding tool. It reads your code base, edits your files, runs commands, and connects to external tools to help you ship faster.* ## Entidades - **Anthropic Tutorial Narrator** (Person): O narrador oficial da Anthropic para a série de tutoriais Claude Code 101. - **Claude Code** (Software): O assistente de codificação agêntico baseado em terminal da Anthropic, que opera diretamente na sua base de código. - **Claude.ai** (Software): O produto Claude baseado em chat — em contraste com a execução em ambiente do Claude Code. - **AI agent** (Concept): Um LLM rodando em loop em tempo real com acesso a ferramentas, serviços externos e outros agentes para perseguir um objetivo definido. - **Context window** (Concept): A memória de trabalho do Claude — finita, por isso o agente navega estrategicamente em vez de carregar toda a base de código. - **VS Code / JetBrains IDEs** (Software): Integrações de editores nas quais o Claude Code está disponível, ao lado do terminal e do aplicativo de desktop Claude.

#claude-code#ai-agent#developer-tools
🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI
1:31:51
EN/ZH
Watch with Captions
Latent Spacehá 21 dias

🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI

Alex Lupsasca — 2024 New Horizons Breakthrough Prize winner and OpenAI resident scientist — recounts how GPT-5 resolved a year-long open problem in quantum field theory: proving that single-minus gluon tree amplitudes are non-zero and finding their compact closed form. He then describes how the publicly available GPT Pro, given the gluon paper as a seed, independently generalized the result to graviton amplitudes in under three days of human clock time. Throughout the conversation, Lupsasca reflects on what this trajectory means for how physics is done, how the next generation of physicists will be trained, and where the remaining bottlenecks — verification, creativity, and publishing infrastructure — still lie. ## [00:00] Introduction to AI's impact on physics research Lupsasca opens in medias res, framing the episode's central claim before the formal introduction: AI has crossed a threshold where it can resolve questions that stumped human experts for over a year. He describes this not as a curiosity for theoretical physicists but as a profound, if underappreciated, change in the nature of scientific discovery itself. > *"That's a certain milestone that we've passed, and I think maybe for the average person on the street who doesn't care about theoretical physics, this is not very noticeable, but I think it's a very profound change and we've really passed some kind of a threshold."* ## [00:43] Guest introduction: Alex Luposka The hosts — Brandon (Atomic AI) and RJ Honicky (Miro Omix) — introduce Lupsasca as a Vanderbilt professor and OpenAI fellow who holds both the 2024 New Horizons in Physics Breakthrough Prize (often called the "Oscars for science") and the IUPAP Young Scientist Award. Lupsasca immediately sets the narrative arc: a year ago, AI was useful for email but not for his work; ChatGPT o3 was the first model that genuinely helped with research math; then GPT-5 reproduced one of his hardest published results in 30 minutes. > *"When GPT-5 came out it was able to reproduce one of my best papers that took me a very long time to come up with in like 30 minutes. And that's when I really became AI pilled."* ## [02:49] Alex joining OpenAI and the shift in physics research After GPT-5's release, Lupsasca began evangelizing the shift to colleagues who were skeptical. Finding OpenAI equally excited, and being on sabbatical, he joined as resident scientist — the person physicists around the world now email when something astonishing happens. He describes receiving an inbound that week about Codex simulating the Sachdev-Ye-Kitaev (SYK) model in 10 minutes, a feat that many research groups had struggled to achieve due to the narrow Venn diagram of physicists with strong coding skills. > *"I talked to OpenAI. They were also really excited and I thought I have to get in on this and to understand that this is happening and not be a part of it is a huge mistake so I have to go to OpenAI."* ## [04:08] The release of GPT-5 and the shift in capabilities Lupsasca contrasts the lukewarm Twitter reception of GPT-5 (complaints that it was not better at writing email) with what he observed at the science frontier. He notes GPT-5.4 is another significant jump, and describes how AI capabilities for physics have been accelerating rapidly since o3, the first reasoning model strong enough for research-grade mathematics. He uses this as a bridge to the central technical story of the episode: a pair of new papers on gluon and graviton scattering amplitudes. > *"At the science frontier the capabilities were really taking off."* ## [10:05] Explaining Quantum Field Theory and amplitude calculations Lupsasca gives an accessible primer on quantum field theory (QFT), the framework that reconciles special relativity and quantum mechanics. The key objects in QFT are scattering amplitudes — complex-valued functions that encode the quantum probability for a set of incoming particles (with given energies, momenta, and polarizations) to scatter into a set of outgoing particles. These amplitudes are computed at particle colliders like the LHC, and knowing the n-point amplitude (for any number n of particles) encodes essentially the full content of the theory. > *"If you have a particular force and you're able to compute the n-point amplitudes... you know everything about the theory."* ## [14:20] Overview of gluons and the strong force Gluons are the force-carrying particles of the strong nuclear force — the force that, despite like-charge repulsion between protons, holds the atomic nucleus together. They are the QFT analog of photons for electromagnetism and gravitons for gravity. Like photons, gluons carry a polarization (helicity): positive (right-handed) or negative (left-handed). This helicity structure is central to the paper discussed next. > *"The strong force is mediated by the exchange of the particles of the strong force, which are called gluons, because they're what glues together the nucleus of the atom."* ## [14:38] Discussing the first research paper on single-minus gluon tree amplitudes Lupsasca unpacks the paper's title — "Single-Minus Gluon Tree Amplitudes Are Non-Zero" — piece by piece. Tree amplitudes are the leading-order (no-loop) contributions to scattering. All-plus-helicity amplitudes are exactly zero by a symmetry argument. Single-minus amplitudes — where all but one gluon have positive helicity — were assumed in textbooks to also be zero by the same argument. The paper proves they are not. The result involves collaboration with Alfredo Guevara (IAS), David Skinner (Cambridge), Andrew Strominger (Harvard), and Kevin Wheel. > *"If you look at the lecture notes and textbooks that have been written on this, the same argument that rules out the all-plus amplitudes also appears to rule out the single-minus amplitudes."* ## [20:56] How ChatGPT helped solve a year-long physics puzzle Strominger, Guevara, and Skinner had understood for about a year that the textbook argument has a loophole: when particles are collinear (exactly aligned in momentum), the standard dimensional-analysis reasoning fails, and single-minus amplitudes can be non-zero. But computing what those non-zero amplitudes equal had eluded them. Lupsasca invited Strominger to visit OpenAI and work on it with AI. The week before Strominger's flight, Lupsasca began using ChatGPT Pro. By the time Strominger landed, they had the answer. > *"Using ChatGPT we solved the problem before he even got off the plane."* ## [23:02] Complexity of manual calculations in physics Lupsasca shows the audience a concrete illustration of the difficulty: the six-point single-minus amplitude, worked out by hand by Alfredo Guevara, is a sum of 32 terms each of which is itself a product of four complicated factors. The number of terms grows factorially with the number of particles n — super-exponential growth. This is the messy representation that the group had been staring at for a year, seeking the analog of the elegant Parke-Taylor formula. > *"By the time you get to six terms, it explodes in your face."* ## [26:12] The history and mechanics of Feynman diagrams Feynman diagrams are a visual language introduced by Richard Feynman to organize perturbative QFT calculations: diagrams represent possible intermediate histories of a scattering process, and the full amplitude is a sum over all of them. Diagrams are organized by number of vertices (interaction points); each additional vertex is suppressed by the coupling constant, so tree diagrams (fewest vertices) dominate. Loop diagrams — where intermediate particles are created and annihilated — contribute smaller corrections. The combinatorial explosion of tree diagrams is the root cause of factorial growth. > *"In principle, there are infinitely many pictures to sum over."* ## [27:44] The Parke-Taylor formula and the quest for simplification In the 1980s, Parke and Taylor computed the "maximally helicity violating" (MHV, or double-minus) gluon amplitudes through a heroic Feynman diagram expansion. Despite the factorial number of terms, everything canceled to leave a single compact formula — the Parke-Taylor formula — that fits in half a line. Strominger, Guevara, and Skinner spent a year looking for the analogous compact formula for the single-minus case. Their search stalled at the level of the messy Feynman representation. > *"Andy, Alfredo and David spent the last year chasing the analog of the Parke-Taylor formula, the very simple answer that was obtained in the '80s for the double minus amplitudes."* ## [31:26] Using ChatGPT to find the simplification in the special phase space region When the five-point single-minus amplitude was fed to ChatGPT Pro, the model identified a special subregion of phase space (where one particle's frequency has opposite sign) in which the amplitude simplifies from eight terms to a product of just three. This appears not to have been a known fact; the model wrote Python code and tested thousands of possibilities to deduce it. Moving to the six-point amplitude (Guevara's hand calculation), ChatGPT simplified 32 terms to a product of 4. It then conjectured the general n-point formula — with only linear growth in the number of terms, the best possible behavior. GPT-5.2 Pro guessed the formula but could not prove it. > *"The formula that it proposed, instead of having this factorial growth... here it's actually linear. So if you double the number of particles, you only double the number of terms."* ## [38:07] Proving the formula from scratch to ensure validity To obtain a proof, Lupsasca used an internal OpenAI model with extended reasoning. He gave it the problem cold — without the conjectured formula — and asked it to find the general answer in the special phase-space region. After 12 hours of computation, the model independently rediscovered the same formula and produced a complete three-step proof. The proof constitutes the bulk of the published paper. The team kept the AI attribution to one paragraph, framing the paper as a physics result that stands on its own merits. > *"We gave it the whole problem from scratch... and it came back with the same formula which we had not given it. So it rediscovered the correct formula. But this time it also found the proof."* ## [41:00] Determining the scientific impact and future research Asked to compare the result to the Parke-Taylor formula, Lupsasca is candid that scientific impact is only assessable decades later, but argues the result is genuinely surprising and should open a line of attack toward deeper questions in quantum gravity. The conversation pivots naturally to the second paper. > *"I think the true value of a paper can only be assessed decades into the future based on how much future work it leads to and what developments it opens up."* ## [42:27] Introduction to the second paper on graviton amplitudes Gravitons are the hypothetical quanta of gravity — the spin-2 force carrier analogous to the spin-1 photon (electromagnetism) and gluon (strong force). Unlike gluons, gravitons have never been directly detected, but they are central to quantum gravity theory. The second paper, "Single-Minus Graviton Tree Amplitudes Are Non-Zero," shows the same loophole applies to gravity and that a compact formula extends there too — despite gravitons being mathematically more complex than gluons. > *"We wrote this paper which is called single minus graviton tree amplitudes are non-zero. So it's the same title almost, except with graviton instead of gluon."* ## [45:41] Defining particles, irreducible representations, and symmetry Lupsasca sketches the modern QFT definition of a particle (an irreducible representation of the Poincaré group, classified by Wigner according to mass, spin, and charge) and explains why gravitons are spin-2 while gluons and photons are spin-1, making graviton polarization data twice as rich. Crucially, the second paper was complete within three days of the first going public — most elapsed time was spent verifying correctness, not computing. > *"Most of the time was spent verifying the answer, not writing, which is insane, actually, if you take a step back."* ## [47:46] How GPT Pro generalized the research to gravity For the graviton paper, no internal model was needed — the publicly available ChatGPT GPT-5.2 Pro sufficed. Lupsasca provided the gluon paper as context plus two paragraphs describing the key mathematical changes, then said "Good luck. You're a brilliant theoretical physicist." Over a 110-page exchange, the model worked through the graviton calculation — applying the directed matrix tree theorem, a piece of known combinatorics that neither Lupsasca nor collaborators had thought to invoke — produced correct intermediate results, and wrote a draft paper very close to the final arXiv version from section 3 onward. > *"It's a real solid result in quantum gravity that was done pretty much completely by an AI with human steering it and asking kind of the right questions."* ## [53:57] The epistemological shift: Is this a new way of doing physics? The hosts raise the central epistemological question: if an undergraduate with domain knowledge and good prompting could have done this, what does graduate training mean now? Lupsasca agrees this is the hardest open question facing academia. He notes that arduous calculation trains not just skill but self-confidence, that the gap between coursework and the research frontier is growing, and that many "easy" problems professors once assigned to students are now solvable by AI in minutes. He offers two concrete ways AI has already changed his own workflow: dramatically reducing time spent confused between steps, and enabling parallel AI scouts that explore multiple research directions simultaneously. > *"With AI, actually, you can launch 10 instances of chat and have each one try a different route and send it as a scout that moves very fast into the unknown."* ## [59:27] The use of AI as a 'scout' for research directions Lupsasca elaborates on the scout metaphor: rather than carefully mapping a route from A to C before committing to it, a researcher can now dispatch many AI "scouts" in parallel, get rapid feedback on which directions are promising, and redirect human attention accordingly. Even when a scout makes errors, its signposts reduce orientation cost for the human following. This constitutes a qualitatively new mode of research — one where the bottleneck shifts from calculation to judgment about which directions matter. > *"Even if ChatGPT doesn't always get everything right, just kind of having a scout that signposts some key steps along the way that you can use to anchor your own movement is extremely helpful."* ## [61:44] The role of 'taste' and collaboration with AI The hosts push on the problem of "taste" — the ability to identify which questions are at the productive edge of knowledge. Lupsasca argues that working effectively with ChatGPT requires the same skill a professor develops advising students: knowing what question to give, at what level of detail. "Taste" — knowing where the frontier is and which questions there are tractable — is the last skill to develop and the one AI currently lacks. AI is, he says, like an extremely technically skilled graduate student: given a sharp, well-posed question, it can do incredibly hard computations correctly, but it does not yet know which question to ask. > *"The difference between a good physicist and a great physicist is knowing what is the right question to ask — that is actually the hardest part of being a scientist."* ## [70:23] Personal evolution from AI skeptic to resident scientist Lupsasca recapitulates his personal arc: skeptic → converted by o3 (which solved in 11 minutes a calculation that would have taken him days) → "AI-pilled" by GPT-5 (which reproduced, in 30 minutes, his best published result on black hole Love numbers and tidal symmetries — a paper whose training cutoff predated its arXiv release) → now resident scientist at OpenAI. He notes that no competing model at the time could match GPT Pro on that calculation. > *"In under 30 minutes, with one hint... it completely solved this problem, which is one of the nicest calculations that I've ever done."* ## [72:46] Solving a black hole perturbation problem with GPT-5 Lupsasca details the "Move 37" moment that converted him: his paper "Why Is There No Love in Black Holes?" establishes new symmetry generators for perturbations of a Kerr black hole (explaining why black hole Love numbers — tidal response coefficients, named after mathematician Augustus Love — are exactly zero). When GPT-5 Pro was first given the full problem cold, it failed. But after being primed with the simpler flat-space warm-up (a 200-year-old known result), it then solved the full Kerr black hole problem in 18 minutes. > *"GPT-5 was able to reproduce one of my hardest calculations, which I think the number of people in the world that could do that you could count on your hands."* ## [76:34] Discussing whether AI can make original, conceptual leaps The hosts ask whether AI is doing genuine recombination versus true creative leaps. Lupsasca cites Terry Tao, who has not yet seen an AI proof that cannot be traced to an obscure reference. But Lupsasca has been impressed and frames the distinction as one of degree rather than kind — humans may also be recombination machines. He believes continued scaling will produce feats of insight that look like creativity, and notes OpenAI is actively working on enabling models to take bigger, more out-of-distribution leaps suited to scientific discovery. > *"I'm not sure there's a qualitative difference. I think it's just a matter of degree — as we continue scaling the capabilities, I don't see why it's going to stop."* ## [80:09] Challenges of 'AI slop' and the future of academic publishing With models now capable of turning out a physics paper in 30 minutes when properly steered, the arXiv preprint server is being flooded with submissions. Lupsasca distinguishes legitimate use (expert steering + careful verification) from "AI slop" — poorly prompted outputs submitted without adequate checking. His proposed response: raise the bar rather than increase volume. The single-minus amplitude papers open a clear line of attack toward genuine quantum gravity questions; the goal should be to pursue harder problems, not to publish incrementally. > *"Instead, I think now that we have this new tool that gives us AI superpowers, I think we should just raise the bar for what it means to write a good paper."* ## [83:13] The bottleneck of writing academic papers Asked what single bottleneck he would remove, Lupsasca nominates the paper-writing process itself — finding it increasingly strange that researchers use AI to do calculations, compress results into a static paper, and then readers feed that paper back into AI to understand it. He envisions interactive, LLM-embedded papers as a plausible future. He also identifies two missing capabilities in current models: (1) the spark of creativity to identify the next important question, and (2) reliable self-verification, so that the onus of checking long AI-generated proofs does not fall entirely on humans. > *"Maybe some kind of interactive paper which lives in some LLM. Maybe your whole paper is some ChatGPT page... I think we're going to head in that direction."* ## [90:19] Final takeaways and looking ahead to the next year Lupsasca's closing message: pay attention. The trajectory from "useful for email" to "solves open problems in quantum gravity" has taken roughly 18 months. Models are solving open problems that expert communities spent years on. Extrapolating forward, with more scaling already in the pipeline, the next 6 to 12 months should bring further surprises. The right posture is excitement, careful verification, and a commitment to pursuing harder problems. > *"If you just extrapolate that into the future, imagine where we're going to be in 6 months or a year — I think it's kind of surreal to live through this time, but it's really happening."* ## Entities - **Alex Lupsasca** (Person): Theoretical physicist, Vanderbilt University professor and OpenAI resident scientist; 2024 New Horizons Breakthrough Prize and IUPAP Young Scientist Award winner; expert in black hole physics and scattering amplitudes. - **Andrew Strominger** (Person): Harvard professor and Lupsasca's former PhD advisor; pioneer of celestial holography; co-author of both single-minus amplitude papers. - **Alfredo Guevara** (Person): Postdoctoral researcher at the Institute for Advanced Study (IAS); performed the foundational hand calculations underpinning the AI-assisted breakthrough. - **David Skinner** (Person): Professor at Cambridge University; co-author of the single-minus gluon amplitude paper. - **Terry Tao** (Person): Fields Medal-winning mathematician at UCLA; referenced regarding the question of whether AI proofs involve genuine creativity. - **Scattering Amplitudes** (Concept): Complex-valued functions in quantum field theory encoding probabilities for particles to scatter; the central mathematical objects of both papers discussed. - **Single-Minus Gluon/Graviton Amplitudes** (Concept): Tree-level scattering amplitudes where all but one particle have positive helicity; previously assumed zero in textbooks but shown non-zero in a collinear phase-space region. - **Parke-Taylor Formula** (Concept): Compact closed-form result for maximally helicity violating (MHV, double-minus) gluon amplitudes derived in the 1980s; the template whose analog was sought for single-minus amplitudes. - **Feynman Diagrams** (Concept): Diagrammatic technique to organize perturbative QFT calculations; individual diagrams represent distinct intermediate-particle histories whose amplitudes are summed. - **Love Numbers** (Concept): Coefficients encoding tidal deformability; famously vanish for black holes, a fact connected to hidden symmetries studied in Lupsasca's "Why Is There No Love in Black Holes?" paper. - **Celestial Holography** (Concept): Research program exploring symmetries of quantum gravity via scattering amplitude structure; motivates studying graviton amplitudes. - **OpenAI** (Organization): AI research company where Lupsasca serves as resident scientist; developer of GPT-5 and the internal extended-reasoning model used for the amplitude proof. - **arXiv** (Organization): Open-access physics and mathematics preprint server; mentioned in the context of AI-generated "slop" flooding submissions. - **GPT-5 / ChatGPT Pro** (Software): OpenAI's frontier language model used as the primary AI tool in both amplitude papers; capable of extended reasoning steps of 20-34 minutes per prompt.

#theoretical-physics#quantum-field-theory#gpt-5
Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!
1:58:11
EN/ZH
Watch with Captions
The Diary Of A CEOhá 22 dias

Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!

NYU Stern professor and serial entrepreneur Scott Galloway delivers a two-hour reality check on artificial intelligence: the doom-and-gloom predictions from AI CEOs are largely fundraising theatre, yet the technology poses a genuinely insidious risk that almost nobody is discussing — an epidemic of loneliness. Galloway argues that AI primarily benefits the already-wealthy, that tech leaders should not be trusted to self-regulate, and that the most valuable human skill in the AI era is not coding or Mandarin — it is the ability to endure rejection. The conversation weaves through geopolitics, investing, the masculinity crisis, and what it means to find purpose, closing with a raw reflection on grief and fatherhood. ## [00:00] Intro Host Stephen introduces Scott Galloway against a backdrop of rapid AI development and unsettling quotes from tech CEOs predicting total job replacement. Galloway opens with his central thesis: the two greatest brand collapses of the past 18 months are the United States' global reputation and artificial intelligence itself — both victims of overpromising and poor trust management. He signals that he is an AI optimist at the macro level, but insists the people building it do not have the public's best interests at heart. > *"These techs, they do not have our best interests at heart."* ## [02:45] What's Actually True About AI Galloway reveals a striking data point: approval of AI is directly correlated with income. Only households earning over $200,000 per year hold a net-positive view of the technology, because they benefit through rising portfolios and are the heaviest users. Everyone else sees higher electricity bills, no equity stake in the companies, and dismissive comments from leaders like Sam Altman telling people to stop complaining about energy costs. The AI brand, he argues, has shifted in 18 months from "scary but optimistic" to "scary and only good for the already rich." > *"Your view of AI is directly correlated to your wealth. The only cohort that has a positive rating of AI is people making over $200,000."* ## [05:00] Are AI CEOs Exaggerating The Future To Raise Billions? Galloway lays out the economic logic behind AI catastrophizing. These companies sit on astronomical valuations that can only be justified if either (a) a trillion dollars in incremental revenue materialises from AI-powered products, or (b) there is a massive wave of labour cost savings. Because option (a) is not yet visible — he sees no AI-driven products at meaningful scale — the CEOs amplify option (b), painting vivid pictures of job destruction to justify the efficiency gains enterprises need to believe in. He calls some of the doom talk "thinly veiled fundraising," noting that founders catastrophize and then take secondaries and leave for Santorini. > *"The catastrophizing is nothing more than a thinly veiled attempt to say my technology is so devastating that it's going to shift society and you should invest at this crazy valuation."* ## [09:00] What Would Prove The AI Skeptics Wrong? Asked where he could be wrong, Galloway is specific: if unemployment rises to 20% even temporarily, history shows civil unrest follows regardless of eventual job recovery. He points to radiologists and coders as cases where AI has augmented rather than eliminated roles — new coder job listings are up 11% year-on-year. His benchmark for being wrong is sustained destruction outpacing creation fast enough that the recovery "V" triggers social breakdown before the other side is reached. > *"At 20% unemployment, especially among youth, especially young men tend to get very angry and take to the streets."* ## [11:05] Could AI Move Too Fast For Society To Handle? The conversation turns to pace of change. Galloway uses the host's own media empire — 220 hires in 24 months — as a live counter-example to the apocalypse narrative. He notes a structural inversion: for the first time in decades, unemployment among non-college graduates is lower than among college graduates because AI data centres are driving a boom in trades. He praises the entrepreneurial wave unlocked by AI tools and flags Denmark's 2% GDP commitment to retraining versus America's inadequate equivalent as the real policy failure. > *"AI is not going to take your job. Someone who understands AI is going to take your job."* ## [16:05] What Happens When AI Combines With Robots? Galloway addresses Elon Musk's Optimus robot predictions and the convergence of physical automation with AI cognition. His 2026 stock pick is Amazon, which already holds more industrialised robots than the rest of the US combined and plans to double its retail operation by 2032 without additional headcount. He is sceptical of domestic humanoid robots but takes seriously the military application of weaponised autonomous systems as a genuinely dark unknown frontier. > *"Amazon is saying they're going to double their largest business, which is their retail business by 2032 without an incremental hire using robotics, industrialised robots."* ## [19:05] Is Elon Musk Selling Vision or Reality? Galloway separates Musk the innovator from Musk the stock promoter. He calls Starlink the best tech product of the past several years and credits Musk with inspiring the EV race. But Tesla should trade at 30x earnings, not 150x, and capital will migrate to SpaceX when it IPOs at a projected 90–110x revenues. The core insight: the modern CEO's job has inverted from underpromise-and-overdeliver to overpromise-and-underdel in order to access cheap capital and pull the future forward. > *"The key attribute of an innovator right now is storytelling — to make sure the promise is way ahead of the performance such you can access cheap capital and pull the future forward."* ## [24:05] Which Jobs Are First To Disappear In The AI Shift? Long-haul trucking is Galloway's clearest near-term casualty: autonomous trucks can run the 10 pm to 4 am window and trucking is the largest single employer of non-high-school-graduate males in America. Legal work at the junior associate level is already being displaced — he now routes contracts through two competing LLMs rather than a $400–$2,000 law firm review, projecting a third reduction in his annual legal spend. The pattern he observes is multiplication: one AI-fluent analyst replaces five, yet the resulting EBITDA funds expansion that creates new jobs elsewhere in the ecosystem. > *"AI is not going to take your job. Someone who understands AI is going to take your job. So have a second screen — always have a second screen open that has nothing but AI on it."* ## [30:05] What Skills Will Actually Matter In The Future? Storytelling tops Galloway's list — the ability to look at data, construct a narrative arc, and communicate it compellingly across every medium. He holds up Jeff Bezos's 1997 shareholder letter, Jensen Huang's stadium keynotes, and Alex Karp's walk-and-talk earnings calls as models. Relationships are the second pillar: as technology converges and products commoditise, the differentiator is whether people want to work with you. He is honest that predicting specific skills is unreliable — private schools doubled down on computer science and Mandarin a decade ago, and neither bet has paid off as expected. > *"The enduring skill is storytelling — your ability to look at data, create a narrative arc and then communicate that story in a compelling way via all the different mediums."* ## [33:45] Are Young People Losing The Ability To Handle Rejection? Galloway identifies the erosion of rejection-tolerance as the most underrated threat facing young people, especially young men. Frictionless online relationships offer a simulacrum of connection without the emotional labour of real-world risk. He mentors young men by assigning deliberate rejection exercises: approach a stranger for friendship, ask someone out for coffee. The goal is not the yes; it is learning that a no is survivable. He argues his own superpower is simply the willingness to mourn failure and try again. > *"The secret to my success is rejection. I ran for sophomore, junior, and senior class president of my high school. I lost all three times."* ## [39:55] Can You Trust The People Building AI? A sharp cultural critique: America has replaced declining religious institutions with tech idolatry, crowning each new CEO as a secular Jesus Christ. Steve Jobs, then Zuckerberg, then Sam Altman, now Dario Amodei — each is briefly positioned as the good guy before completing the villain's journey. Galloway's argument is not that these people are evil but that they are doing exactly what capitalism demands: maximising earnings regardless of wider harm. The answer is not more trustworthy tech founders; it is competent elected officials who regulate them. > *"Can we trust Sam Altman? No. But we shouldn't need to trust him. We should be able to trust that we have smart elected officials that will regulate these companies."* ## [44:50] Are Tech Leaders Quietly Preparing For The End? Galloway reveals that roughly one in three billionaires maintain a "go bag" — a fully funded escape plan, typically a private jet to Auckland and a fortified New Zealand bunker. He calls this nihilism: the ultra-wealthy have sequestered themselves so completely from ordinary infrastructure — private aviation, concierge medicine, private security, elite schools — that they are no longer invested in the health of society. Their disproportionate political donations are therefore not directed at making the system work for everyone. > *"The problem is the 0.1% are not invested in the health of America. They don't have to put up with TSA lines. They fly private."* ## [52:00] Do Some AI Leaders Believe The Risk Is Worth It? A secondhand but chilling account: a source with direct access to an AI CEO described someone who genuinely believes there is a roughly 7–10% chance their work ends in catastrophe, but considers being the person who summoned this new intelligence consequential enough to proceed regardless. Galloway connects this to widening inequality — the delta between middle-class and ultra-wealthy life has expanded so dramatically across healthcare, travel, and security that the incentives of the 0.1% are structurally misaligned with the rest of society. > *"The bottom 99% of Western societies are essentially being optimised and monetised to make the life of the 1% just unbelievable."* ## [58:04] Ads Sponsored segments for LinkedIn Hiring Pro and Function Health. ## [60:05] Could AI Make Us More Human? Galloway offers a surprising positive: unlike social media algorithms that push users toward political extremes, AI models appear to moderate views by seeking statistical medians. He sees genuine value in AI companionship for isolated elderly users. But he returns to his central fear: the biggest downside of AI is not weapons, not election contamination, not even income inequality — it is loneliness. Men aged 20 to 30 are spending less time outdoors than prison inmates, and 42% of men aged 18 to 24 have never asked a woman out in person. > *"The biggest downside of AI in my view is loneliness. AI is convincing people they can have a reasonable facsimile of life on a screen with an algorithm."* ## [65:00] What Happens When AI Becomes Your Closest Companion The conversation shifts to the Iran conflict as a case study in what happens when strategic incompetence meets operational excellence. Galloway credits the initial military strike as tactically credible but argues the absence of Congressional briefing, Gulf ally coordination, and clear exit objectives has produced a quagmire — and notes Iran's IRGC-produced propaganda is outperforming US information operations in the global war of memes. > *"The problem with wars is that the enemy has a say. And all the enemy needs to do — whether it's the Viet Cong or the Taliban or the IRGC — is survive, and they win."* ## [70:00] The Hidden Trade-Off Between Convenience And Real Relationships Galloway diagnoses America's Iran strategy as a product of a gutted diplomatic corps. When senior officials fly to Islamabad expecting a deal, 97% of the preparatory work that career diplomats would normally complete simply has not happened. The IRGC understands the game better: all they need to do is survive, and every day the conflict continues they look like the underdog who stood up to the superpower. His most optimistic scenario is a multinational force enforcing freedom of navigation through the Strait of Hormuz. > *"Do you know what we have done in the US to our diplomatic corps? We've absolutely gutted it."* ## [75:00] Why Loneliness Could Explode US stock markets hit an all-time high during active Middle East conflict — a sign that the wealthy are so insulated from geopolitical risk that war no longer registers in asset prices. The top 10% account for 50% of consumer spending, and that cohort does not care if gasoline hits six dollars a gallon. The pain is outsourced to lower-income households and oil-dependent nations. Galloway frames this dissociation from shared risk as one of the most dangerous structural features of contemporary inequality. > *"We've outsourced the downside of war to less wealthy nations who are very oil dependent, to the Gulf, which is incurring damage here."* ## [79:26] The Real Reason Human Connection Might Become More Valuable Extended discussion of AI market valuations and the historical pattern of infrastructure overbuild. Every great infrastructure boom — railroads, electrification, the internet — ended in a crash, and AI capex now constitutes a significant share of US GDP growth. Galloway argues there is a one-in-three chance AI ends up like jet aviation or vaccines: transformative for humanity but impossible to monetise exclusively for a small group of companies, because open-weight Chinese models could commoditise the entire stack through "AI dumping." > *"AI puts AI out of business. And that is if you look at the convergence of the technologies, all the models are converging."* ## [85:00] What This Means For The Next Generation Galloway argues that a market correction might actually benefit younger generations by making assets affordable again. He flags GLP-1 drugs as his technology pick over AI in terms of real-world human impact. His personal investment philosophy at age 61: aggressive diversification, no single position above 3% of net worth, rotation out of overheated US markets into Europe and Latin America. For young people, the only wealth-building path he trusts is compound interest through low-cost index funds, with money automatically invested before it can be spent. > *"The only answer I have is slowly — find out a way to start saving when you're a teenager, 25 bucks a month, then in your 20s 100, then 500."* ## [90:00] How Power, Politics, And AI Are Becoming Intertwined Drawing on his experience losing 70% of New York Times ad revenue in 60 days during 2008, Galloway warns that younger entrepreneurs have never experienced a true recession. He argues that the political class has systematically bailed out asset-owning baby boomers — COVID relief, corporate bailouts, perpetual market support — while denying younger generations the chance to buy assets at distressed prices. Recessions historically created entry points; that mechanism is now deliberately suppressed. > *"Your generation really doesn't know what a recession looks like. Like, everything stops."* ## [95:00] The Dangerous Gap Between Technology And Regulation Personal finance advice combined with a reflection on the limits of prediction. Galloway's investment rule for young people: put money in yourself first, then in relationships, then in diversified index funds. He is honest that picking winning sectors is largely futile, and that anyone claiming certainty does not know. His own investment in Pokemon cards with his son illustrates that the best investments compound in non-financial ways — relationships and shared experience accrue value that conventional ROI cannot measure. > *"The only answer I have is slowly and it requires some discipline. Save money, diversify, compound interest, invest in relationships early."* ## [100:00] What Happens If Governments Can't Keep Up With AI Asked what a 33-year-old should know that a 61-year-old has learned, Galloway offers three lessons: be humble in success because much of it is luck; forgive yourself in failure because much of it is also circumstance; and invest aggressively in relationships in your 30s, because he spent his prime years professionally focused and nearly ended up isolated. He frames every major disappointment as something people later regret not the thing itself but how upset they allowed themselves to be. > *"Nothing's ever as good or as bad as it seems. Be humble when you're successful. And forgive yourself and realise this will pass."* ## [105:00] The Future Of Work, Power, And Who Really Wins Fatherhood as purpose. Galloway confesses he did not want children and did not fall in love with his sons immediately after birth. What changed his view was discovering that fatherhood is the one investment where a positive financial return is structurally impossible — and that is precisely what makes it purposeful. The same logic applies to any cause large enough to demand more than you can ever get back: veterans, activism, caregiving. He closes with frank advice on partnership, timing, and the liberation of having no choice but to lean into your children's interests. > *"Finding your purpose is finding that thing that you can never get a real positive return on. I will never get a positive return for my children."* ## [110:00] Why The Biggest AI Risks Aren't What You've Been Told The final chapter opens with Galloway's emotional description of his sons' contrasting personalities — one a mirror of himself, one a "different species" he observes with fascination. He discusses his book *Notes on Being a Man*, framing it as letters he hopes his boys will read in 30 years. The closing question — the biggest setback and its lesson — draws the most emotionally raw answer of the episode: his mother's death. He says he has not gotten over it and does not want to, because grief is the receipt for love, and he hopes his sons will one day feel the same about losing him. > *"My mother dying. And you can never tell your parents how much you love them too much. The reverse of love is grief."* ## Entities - **Scott Galloway** (Person): NYU Stern Professor of Marketing, serial entrepreneur, author of *The Four*, *The Algebra of Happiness*, and *Notes on Being a Man*; host of the Prof G Pod and Pivot podcast - **Sam Altman** (Person): CEO of OpenAI; used as the primary case study in the recurring tech-leader idolisation and disillusionment cycle - **Elon Musk** (Person): CEO of Tesla, SpaceX, and xAI; discussed as visionary storyteller whose real products (Starlink, SpaceX) are transformative but whose timelines consistently overshoot - **Dario Amodei** (Person): CEO of Anthropic; cited as the current tech industry "good guy" before the inevitable villain turn - **Jensen Huang** (Person): CEO of Nvidia; held up as a model of storytelling-driven CEO performance via stadium keynotes - **OpenAI** (Organization): Developer of ChatGPT; primary subject of fundraising-hype and overvaluation critique - **Anthropic** (Organization): AI safety company; referenced as beneficiary of the "latest hero" investor narrative - **SpaceX** (Organization): Musk's rocket company; flagged as likely destination for capital migrating away from Tesla at IPO - **Amazon** (Organization): Galloway's top large-cap stock pick for 2026 due to robotics leadership and warehouse automation scale - **Tesla** (Organization): Great car company trading at an unjustifiable multiple that will correct when SpaceX IPOs - **GLP-1 drugs** (Concept): Weight-loss and metabolic medications (Ozempic/Wegovy class) that Galloway argues will create more real-world human impact and shareholder value than AI - **AI dumping** (Concept): Galloway's term for China flooding the US with cheap open-weight AI models to undermine American AI valuations and destabilise the economy - **Go bag / billionaire nihilism** (Concept): The practice among roughly one-in-three billionaires of maintaining funded escape plans as a symptom of disengagement from shared societal wellbeing - **Rejection tolerance** (Concept): Galloway's candidate for the most underrated skill of the AI era — the willingness to hear no, mourn briefly, and try again

#ai#economics#future-of-work
Robotics' End Game: Nvidia's Jim Fan
20:03
EN/ZH
Watch with Captions
Sequoia Capitalhá 26 dias

Robotics' End Game: Nvidia's Jim Fan

Jim Fan, lead of Nvidia's embodied AI research, outlines the transition from language-centric models to World Action Models (WAM) that simulate physical reality. He details a roadmap toward the 'Physical Turing Test' and autonomous factories by 2040, driven by video pre-training and human egocentric data scaling. ## [00:00] Introduction Host Sonya Huang introduces Jim Fan, who leads Nvidia's embodied autonomous research group. Fan reflects on his early days as an intern and the excitement surrounding the future of robotics. > *robots are just one of the most thrilling things that's going to happen.* > *[0, 12]* ## [00:30] DGX One Origin Story Jim Fan recounts the 2016 delivery of the first DGX-1 by Jensen Huang to Elon Musk and the OpenAI team. He highlights how this moment catalyzed the deep learning revolution that led to current AI breakthroughs. > *If you believe in deep learning, deep learning will believe in you.* > *[1, 26]* ## [01:42] The Great Parallel Fan proposes 'The Great Parallel,' applying the successful LLM scaling playbook to robotics. Instead of predicting the next token in a string, the goal is to predict the next physical world state through simulation and alignment. > *instead of simulating strings can we simulate next physical world state?* > *[2, 56]* ## [03:31] Robotics Endgame Setup The strategy for achieving the robotics end game is divided into two primary pillars: model strategy and data strategy. Fan notes that while LLMs are in their final 'boss fight,' robotics is just beginning its scaling journey. > *It boils down to two things, model strategy and data strategy.* > *[3, 32]* ## [03:39] Why VLA Falls Short Visual Language Action (VLA) models are criticized for being 'head-heavy' on language while lacking a fundamental grasp of physics and verbs. Fan argues they are better at encoding static knowledge than dynamic physical interaction. > *VLAs are great at encoding knowledge and nouns, but not so much at physics and verbs.* > *[4, 8]* ## [04:32] Video World Models Fan explains how video models like VEO3 learn internal physics—such as gravity and buoyancy—simply by predicting pixels at scale. These models act as simulators that can solve mazes and plan visual sequences internally. > *Physics emerge by predicting the next blob of pixels at scale.* > *[5, 15]* ## [06:09] DreamZero World Action Nvidia introduces 'Dreamer' and World Action Models (WAM), which jointly decode future world states and motor actions. This allows robots to perform zero-shot tasks by 'dreaming' the correct motion sequence before executing it. > *Dreamer jointly decodes the next world states and next actions.* > *[6, 29]* ## [07:46] Scaling Data Collection To overcome the physical limits of teleoperation, Fan discusses Universal Manipulation Interfaces (UMI) and exoskeletons like Dex-UMI. These tools allow humans to collect high-dexterity data directly without the robot being in the loop. > *we're able to break the curse of 24 hours per robot per day* > *[10, 6]* ## [11:06] EgoScale And Scaling Laws Fan introduces Ego-Exo, a policy trained on 21,000 hours of human egocentric video. This research uncovered a neural scaling law for dexterity, showing a mathematical relationship between pre-training volume and robot performance. > *we discovered this neural scaling law for dexterity.* > *[12, 39]* ## [15:39] DreamDojo And The Roadmap Fan outlines the roadmap to 2040, including the Physical Turing Test and 'lights-out' factories. He introduces Dream Dojo, a neural simulator that replaces classical physics engines with data-driven world models. > *I can say with 95% certainty that we'll get to the end of the end game... by 2040.* > *[19, 19]* ## Entities - **Jim Fan** (person): Lead of the embodied autonomous research group at Nvidia. - **Nvidia** (organization): The technology company developing the hardware and software for the robotics end game. - **Jensen Huang** (person): CEO of Nvidia, mentioned for delivering the first DGX-1 to OpenAI. - **OpenAI** (organization): The research lab that received the first DGX-1 for deep learning development. - **DGX-1** (product): The world's first deep learning supercomputer delivered in 2016. - **VEO3** (model): A video world model capable of simulating physics and visual planning. - **Dreamer** (model): A policy model that predicts future world states and actions simultaneously. - **Ego-Exo** (project): A robotics pre-training framework using large-scale human egocentric video data.

#robotics#nvidia#world-models
Andrej Karpathy: From Vibe Coding to Agentic Engineering
29:49
EN/ZH
Watch with Captions
Sequoia Capitalhá 27 dias

Andrej Karpathy: From Vibe Coding to Agentic Engineering

Andrej Karpathy explores the paradigm shift from traditional programming to Software 3.0, where LLMs act as programmable computers driven by context. He details the transition from 'vibe coding' to 'agentic engineering,' emphasizing that while AI handles execution, human taste and understanding remain the ultimate bottlenecks. ## [00:00] Introduction Stephanie Zhan introduces Andrej Karpathy, highlighting his foundational work at OpenAI and Tesla. She notes his unique ability to simplify complex AI shifts and introduces the concept of vibe coding. > *He has a rare gift of making the most complex technical shifts feel both accessible and inevitable. [00:22]* ## [00:44] Feeling Behind as a Coder Karpathy describes a turning point in December 2023 when agentic tools began producing perfect code without manual intervention. This shift led him to adopt vibe coding, trusting the AI to handle complex workflows autonomously. > *I just start to notice that with the latest models the chunks just came out fine. [01:29]* ## [02:28] Software 3.0 Explained Karpathy defines Software 3.0 as a paradigm where the LLM acts as a programmable computer and the context window serves as the primary programming lever. This follows Software 1.0's manual rules and Software 2.0's data-driven weight training. > *Software 3.0 is kind of about your programming now turns to prompting and what's in the context window is your lever. [03:20]* ## [03:44] Agents as the Installer Using the installation of OpenClaw as an example, Karpathy explains how agents replace rigid bash scripts with intelligent, environment-aware execution. This approach allows the AI to debug and adapt to specific system requirements autonomously. > *The agent has its own intelligence that it packages up and then it kind of like follows the instructions. [04:29]* ## [04:49] Menu Gen vs Raw Prompts Karpathy contrasts his custom-coded MenuGen app with raw prompts to models like Gemini, concluding that many traditional software layers are now redundant. He emphasizes that AI can now perform general information processing that was previously impossible with structured code. > *The software 3.0 paradigm is a lot more kind of raw. It just your neural network is doing more and more of the work. [06:11]* ## [07:37] What’s Obvious by 2026 Looking toward 2026, Karpathy envisions neural computers that process raw video and audio directly. These systems would use diffusion models to generate dynamic user interfaces, potentially making traditional UI code obsolete. > *You could imagine completely neural computers... a device that takes raw videos or audio into basically what's a neural net. [08:22]* ## [09:41] Verifiability and Jagged Skills AI models develop 'jagged' capabilities, peaking in verifiable domains like math and code due to reinforcement learning rewards. Karpathy notes the paradox where a model can refactor a massive codebase yet fail simple logic. > *state-of-the-art models today will tell you to walk [to a car wash] because it's so close... This is insane. [11:36]* ## [13:39] Founder Advice and Automation Model performance is heavily dictated by the specific data distributions chosen by frontier labs. Karpathy advises founders to explore the 'circuits' of these models to understand their strengths or use fine-tuning to fill gaps. > *we are slightly at the mercy of whatever the labs are doing, whatever they happen to put into the mix. [12:57]* ## [15:46] From Vibe Coding to Agent Engineering While 'vibe coding' raises the accessibility floor, 'agentic engineering' focuses on maintaining professional quality. This discipline involves coordinating powerful but stochastic agents to accelerate development without sacrificing the engineering bar. > *agentic engineering is about preserving the quality bar of what existed before in professional software. [16:07]* ## [25:17] Agents Everywhere and Learning Karpathy advocates for agent-native infrastructure, expressing frustration with human-centric documentation. He argues that while thinking can be outsourced to AI, human understanding remains a critical bottleneck for directing agents. > *You can outsource your thinking, but you can't outsource your understanding. [28:10]* ## Entities - **Andrej Karpathy** (person): AI researcher and former Director of AI at Tesla and founding member of OpenAI. - **Stephanie Zhan** (person): Partner at Sequoia Capital and host of the discussion. - **Software 3.0** (concept): A paradigm where LLMs act as programmable computers via prompting and context. - **Agentic Engineering** (concept): The professional discipline of coordinating AI agents to maintain software quality. - **MenuGen** (project): An app Karpathy built to OCR and visualize restaurant menus, used as a case study. - **OpenAI** (organization): AI research company co-founded by Karpathy. - **Gemini** (ai-model): Google's LLM used in Karpathy's software comparison. - **Vercel** (organization): A cloud platform used by Karpathy to deploy projects.

#vibe-coding#software-3-0#ai-agents
Ivanka Trump: Aprendi Aos 9 Anos O Que a Maioria Nunca Aprende!
1:36:12
EN/ZH
Watch with Captions
The Diary Of A CEOhá aproximadamente 2 meses

Ivanka Trump: Aprendi Aos 9 Anos O Que a Maioria Nunca Aprende!

Ivanka Trump oferece um olhar sincero sobre sua vida, desde uma infância única moldada por pais famosos e intensa exposição midiática até sua impactante carreira nos negócios e no serviço público. Ela compartilha lições aprendidas com sua mãe, os desafios de construir confiança e como experiências marcantes como o divórcio dos pais e a tentativa de assassinato de seu pai fortaleceram sua resiliência. Trump também discute sua filosofia de intencionalidade, o poder de ser subestimada e sua jornada de crescimento pessoal através da maternidade e da terapia, culminando em seu trabalho movido por propósito com a Planet Harvest. ## [00:00] Por Que a Confiança Não Vem Fácil E O Que Isso Revela Ivanka Trump aprendeu cedo, particularmente durante o divórcio altamente divulgado de seus pais quando tinha nove anos, a ser cautelosa com relacionamentos insinceros devido ao constante escrutínio midiático e paparazzi agressivos. Sua mãe lhe ensinou o poder de ser subestimada e a importância de filtrar o "ruído" externo sob pressão. Embora inicialmente tenha desenvolvido um forte mecanismo de defesa contra confiar nos outros, desde então ela cultivou intencionalmente uma abordagem mais confiante para conexões mais profundas, aceitando os riscos inerentes. > *minha mãe me ensinou que ser subestimada não é algo ruim. Na verdade, é algo muito poderoso [00:22]* > *Na verdade, eu realmente me ensinei a confiar mais. [05:48]* ## [03:32] Quando Você Percebe Que É Diferente O Que Acontece Depois Ivanka Trump percebeu que sua vida era atípica desde muito jovem devido à constante atenção da mídia e escrutínio público, um fenômeno que ela contrasta com a exposição amplificada das redes sociais para crianças de hoje. Ela observa que seus pais fizeram esforços para protegê-la e a seus irmãos desse olhar público intenso. Ela prefere conversas aprofundadas a entrevistas frequentes. > *Acho que sempre houve muita atenção e escrutínio da mídia. Você vê, você experimenta isso muito cedo. [06:24]* > *nem todos, acho que a experiência que nossos filhos têm onde quer que vão as pessoas têm um dispositivo de gravação nas mãos [06:40]* ## [05:44] Como Sua Mãe Realmente Era Nos Bastidores Ivanka Trump descreve sua mãe, Ivana, como uma disciplinada ex-esquiadora nacional que incutiu o valor do esporte, levando Ivanka ao balé. Ela relembra uma memória incomum da infância de Michael Jackson assistindo à sua apresentação do Quebra-Nozes. Apesar dessas experiências extraordinárias, sua vida diária era fundamentada por sua avó materna, "Bubby", que proporcionava amor incondicional e o expressava através da culinária. > *minha mãe era uma esquiadora incrível... ela realmente acreditava na importância do esporte para cultivar disciplina [07:07]* > *Minha avó... realmente nos criou... ela me ensinou um tipo de amor incondicional e ternura [08:44]* ## [11:47] A Diferença Fundamental Que Moldou Quem Ela Se Tornou A criação de Ivanka Trump foi profundamente moldada tanto por sua avó carinhosa, "Bubby", que proporcionava amor incondicional e cuidados diários, quanto por sua mãe, Ivana, que serviu como modelo pioneira. Ivana exemplificou força, ambição e resiliência, demonstrando como perseguir objetivos profissionais enquanto era uma mãe amorosa. Ivanka esclarece que, apesar das carreiras ocupadas de seus pais, eles estavam presentes e a faziam sentir-se uma prioridade, com sua avó preenchendo o papel tradicional de cuidadora. > *Minha mãe foi uma pioneira incrível... um exemplo extraordinário para mim de força e resiliência e glamour e determinação e ambição. [11:57]* > *Nunca houve dúvida em minha mente de que eu era sua principal prioridade e que ele estava disponível para mim. [14:42]* ## [15:43] O Que o Divórcio de Donald e Ivana Trump Realmente Significou Para Ela O divórcio altamente divulgado de Donald e Ivana Trump, sobre o qual Ivanka soube por um jornal aos nove anos, a impactou profundamente. Ela lembra de sentir medo com o intenso escrutínio midiático e experimentar os medos normais de uma criança durante a separação dos pais. Esse período desafiador, que gerou mais manchetes do que o julgamento de O.J. Simpson, criou um vínculo único entre ela e seus irmãos. Mais tarde na vida, após o falecimento de sua mãe, Ivanka obteve uma compreensão mais profunda do caráter complexo de Ivana, moldado por sua criação na Checoslováquia comunista, desejando ter feito mais perguntas enquanto sua mãe estava viva. > *esse divórcio aparentemente gerou mais manchetes do que o julgamento de O.J. Simpson. [20:04]* > *o lado positivo para mim e meus irmãos foi que realmente nos unimos de uma forma diferente porque estávamos passando por isso juntos. [23:21]* ## [18:27] A Realidade de Ser Filha de Trump O Que as Pessoas Não Entendem Ser filha de Donald Trump significou navegar um intenso escrutínio público desde muito jovem, particularmente durante o divórcio de seus pais, que lhe ensinou uma cautela necessária sobre confiança. Desde então, ela aprendeu a "encontrar o sinal no ruído" e evitar engajamento combativo nas redes sociais, priorizando a paz interior. Ivanka observa a profunda autenticidade de seus pais e, embora ela aborde a comunicação de forma mais delicada, mantém um forte senso de identidade, guiada pela filosofia estoica, para viver autenticamente e resistir a pressões externas. > *Se eu não tivesse essa lição, não sei se seria forte. Me ensinou a não confiar em ninguém. [18:53]* > *Eu não revido porque não... acredito em gastar meu tempo e foco sendo combativa, entrando nessa arena particular e no turbilhão desagradável das redes sociais. [26:19]* ## [23:36] Como Encontrar a Si Mesma Cercada de Poder e Fama Cercada de poder e fama, Ivanka Trump encontrou seu senso de identidade através do crescimento pessoal intencional e da experiência transformadora da maternidade, que a "abriu por dentro" e aprofundou sua capacidade de amar. Ela enfatiza a importância crítica da autoconsciência para resistir a pressões externas e definir-se, em vez de "deixar a turba vencer". Ela aplica essa filosofia à sua parentalidade, fomentando a individualidade em seus filhos, e credita seus próprios pais por permitir dissidência respeitosa, permitindo-lhe ser fiel a si mesma. > *Se você não sabe quem é, a turba vence. [29:55]* > *Eles criaram um ambiente onde a dissidência era aceitável. [32:44]* ## [30:57] Por Que Ser Subestimada Se Tornou Sua Maior Vantagem Ivanka Trump aprendeu com sua mãe que ser subestimada pode ser uma vantagem poderosa. No início de sua carreira no mercado imobiliário, ela era frequentemente julgada erroneamente como filha de pais bem-sucedidos e como jovem mulher em uma indústria dominada por homens. Ela aproveitou essa percepção, usando-a como motivação para trabalhar mais e se preparar excessivamente, convertendo-a em benefício próprio contra aqueles que a subestimavam. > *minha mãe me ensinou que ser subestimada não é algo ruim. Na verdade, é algo muito poderoso [00:22]* > *Eu aproveitei esse tipo de medo, esse sentimento, e usei para me impulsionar. [35:06]* ## [32:59] O Que Ela Realmente Procura ao Contratar E Por Que Isso Importa Ao contratar, Ivanka Trump prioriza indivíduos com forte senso de identidade, iniciativa, bom julgamento e "inteligência de rua", pois essas qualidades inatas são difíceis de ensinar. Ela enfatiza a importância de trabalhar com "pessoas boas" em quem confia e respeita, considerando esses atributos fundamentais para relações de trabalho bem-sucedidas e dinâmica de equipe em geral. > *É muito difícil ensinar as pessoas, sabe, você pode ter uma pessoa brilhante, mas se ela não tem bom julgamento ou se não tem iniciativa, é muito difícil dar isso a ela. [38:15]* > *Não quero trabalhar com pessoas de quem não gosto, que eu não acho que são boas pessoas, porque não quero passar meu tempo com alguém em quem não confio ou que não respeito. [39:00]* ## [37:49] Por Que Ela Deixou a Moda Pelo Governo Apesar de uma prestigiosa oferta de emprego de Anna Wintour na Vogue ao se formar na Wharton, Ivanka Trump perseguiu sua paixão de toda a vida pelo mercado imobiliário. Ela posteriormente construiu uma marca de moda de sucesso, Ivanka Trump.com, que cresceu para quase US$ 800 milhões em vendas anuais. No entanto, ela tomou a decisão deliberada de encerrar esse negócio próspero para cumprir as regras de ética governamental quando aceitou o pedido de seu pai para servir em sua administração. Ela via essa oportunidade como um privilégio e dever inquestionável para com seu país, apesar dos significativos sacrifícios pessoais e profissionais. > *Estávamos fazendo cerca de US$ 800 milhões em vendas anuais quando encerrei tudo ao entrar no governo. [42:30]* > *Me sinto incrivelmente privilegiada por ele ter nos dado a oportunidade de servir um país que amamos tanto. [43:30]* ## [41:06] O Que Realmente Aconteceu Quando Trump Decidiu Concorrer A decisão de Donald Trump de concorrer à presidência em 2015 foi anunciada em uma reunião familiar em Bedminster, surpreendendo Ivanka com sua rapidez, apesar de suas ambições políticas de longa data, embora não articuladas, desde os anos 1980. Ela relembra um momento de pânico na infância aos 16 anos, temendo que ele concorresse, apenas para ser tranquilizada do contrário. Sua entrada na política presidencial foi um "ajuste radical" para a família, expandindo profundamente a visão de mundo de Ivanka além de sua "bolha" de Nova York e iniciando uma "jornada extraordinária" no serviço público. > *Lembro de uma vez pensar que era real. Eu tinha 16 anos e estava no internato e liguei para ele... 'Isso vai arruinar minha vida.' [51:48]* > *a campanha dele rasgou tudo para mim e eu percebi a bolha em que eu estava [48:02]* ## [46:23] Trump Concorrendo à Presidência O Que Mudou Tudo A decisão de Donald Trump de concorrer à presidência mudou fundamentalmente tudo para Ivanka, marcando um "ajuste radical" para toda a família. Sua entrada não convencional na política, contornando caminhos tradicionais de carreira, foi como "beber água de uma mangueira de incêndio". A campanha destruiu a "bolha" percebida de Ivanka em Nova York, expandindo profundamente sua visão de mundo e levando-a a abraçar o privilégio de servir seu país. > *Foi como beber água de uma mangueira de incêndio para todos nós. [47:08]* > *a campanha dele rasgou tudo para mim e eu percebi a bolha em que eu estava [48:02]* ## [48:52] Ads Este segmento apresenta um anúncio da Shopify, uma plataforma de e-commerce que simplifica a criação de lojas online, vendas em redes sociais e gerenciamento de operações com ferramentas de IA. Também promove o Pipe Drive, um CRM inteligente usado pelo apresentador, destacando seu painel visual de pipeline para visibilidade clara do processo de vendas. > *Shopify facilita o início porque você pode construir sua loja, vender nas redes sociais, aceitar pagamentos, usar ferramentas de IA e gerenciar tudo em um só lugar. [49:22]* > *Pipe Drive é um CRM inteligente e fácil de usar... que torna seu processo de vendas visível através de um painel. [50:17]* ## [51:04] Ela Alguma Vez Achou Que Seu Pai Realmente Faria Isso Embora Donald Trump tenha considerado concorrer à presidência desde os anos 1980, Ivanka afirma que essa ambição não foi discutida explicitamente durante sua infância. Ela relembra vividamente um momento aos 16 anos quando entrou em pânico, acreditando que seu pai estava concorrendo, apenas para ser tranquilizada de que não era o caso. Ela observa que seus pontos de vista consistentes sobre questões como política comercial permaneceram inalterados ao longo das décadas. > *Lembro de uma vez pensar que era real. Eu tinha 16 anos e estava no internato e liguei para ele... 'Isso vai arruinar minha vida.' [51:48]* > *seu ponto de vista permaneceu consistente ao longo do tempo e permanece consistente até hoje exatamente sobre política comercial [52:35]* ## [54:26] Sair da Casa Branca Foi um Alívio Ou Algo Mais Sair da Casa Branca não foi um alívio no sentido de arrependimento, pois Ivanka Trump sente que "deu tudo de si" e tem orgulho de suas realizações durante seus quatro anos de serviço público. Ela vê a oportunidade de servir como um "privilégio incrível", mas não tem desejo de retornar à política, priorizando seus filhos e recusando-se a deixá-los pagar o preço de mais vida pública. Ela está satisfeita com suas contribuições e sente que seu pai agora tem uma equipe forte para apoiá-lo. > *Eu dei tudo de mim, sabe? Eu não olho para trás e digo... Não tenho arrependimentos. [53:33]* > *Minha primeira responsabilidade é ser mãe deles. [56:49]* ## [58:08] Alguém Estava Realmente Preparado Para a Vida na Casa Branca Ivanka Trump admite que nada realmente prepara um indivíduo para a experiência intensa da política de alto nível e da vida na Casa Branca. Ela observou que o poder, assim como a riqueza, tende a amplificar os traços inerentes das pessoas. Suas interações com líderes globais, de monarcas a autoridades eleitas, os desmistificaram, revelando que, em essência, são "apenas pessoas" com dificuldades comuns, o que acabou dissipando qualquer intimidação que ela pudesse ter sentido. > *Nada te prepara para a experiência. [58:26]* > *Você percebe que no final do dia as pessoas são pessoas. [59:03]* ## [59:44] O Que a Tentativa de Assassinato Mudou Para Sempre A tentativa de assassinato contra seu pai em julho de 2024 mudou radicalmente a vida de Ivanka Trump, intensificando preocupações de segurança e necessitando proteção do Serviço Secreto dos EUA. Testemunhando o evento em tempo real com seus filhos, sua reação imediata foi protegê-los, embora tivesse uma sensação intuitiva de que seu pai ficaria bem. Essa experiência angustiante, juntamente com outros sustos de saúde na família, reforçou sua crença na preciosidade da vida e seu compromisso em escolher a positividade e valorizar cada momento, apesar da preocupante correlação entre serviço público e violência. > *Minha primeira reação foi afastá-los. [62:02]* > *Na vida, você só tem escolha em como responde. E eu escolho ver o resultado positivo. [66:05]* ## [1:07:20] Como É a Vida Depois de Se Afastar da Política Após se afastar da política em 2022, a vida de Ivanka Trump agora prioriza seus filhos pequenos e a vida familiar privada, pois ela considerou o "mundo sombrio" da política incompatível com sua natureza. Ela lida com críticas públicas usando a metáfora da "águia e do corvo", escolhendo elevar-se acima da negatividade em vez de se engajar. Esse período de intenso escrutínio público, incluindo a experiência de quase morte de seu pai, foi um "remédio" para o crescimento pessoal, ensinando-a a buscar paz interior e harmonia dentro de seu controle, e a focar na gratidão pelas bênçãos da vida. > *A política é um mundo bastante sombrio. Há muita escuridão, muita negatividade, e é realmente incompatível com o que me faz bem como ser humano. [67:45]* > *A resposta da águia a isso... não é se contorcer e virar e derrubar o corvo ou se defender... É simplesmente voar mais alto. [69:28]* ## [1:11:04] Ads Este capítulo representa uma breve pausa publicitária dentro do podcast. ## [1:14:24] Como a Terapia Mudou a Forma Como Ela Vê Tudo Ivanka Trump começou terapia na vida adulta, vendo-a como uma ferramenta de "inventário interno", impulsionada por sua "mentalidade orientada ao crescimento" e o desejo de processar eventos significativos da vida. Os principais catalisadores incluíram o segundo diagnóstico de câncer de tireoide de seu marido Jared, sua saída de Washington e o falecimento inesperado de sua mãe. A terapia a ajudou a nutrir-se e processar emoções em vez de compartimentalizá-las, mudando em última instância sua perspectiva sobre autoconhecimento e seguir em frente. > *Eu tenho uma mentalidade muito orientada ao crescimento... Estou sempre buscando aprender sobre mim mesma e sobre o mundo [74:35]* > *Jared foi diagnosticado com câncer de tireoide pela segunda vez. E então minha mãe faleceu [75:59]* ## [1:20:28] A Perda de Sua Mãe E O Que Isso Lhe Ensinou Ivanka Trump reflete sobre a morte súbita e trágica de sua mãe, Ivana Trump, em 2022, destacando o impacto único de uma perda parental inesperada. Ela se comprometeu com um processo de luto adequado, confrontando o desconforto e processando seus sentimentos. Como mãe, ela agora busca expor seus filhos às qualidades positivas de sua mãe, evitando conscientemente transmitir seus desafios, obtendo uma perspectiva adulta mais clara sobre a vida de sua mãe. > *Ela viveu uma boa vida. [81:07]* > *Eu realmente dediquei tempo para pensar nela não através dos olhos da criança que a idolatrava completamente, mas através dos olhos de uma adulta que a via com clareza. [83:15]* ## [1:26:28] As 3 Regras Que Ela Acredita Definir Sucesso e Felicidade Ivanka Trump acredita que o verdadeiro sucesso e felicidade são definidos por três princípios fundamentais, particularmente para o empreendedorismo, que ela compartilharia com sua filha, Arabella. Primeiro, é preciso genuinamente amar o que se faz, pois a paixão é essencial para a dedicação. Segundo, a autenticidade é primordial; ser si mesmo e traçar seu próprio caminho é crucial, pois a imitação leva à derrota. Terceiro, e mais fundamentalmente, é preciso cultivar a autoconfiança antes que o mundo acredite em você, pois esse é o ponto de partida para qualquer conquista. Ela também observa que o "equilíbrio entre trabalho e vida pessoal" tradicional é ilusório, buscando em vez disso alinhamento com prioridades. > *Nunca vi alguém no auge de sua carreira que não ame absolutamente o que faz. [92:46]* > *você vai ter que acreditar em si mesmo antes que o mundo acredite em você. [94:48]* ## [1:28:37] O Que É a Planet Harvest E Por Que Pode Importar Mais Do Que Você Pensa Planet Harvest é o empreendimento movido por propósito de Ivanka Trump, voltado para a redução do desperdício de alimentos e o apoio a agricultores americanos. A iniciativa foi inspirada durante a pandemia de COVID-19, quando ela observou grandes quantidades de produtos perecíveis sendo descartados devido a problemas na cadeia de suprimentos. A Planet Harvest aborda o problema contínuo de alimentos perfeitamente bons sendo rejeitados por varejistas por não atenderem a padrões cosméticos rígidos, proporcionando assim receita adicional para agricultores e beneficiando o meio ambiente. > *A Planet Harvest nasceu... garantindo que quando as pessoas precisavam de comida, os alimentos nos campos não fossem desperdiçados sendo arados como vimos nos primeiros dias da pandemia. [89:18]* > *400 milhões de libras de morangos todos os anos são deixados nos campos... Não porque sejam imperfeitos. Simplesmente não atendem a uma especificação cosmética realmente rígida. [90:57]* ## Entidades - **Ivanka Trump** (Pessoa): Filha de Donald e Ivana Trump, empresária e ex-funcionária do governo. - **The Diary Of A CEO** (Organização): O podcast que apresenta a entrevista. - **Donald Trump** (Pessoa): Pai de Ivanka Trump, ex-presidente dos Estados Unidos. - **Ivana Trump** (Pessoa): Mãe de Ivanka Trump, ex-esquiadora pela Checoslováquia. - **Michael Jackson** (Pessoa): Famoso cantor, compositor e dançarino americano. - **O.J. Simpson** (Pessoa): Ex-jogador de futebol americano, apresentador, ator e condenado. - **Marcus Aurelius** (Pessoa): Imperador romano e filósofo estoico. - **Shopify** (Organização): Plataforma de e-commerce para criação de lojas online. - **Pipe Drive** (Organização): Software inteligente de CRM (Gestão de Relacionamento com o Cliente). - **Anna Wintour** (Pessoa): Editora-chefe da Vogue. - **Vogue** (Organização): Revista de moda e estilo de vida. - **Wharton School of Business** (Organização): Escola de negócios da Universidade da Pensilvânia. - **Office of Government Ethics** (Organização): Agência do governo dos EUA responsável pela prevenção de conflitos de interesse. - **Jared Kushner** (Pessoa): Marido de Ivanka Trump, que também serviu no governo. - **US Secret Service** (Organização): Agência governamental responsável pela proteção de Ivanka Trump e sua família. - **Planet Harvest** (Organização): Empresa cofundada por Ivanka Trump focada na redução do desperdício de alimentos e apoio a agricultores. - **Arabella** (Pessoa): Filha mais velha de Ivanka Trump. - **Stoicism** (Filosofia): Escola de filosofia da Grécia Antiga. - **Buddhism** (Filosofia): Filosofia oriental. - **Daoism** (Filosofia): Filosofia oriental. - **Czechoslovakia** (Localização): Antigo país da Europa Central. - **New York City** (Localização): Principal cidade dos Estados Unidos. - **Bedminster, New Jersey** (Localização): Local onde Ivanka Trump estava quando soube da tentativa de assassinato contra seu pai. - **Child Tax Credit** (Política): Crédito fiscal dos EUA para famílias com filhos. - **Great American Outdoors Act** (Política): Legislação apoiada por Ivanka Trump. - **Human Trafficking Legislation** (Política): Legislação na qual Ivanka Trump trabalhou durante seu serviço público. - **Vocational Education and Skills Training** (Iniciativa): Programas promovidos por Ivanka Trump para capacitar e recapacitar trabalhadores americanos. - **Meditations** (Livro): Série de escritos pessoais de Marcus Aurelius.

#ivanka-trump#family#childhood
O fluxo de trabalho Explorar→Planejar→Codificar→Commitar no Claude Code
3:11
EN/ZH
Watch with Captions
ClaudeClaude Code 101há aproximadamente 2 meses

O fluxo de trabalho Explorar→Planejar→Codificar→Commitar no Claude Code

Apresentação de três minutos da Anthropic sobre o loop que consideram o hábito mais importante ao trabalhar com Claude Code: pesquisar primeiro no modo plano, definir o que "pronto" significa antes de tocar em qualquer arquivo e, em seguida, fazer um subagente revisar o diff antes de fazer push. ## [00:03] Por que explorar-planejar-codificar-commitar supera começar direto A abertura é direta — se você adotar apenas um hábito do curso, que seja este fluxo de trabalho. O modo de falha que ele combate é o reflexo de colar uma tarefa no Claude e assistir à geração imediata de código, o que prioriza a velocidade mas adia o custo de correção. > *Without this, most people jump straight to pasting in Claude to write code, which means more course correcting later on.* ## [00:21] Modo plano: pesquisa somente leitura antes de qualquer edição O modo plano comprime exploração e planejamento em um único movimento. Claude pode ler arquivos e executar pesquisas na web, mas não pode escrever — Shift+Tab alterna para ele a partir do prompt. O narrador demonstra com uma solicitação real (adicionar conversão WebP a um pipeline de upload de imagens, descobrir onde ela se encaixa, quais dependências são necessárias e como abordá-la). Claude retorna um plano; você o lê e pede revisões se algo estiver faltando. Este é o ponto mais barato de todo o ciclo para mudar de direção, porque nada foi escrito ainda. > *With plan mode, Claude can't edit files. It just reads files to gather research on how to tackle this implementation.* ## [01:11] Aprovar o plano e corrigir o curso enquanto Claude codifica Uma vez que o plano parece certo, Aprovar devolve a execução ao Claude para percorrer a lista de verificação. Você escolhe se as edições de arquivos se autoaceitam ou solicitam confirmação a cada vez. Claude resolverá problemas por conta própria, mas espere ter que intervir — e a razão pela qual o modo plano compensa aqui é que o agente carrega o contexto de pesquisa que produziu o plano, então correções em voo pousam no lugar certo em vez de começar do zero. > *This is the benefit of working with plan mode because after the plan is finished, we also have the context of how it got to the results to help it guide its next decision.* ## [01:39] Tornar os critérios de sucesso explícitos e dar ferramentas reais ao Claude Um plano sem definição de "correto" deixa Claude adivinhar. Especifique como o sucesso se parece e equipe o agente para realmente verificá-lo: a extensão Claude+Chrome permite que ele controle uma aba do navegador para testar uma interface que acabou de construir; um conjunto de testes fornece algo para validar a cada loop, e Claude também pode escrever os testes — mas somente se você já os tiver validado como verdade base. Uma dica de durabilidade: quando Claude continua encontrando o mesmo problema, faça-o persistir a correção no arquivo CLAUDE.md para que pare de reaprender. > *In order for Claude to be confident in its results, it has to be clear on what it deems correct.* ## [02:24] Revisão por subagente, commit e recapitulação Antes de fazer push, inicie um revisor de código subagente sobre o diff — uma segunda passagem sem apego à implementação. Em seguida, peça ao Claude que esboce a mensagem de commit no seu estilo e envie. A recapitulação reformula cada etapa: Explorar alimenta contexto, Planejar define sucesso, Codificar é o vai-e-vem que converge para o plano, Commitar revisa e faz push para você seguir em frente. > *A tip before you commit, run a sub agent code reviewer to look at your code.* ## Entities - **Anthropic Tutorial Narrator** (Person): A voz oficial da Anthropic para o curso Claude Code 101. - **Claude Code** (Software): Ferramenta de codificação agentiva em terminal cujo loop diário recomendado é o tema deste episódio. - **Plan mode** (Feature): Modo somente leitura ativado com Shift+Tab — Claude pesquisa e propõe um plano, mas não pode editar arquivos. - **Claude + Chrome extension** (Software): Permite ao Claude Code controlar uma aba do Chrome para verificar alterações de interface antes de declarar uma tarefa concluída. - **CLAUDE.md** (File): Arquivo de memória do projeto usado aqui como destino de persistência para correções recorrentes que Claude continua reaprendendo. - **Subagent code reviewer** (Pattern): Subagente Claude pré-commit que revisa o diff antes de o humano fazer push.

#claude-code#plan-mode#agentic-coding
Gerenciamento de contexto no Claude Code
3:51
EN/ZH
Watch with Captions
ClaudeClaude Code 101há aproximadamente 2 meses

Gerenciamento de contexto no Claude Code

O tutorial Claude Code 101 da Anthropic sobre contexto — o que preenche a janela, quando a compactação automática é ativada e os controles práticos (/compact, /clear, /context, claude.md, toggles de MCP, skills, subagentes) para manter uma sessão enxuta o suficiente para continuar trabalhando. ## [00:03] Por que o contexto é finito e por que isso importa O contexto é a memória de trabalho do Claude: cada prompt, cada leitura de arquivo, cada resultado de chamada de ferramenta aterra na mesma janela. A janela é grande, mas finita, portanto otimizar o que entra nela é indispensável assim que se começam sessões de múltiplas etapas. > *Every file it reads, every command it runs, every message you send, it all takes up space in the context window.* ## [00:39] Compactação automática e o comando /compact Ao se aproximar do limite, o Claude Code compacta automaticamente: resume os pontos importantes e descarta resultados ruidosos de chamadas de ferramentas para liberar espaço. Também é possível acionar `/compact` manualmente — útil quando se quer margem, mas ainda se deseja lembrar do que foi trabalhado. Contrapartida: a compactação pode perder detalhes de turnos anteriores. > *Compaction will summarize important details and remove the unnecessary tool call results and free up a lot of space in your context window.* ## [01:11] /clear e /context: recomeçar do zero e ver o que está sendo usado Para um reset completo sem memória da sessão anterior, `/clear` apaga tudo. Para ver onde o espaço está realmente sendo consumido, `/context` mostra o tamanho total, as categorias que mais consomem e um gráfico do detalhamento — o diagnóstico antes de decidir entre compact e clear. > *To check the state of your context, run the /context command.* ## [01:35] A regra prática: compact no meio da tarefa, clear entre tarefas O narrador oferece uma heurística clara: ainda trabalhando em uma funcionalidade e chegando perto do teto? Compact — você quer que o histórico relevante se mantenha. Concluiu o plano e vai para algo novo? Clear — a conversa antiga pode enviesar o novo trabalho. > *If you have finished the plan and want to start on a new feature, then clear. You don't want the previous conversation to present bias in anything new that you want to create.* ## [01:57] claude.md, especificidade de prompts e escrever menos escrevendo mais Tudo que o Claude deve lembrar entre sessões pertence ao `claude.md` para que ele não redescopra os mesmos fatos toda vez. E, paradoxalmente, prompts curtos custam mais contexto: diante de uma pergunta vaga, o Claude percorre o codebase com grep e raciocina mais — o que preenche a janela. Uma ou duas frases de especificidade economizam muito espaço adiante. > *The irony behind writing a smaller prompt is that it in the long run, it will take up more context.* ## [02:26] Servidores MCP, skills e subagentes como ferramentas de contexto Servidores MCP carregam por padrão todas as ferramentas que expõem no contexto — bem se relevantes, caro se não, então desative os que não estão relacionados ao projeto. Skills se comportam como servidores MCP, mas não despejam toda a superfície de ferramentas no contexto. Subagentes rodam em paralelo com sua própria janela separada; para tarefas de busca de informações ("onde estão os endpoints de autenticação?"), você pode despachar um subagente e receber apenas a resposta, em vez de todo o percurso. > *Sub agents run in parallel with your main agent but has a complete separate context window.* ## [03:06] Recapitulação Gerenciar o contexto no Claude Code é a diferença entre uma sessão longa e produtiva e uma travada. Use `/compact` para resumir sessões longas, `/clear` para recomeçar, seja específico nos prompts, verifique `/context` para ver o que está consumindo a janela e delegue trabalho de somente-resposta aos subagentes. > *Managing context within cloud code is crucial. Use slash compact to summarize long sessions and slashclear to start fresh.* ## Entidades - **Anthropic Tutorial Narrator** (Person): A voz oficial da Anthropic para a série de tutoriais Claude Code 101. - **Claude Code** (Software): O assistente de codificação agêntico em terminal da Anthropic cuja janela de contexto é o tema deste episódio. - **Context window** (Concept): A memória de trabalho do Claude — finita, preenchida por prompts, leituras de arquivos e resultados de chamadas de ferramentas. - **/compact** (Command): Comando slash (e gatilho automático) que resume o histórico e remove o ruído de chamadas de ferramentas para liberar espaço. - **/clear** (Command): Comando slash que apaga a sessão por completo para um começo limpo em novo trabalho. - **/context** (Command): Comando slash que informa o tamanho total do contexto e quais categorias o consomem. - **claude.md** (File): Arquivo de memória no nível do projeto que o Claude lê entre sessões para não redescobriros mesmos fatos. - **MCP servers** (Software): Provedores de ferramentas que carregam por padrão todas as ferramentas expostas no contexto — desativar quando não forem relevantes. - **Skills** (Feature): Alternativa mais leve aos servidores MCP que evita carregar toda a superfície de ferramentas no contexto. - **Sub agents** (Feature): Agentes paralelos com suas próprias janelas de contexto usados para responder perguntas delimitadas sem poluir a janela principal.

#claude-code#context-window#compact
Por que a IA ainda não vai substituir os matemáticos – Terence Tao
4:12
EN/ZH
Watch with Captions
Dwarkesh Patelhá aproximadamente 2 meses

Por que a IA ainda não vai substituir os matemáticos – Terence Tao

Terence Tao discute o papel em evolução da IA na matemática e argumenta que, embora ela venha a automatizar muitas tarefas rotineiras, não substituirá por completo os matemáticos humanos — apenas deslocará o foco deles para novas fronteiras. Ele destaca o futuro da colaboração humano-IA e a natureza imprevisível do impacto de longo prazo da IA na descoberta científica. ## [00:10] O papel atual da IA na matemática de fronteira Terence Tao explica que a IA já está fazendo uma "matemática de fronteira" que os humanos não conseguem, embora seja um tipo diferente de fronteira. Ele compara isso a como as calculadoras expandiram as possibilidades matemáticas no passado: assumiram tarefas além da capacidade humana, mas de forma especializada. > *De certo modo, elas já estão fazendo matemática de fronteira super-inteligente que os humanos não podem fazer, mas é uma fronteira diferente daquela a que estamos acostumados.* ## [00:52] IA como ferramenta de automação, não como substituto Tao prevê que, em uma década, a IA assumirá muitas tarefas rotineiras hoje realizadas por matemáticos, permitindo que os humanos se concentrem em problemas mais complexos e importantes. Ele traça paralelos com transições históricas: os computadores automatizaram trabalhos antes feitos por "computadores humanos", e o sequenciamento de genomas tornou-se automático sem que a genética deixasse de evoluir em novas escalas. > *Em uma década, muita coisa que os matemáticos fazem hoje… poderá ser feita pela IA. Mas vamos descobrir que essa não era, de fato, a parte mais importante do que fazemos.* ## [02:46] O futuro da colaboração humano-IA na matemática Dwarkesh Patel pergunta sobre a possibilidade de a IA resolver autonomamente os Problemas do Prêmio do Milênio. Terence Tao acredita que o "híbrido humano mais IA" dominará a matemática por muito mais tempo, já que a IA atual ainda não tem todos os ingredientes necessários para substituir por completo as tarefas intelectuais — funcionando mais como uma ferramenta complementar. > *Eu realmente acredito que esse híbrido humano mais IA vai dominar a matemática por muito mais tempo.* ## [03:43] Impacto imprevisível sobre a descoberta científica Tao reconhece que, embora a IA vá acelerar a ciência e novas descobertas, também há a possibilidade de ela inibir certos tipos de progresso ao "destruir a serendipidade". Conclui que o impacto futuro da IA sobre a descoberta científica é altamente imprevisível. > *É possível que, ao destruir de algum modo a serendipidade, acabemos inibindo certos tipos de progresso.* ## Entidades - **Terence Tao** (Pessoa): convidado, um dos matemáticos mais proeminentes da nossa época. - **Dwarkesh Patel** (Pessoa): apresentador do podcast. - **IA (AI)** (Conceito): inteligência artificial, discutida no seu papel em matemática e descoberta científica. - **Mathematica / Wolfram Alpha** (Software): ferramentas computacionais citadas como exemplos de automação em matemática. - **Problemas do Prêmio do Milênio (Millennium Prize Problems)** (Conceito): sete problemas matemáticos não resolvidos, com prêmio de um milhão de dólares para cada solução.

#ai#mathematics#terence-tao
Usando subagentes de forma eficaz
4:44
EN/ZH
Watch with Captions
ClaudeClaude Code subagentshá 2 meses

Usando subagentes de forma eficaz

Subagentes são poderosos quando o trabalho intermediário não pertence à sua thread principal — mas delegar indiscriminadamente piora as coisas. Este tutorial traça a linha entre delegação útil (pesquisa, revisão de código, prompts de sistema específicos para domínio) e antipadrões comuns (afirmações de persona de especialista, pipelines sequenciais, executores de testes) que consomem contexto e perdem exatamente as informações de que você precisa. ## [00:03] Introdução: quando subagentes ajudam e quando atrapalham A série até aqui cobriu a criação e o design de subagentes. Esta edição final muda o foco para a questão de implantação: quais tarefas realmente se beneficiam de iniciar um agente separado, e quais sofrem com isso? A resposta se resume a um teste: o trabalho intermediário importa para sua thread principal? Quando a exploração é separada da execução, os subagentes compensam. Quando cada etapa depende do que a etapa anterior descobriu, o custo da transferência elimina exatamente os detalhes de que você precisa. > *"Em termos simples, a diferença está em saber se o trabalho intermediário importa para a sua thread principal."* ## [00:32] Tarefas de pesquisa: mantendo a exploração isolada O rastreamento de autenticação é um exemplo concreto. Sua thread principal precisa saber onde ocorre a validação de JWT — não os dezenas de arquivos lidos ao longo do caminho. Um subagente de pesquisa pode varrer toda a base de código, seguir chamadas de função entre arquivos e retornar uma resposta precisa: a validação de JWT acontece em middleware/auth.js na linha 42, chamada a partir de route/api.js. Toda aquela exploração fica contida no contexto do subagente. A thread principal recebe a conclusão e segue em frente sem que o histórico de busca polua sua janela de contexto. > *"Sua thread principal recebe: a validação de JWT acontece em middleware/auth.js na linha 42, chamada pelo roteador Express e route/api.js, ou algo assim."* ## [01:15] Subagentes de revisão de código: feedback com olhos frescos Claude revisando código que ajudou a escrever tem um problema de viés — esteve presente em cada decisão e não consegue facilmente enxergar o que parece errado de fora. Um subagente revisor contorna isso completamente: ele vê apenas o diff e os arquivos modificados, sem nenhum histórico de como o código evoluiu. Essa folha em branco também cria um segundo benefício. Critérios de revisão específicos do projeto — convenções de nomenclatura, padrões de segurança, regras de arquitetura — podem ser codificados no prompt de sistema do subagente uma vez e aplicados de forma consistente, sem depender da thread principal para lembrá-los a cada turno. > *"Um subagente revisor vê as mudanças em um contexto separado. Ele executa git diff, lê os arquivos modificados e aplica seus critérios de revisão especializados sem o histórico de como o código foi escrito."* ## [01:59] Prompts de sistema personalizados: copywriting e estilo O prompt padrão do Claude Code é otimizado para saída técnica e concisa — exatamente o oposto do que se precisa para uma landing page ou e-mail de marketing. Um subagente de copywriting recebe instruções completamente diferentes sobre tom, público e estrutura, produzindo resultados que os padrões da thread principal jamais gerariam. A mesma lógica se aplica ao CSS. Um subagente de estilo que menciona os arquivos do seu design system carrega automaticamente variáveis de cor, convenções de espaçamento e padrões de componentes em seu contexto antes de escrever uma linha sequer, garantindo que cada decisão de estilo reflita o sistema real em vez de suposições razoáveis. > *"O prompt padrão do Claude Code tende para uma escrita técnica e concisa, que realmente não é o que você quer para uma landing page ou campanha de e-mail, a menos que queira entediar seus clientes."* ## [02:57] Antipadrões: afirmações de especialista, pipelines, executores de testes Três padrões pioram as coisas de forma confiável. Primeiro, prompts de persona — "Você é um especialista em Python" ou "Você é um especialista em Kubernetes" — não acrescentam nada, porque Claude já possui esse conhecimento. Iniciar um subagente apenas para rotulá-lo com um título de especialista desperdiça o overhead do isolamento sem oferecer nada que a thread principal não pudesse fazer. Segundo, pipelines sequenciais falham sempre que as etapas não são verdadeiramente independentes. Um fluxo com três agentes — reproduzir um bug, depurá-lo, corrigi-lo — parece limpo, mas falha na prática: o agente de depuração precisa do contexto em tempo real do agente de reprodução, não de um resumo comprimido dele. Terceiro, subagentes executores de testes escondem informações ativamente. Quando os testes falham, você precisa da saída bruta para diagnosticar o que deu errado. Um subagente que retorna apenas "teste falhou" obriga você a escrever scripts de depuração adicionais para recuperar detalhes que a saída direta teria mostrado imediatamente. > *"Um subagente que retorna 'teste falhou' obriga você a criar scripts de depuração adicionais para obter detalhes que seriam visíveis na saída direta."* ## [04:10] Recapitulação da série e a heurística de decisão central Ao longo da série: subagentes são threads isoladas que retornam resumos, criadas com /agents, projetadas com saídas estruturadas e descrições específicas. Use-os para pesquisa, revisão de código e tarefas que precisam de um prompt de sistema personalizado. Evite-os para afirmações de persona de especialista, pipelines dependentes com múltiplas etapas e execução de testes. Todo o framework se reduz a uma pergunta: o trabalho intermediário importa? Se a resposta for não, delegue. > *"A pergunta central: o trabalho intermediário importa? Se não, delegue."* ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): apresentador da série de tutoriais sobre subagentes do Claude Code, Anthropic - **Claude Code** (Software): assistente de programação com IA da Anthropic; o ambiente no qual subagentes são criados e orquestrados - **Subagente** (Conceito): uma thread isolada do Claude iniciada a partir do contexto principal, retornando um resumo comprimido em vez de expor seu contexto de trabalho completo - **JWT (JSON Web Token)** (Conceito): usado como exemplo prático de um subagente de pesquisa rastreando lógica de autenticação em uma base de código - **System prompt** (Conceito): conjunto de instruções por subagente que permite comportamento específico de domínio diferente do prompt padrão do Claude Code - **Anthropic** (Organização): desenvolvedora do Claude e da série de tutoriais sobre subagentes do Claude Code

#claude-code#subagents#ai-agents
Criando um subagente
3:45
EN/ZH
Watch with Captions
ClaudeClaude Code subagentshá 2 meses

Criando um subagente

O Claude Code já vem com subagentes embutidos, mas os personalizados permitem configurar comportamentos especializados para tarefas específicas. Este tutorial cria um subagente de revisão de código do zero — percorrendo o comando `/agents`, a seleção de ferramentas, a escolha do modelo e os campos do arquivo de configuração que controlam quando e como o Claude delega para ele. ## [00:03] O que são subagentes personalizados O Claude Code inclui subagentes embutidos, mas você também pode criar os seus próprios, especializados em tarefas específicas. Um subagente personalizado é um arquivo markdown com YAML front matter: o front matter indica ao Claude quando rotear para aquele agente e quais capacidades ele possui, enquanto o corpo markdown é o prompt de sistema sob o qual o subagente opera. > *"Custom sub aents are markdown files with YAML front matter. These markdown files contain configuration that helps claude understand when to use the sub aent and provides directions to the sub aent itself."* ## [00:28] Criando um subagente com /agents O comando `/agents` abre o painel de gerenciamento de agentes. Selecionar "Criar novo agente" levanta duas perguntas: escopo (projeto atual ou compartilhado em todos os projetos da máquina) e método de geração. O caminho recomendado é deixar o Claude gerar o agente automaticamente — o narrador digita um pedido em linguagem natural para um subagente que revisa qualidade de código e problemas de segurança, e o Claude cuida do resto. > *"Now, the easiest way to create a sub agent is with the / agents command. Next, you can create a sub agent manually, but we recommend using claw code to automatically generate it for you."* ## [00:56] Configurando ferramentas, modelo e cor Antes de o Claude escrever o arquivo, você escolhe quais ferramentas o subagente pode acessar. Um agente de revisão de código não precisa estritamente de ferramentas de edição, mas manter a execução habilitada facilita a inspeção de mudanças pendentes. Depois das ferramentas, você escolhe o modelo: haiku para velocidade, opus para profundidade, sonnet para o meio-termo. A última escolha é uma cor — ela aparece na interface para que você identifique o subagente rapidamente. > *"Now, given that our sub agent is only responsible for reviewing code, you might decide to disallow tools for editing, but I'll leave an execution to allow the sub agent to more easily identify pending changes."* ## [01:43] Entendendo o arquivo de configuração O arquivo gerado é salvo no projeto no caminho exibido na janela de resumo. Quatro campos são mais importantes. `name` é o identificador único — você pode referenciá-lo digitando `@agent-code-quality-reviewer` em uma mensagem. `description` é o que o Claude lê para decidir se delega; deve ficar em uma única linha (caracteres `\n` escapados são literais). Adicionar "proativamente" à descrição faz o Claude recorrer ao agente com mais frequência; adicionar conversas de exemplo torna o roteamento mais preciso. `tools` espelha o acesso concedido durante a geração, mas pode ser editado diretamente no arquivo. > *"If you want Claude to use the sub agent automatically more often, add in the word proactively to the description."* ## [02:41] O prompt de sistema e como o Claude o utiliza O campo `model` aceita `haiku`, `sonnet`, `opus` ou `inherit` — `inherit` executa o subagente no mesmo modelo da conversa principal. Tudo abaixo do front matter é o prompt de sistema: ele guia o subagente em sua tarefa e diz como devolver os resultados ao agente principal. > *"The system prompt will provide guidance to the sub agent, helping it understand how to complete its task and how it should return information back to the main agent."* ## [03:15] Testando seu subagente Depois de salvar a configuração, faça algumas alterações no código e peça ao Claude para revisá-las. Se o subagente não disparar quando esperado, o campo `description` é o primeiro lugar para ajustar — exemplos mais específicos afinam a percepção do Claude sobre quando delegar. > *"If the sub agent isn't being used when you expect, check your description. Adding more specific examples helps Claude understand when to delegate."* ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): único apresentador deste episódio; narra a série de tutoriais sobre subagentes do Claude Code no canal oficial da Anthropic no YouTube - **Claude Code** (Software): assistente de programação com IA da Anthropic; suporta subagentes embutidos e subagentes personalizados criados pelo usuário - **Subagente personalizado** (Conceito): arquivo markdown com YAML front matter que configura o Claude Code para delegar tarefas específicas a uma instância de agente especializada - **/agents command** (Conceito): ponto de entrada na interface do Claude Code para criar e gerenciar subagentes; oferece escopo de projeto ou global - **Prompt de sistema** (Conceito): o corpo markdown de um arquivo de configuração de subagente; fornece orientação de tarefa e instruções de formato de saída ao subagente em tempo de execução - **Anthropic** (Organização): criadora do Claude e da plataforma Claude Code

#claude-code#subagents#ai-agents
Projetando subagentes eficazes
3:42
EN/ZH
Watch with Captions
ClaudeClaude Code subagentshá 2 meses

Projetando subagentes eficazes

Este tutorial da série Claude Code da Anthropic apresenta quatro padrões concretos que separam subagentes confiáveis daqueles que derivam, travam ou mexem em arquivos que não deveriam. O narrador percorre cada padrão usando subagentes de revisão de código e busca na web como exemplos recorrentes, mostrando exatamente quais configurações ajustar e por quê. ## [00:03] Controlando o comportamento do subagente com nome e descrição Toda mensagem enviada ao agente principal inclui o nome e a descrição de cada subagente registrado no prompt de sistema. Isso significa que a descrição cumpre dois papéis: informa ao orquestrador *quando* lançar o subagente e serve de modelo para a redação do prompt de entrada. O tutorial demonstra com um subagente de revisão de código. Na configuração original, o orquestrador redige um prompt genérico pedindo que o subagente execute `git diff` por conta própria. Ao atualizar a descrição para "você deve informar ao agente precisamente quais arquivos deseja que ele revise", a responsabilidade pela seleção de arquivos passa ao orquestrador — na próxima execução, o prompt de entrada se torna visivelmente mais específico. O mesmo recurso funciona para subagentes de busca na web: adicionar "retorne fontes que possam ser citadas" à descrição faz com que o agente principal inclua essa instrução automaticamente ao delegar a tarefa. > *"Se você quiser controlar melhor quando o agente principal lança um subagente automaticamente, deve modificar o nome e a descrição."* ## [01:41] Definindo formatos de saída O narrador aponta o formato de saída como a melhoria isolada de maior impacto. Sem um formato definido, o subagente não tem um sinal claro de quando terminou — continua rodando, acumulando contexto e consumindo tokens. Um formato de saída estruturado cria um ponto de parada natural. O subagente sabe que concluiu quando os campos obrigatórios estão preenchidos. Na prática, isso significa adicionar um esquema explícito — um bloco de resumo, uma lista de descobertas, um campo de status — diretamente ao prompt de sistema do subagente. > *"Sem um formato de saída definido, os subagentes têm dificuldade em decidir quando a pesquisa está suficientemente completa e tendem a rodar muito mais do que subagentes com um formato de saída definido."* ## [02:04] Relatando obstáculos no resumo Quando um subagente resolve um problema — um conflito de dependência, um comando que exige flags inesperadas, uma peculiaridade do ambiente — o agente principal precisa dessa informação, ou repetirá o mesmo obstáculo no próximo passo. A solução é exigir o relato de obstáculos no próprio formato de saída. O narrador lista as categorias que devem sempre aparecer: obstáculos encontrados, problemas de configuração, soluções alternativas descobertas, comandos que precisaram de flags ou configurações especiais, e importações ou dependências que causaram problemas. Incorporar esses itens ao esquema de saída obrigatório garante que o agente principal herde as descobertas do subagente em vez de redescobri-las do zero. > *"Caso contrário, o agente principal precisa redescobrir as mesmas soluções, obstáculos encontrados, quaisquer problemas de configuração, soluções alternativas descobertas ou peculiaridades do ambiente, comandos que precisaram de flags ou configuração especial, dependências ou importações que causaram problemas."* ## [02:42] Limitando o acesso a ferramentas por função O controle de acesso a ferramentas não é apenas uma medida de segurança — é também uma ferramenta de clareza. Um subagente somente leitura, com acesso apenas a `glob`, `grep` e `read`, não consegue modificar arquivos por acidente, o que torna sua função inequívoca para qualquer pessoa que leia a configuração. O narrador mapeia três níveis de acesso a três funções de subagente: um subagente de pesquisa recebe acesso somente leitura porque explorar o código-fonte nunca exige escrita; um revisor recebe `bash` para `git diff`, mas ainda sem ferramentas de edição; apenas subagentes explicitamente responsáveis por alterar código — como um que aplica atualizações de CSS — recebem `edit` e `write`. Com vários subagentes em operação, a lista de ferramentas se torna um resumo legível por máquina do que cada um deve fazer. > *"Dê edit e write apenas aos subagentes que realmente devem alterar seu código, como um agente de estilização aplicando atualizações de CSS."* ## [03:27] Quatro padrões para subagentes eficazes O tutorial encerra com um resumo de uma frase para cada um dos quatro padrões: saída estruturada, relato de obstáculos, descrições específicas e acesso restrito a ferramentas. Cada padrão reforça os demais — descrições precisas reduzem ambiguidade nos prompts de entrada, formatos de saída criam pontos de parada, o relato de obstáculos preserva o contexto entre fronteiras de agentes, e o acesso mínimo a ferramentas previne efeitos colaterais que amplificariam qualquer ambiguidade restante. > *"Portanto, subagentes eficazes usam saída estruturada, relatam obstáculos, têm descrições específicas e limitam o acesso a ferramentas."* ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): apresentador da série de tutoriais Claude Code sobre subagentes, representando a Anthropic - **Claude Code** (Software): ferramenta de programação agêntica da Anthropic que orquestra subagentes para executar tarefas de engenharia em múltiplas etapas - **Subagente** (Conceito): uma instância especializada do Claude lançada por um agente orquestrador, com seu próprio prompt de sistema, acesso a ferramentas e prompt de entrada - **Formato de saída** (Conceito): um esquema obrigatório definido no prompt de sistema do subagente que cria uma condição de parada e estrutura as informações retornadas ao agente principal - **Relato de obstáculos** (Conceito): padrão que exige que os subagentes exponham soluções alternativas, problemas de dependência e peculiaridades do ambiente em sua saída, para que o orquestrador não precise redescobri-los - **Controle de acesso a ferramentas** (Conceito): restrição de cada subagente apenas às ferramentas que sua função exige — somente leitura para pesquisa, bash para revisão, edit/write apenas para agentes que devem modificar arquivos - **Anthropic** (Organização): criadora do Claude e da plataforma de programação agêntica Claude Code

#claude-code#subagents#ai-agents
O que são subagentes?
2:48
EN/ZH
Watch with Captions
ClaudeClaude Code subagentshá 2 meses

O que são subagentes?

Subagentes são assistentes especializados para os quais o Claude Code pode delegar tarefas — cada um roda em sua própria janela de contexto isolada, executa o trabalho de forma autônoma e devolve um resumo focado, enquanto todo o rastro intermediário é descartado. Este tutorial de dois minutos da Anthropic explica por que esse isolamento importa para manter a janela de contexto principal utilizável, mostra um cenário concreto de exploração de código que ilustra o custo-benefício e lista os subagentes nativos que o Claude Code já traz por padrão. ## [00:03] O que são subagentes Um subagente roda em sua própria janela de contexto de conversa separada, inicializada com um system prompt personalizado que você define. O agente principal (Claude Code na thread principal) passa ao subagente uma descrição de tarefa com base no que você pediu. O subagente a resolve de forma autônoma e devolve um resumo para a thread principal — enquanto todo o trabalho intermediário permanece isolado. > *"Sub-agents are specialized assistants that Claude can delegate tasks to."* O ponto de design crítico: quando o subagente termina, toda a sua thread de conversa é completamente descartada. Apenas o resumo retornado sobrevive de volta à conversa principal. ## [00:24] Gerenciando a janela de contexto Cada chamada de ferramenta que o Claude faz na thread principal — leituras de arquivo, buscas, rastreamentos de função — se acumula na janela de contexto principal. Em uma sessão longa, isso enche rápido. Subagentes existem justamente para descarregar tarefas discretas de pesquisa ou ação, de modo que esse custo não recaia na janela principal. > *"Each sub-agent runs in its own conversation contacts window with a custom system prompt that you define."* O custo-benefício é explícito: a janela principal ganha um contexto limpo, mas perde visibilidade sobre como o subagente chegou às suas conclusões e o que descobriu pelo caminho. Você recebe a resposta, não o rastro de raciocínio. ## [01:13] Um exemplo concreto: o sistema de pagamentos Imagine que você está usando o Claude Code para descobrir qual serviço lida com reembolsos em uma base de código desconhecida. Sem subagente, o Claude pode ler 15 arquivos, executar várias buscas e rastrear múltiplas chamadas de função — e tudo isso enche a janela de contexto principal, mesmo que você só precisasse de uma informação. > *"With a sub-agent, you get the answer without the journey."* O subagente explora o código, descobre a resposta e devolve um resumo focado — mantendo seu contexto principal limpo. A visibilidade perdida é o custo: você não verá quais arquivos foram lidos nem quais rastros foram seguidos para chegar lá. ## [02:00] Os subagentes nativos do Claude Code O Claude Code vem com três subagentes nativos prontos para uso imediato: - **Subagente de uso geral** — para tarefas de múltiplas etapas que exigem exploração e ação. - **Subagente Explore** — busca rápida em bases de código sem a sobrecarga de um loop completo de tarefas. - **Subagente Plan** — executa durante o modo de planejamento para pesquisar e analisar o código antes de apresentar um plano para você. > *"And you can also create your own sub-agents with custom system prompts and tool access."* Além desses três, você pode definir subagentes personalizados com seus próprios system prompts e listas de acesso a ferramentas, adaptados a fluxos de trabalho específicos. ## [02:30] Quando usar subagentes Subagentes compensam quando você tem uma pergunta ou tarefa discreta e autocontida que, de outra forma, despejaria muito contexto intermediário na sua janela principal. > *"Sub-agents like Claude Code break work into focused pieces, keep your main context window clean, and bring back just what you need, whether you're using the built-in ones or creating your own."* Eles são mais valiosos em sessões longas do Claude Code, onde a pressão sobre a janela de contexto se acumula — delegar uma subtarefa a um subagente, em vez de deixá-la se espalhar diretamente pela thread principal, estende diretamente a eficácia da sessão. ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): narrador da série de tutoriais "Claude Code subagents" produzida pela Anthropic - **Claude Code** (Software): assistente de programação agêntico da Anthropic; o ambiente host no qual os subagentes operam - **Claude** (Software): o modelo de IA subjacente que alimenta o Claude Code e seus subagentes - **Subagente** (Conceito): um assistente especializado para o qual o Claude Code delega tarefas, rodando em uma janela de contexto isolada com seu próprio system prompt - **Janela de contexto** (Conceito): o buffer de tokens finito que armazena todo o histórico de conversa, chamadas de ferramentas e resultados; subagentes impedem que ele seja preenchido com trabalho intermediário - **Subagente de uso geral** (Software): subagente nativo do Claude Code para tarefas de exploração e ação em múltiplas etapas - **Subagente Explore** (Software): subagente nativo do Claude Code otimizado para busca rápida em bases de código - **Subagente Plan** (Software): subagente nativo do Claude Code que pesquisa o código durante o modo de planejamento antes de apresentar um plano - **Anthropic** (Organização): criadora do Claude e do Claude Code; produtora desta série de tutoriais

#claude-code#subagents#context-window
Terence Tao – Como o maior matemático do mundo usa IA
1:23:44
EN/ZH
Watch with Captions
Dwarkesh Patelhá 2 meses

Terence Tao – Como o maior matemático do mundo usa IA

Tao e Dwarkesh usam a descoberta de Kepler sobre o movimento planetário como lente para entender o que a IA está realmente mudando na ciência. Tao argumenta que gerar hipóteses é agora quase de graça, então o gargalo migra para a avaliação, a revisão por pares e o teste do tempo. As IAs atuais ganham em amplitude — tentam cada técnica padrão em cada problema — enquanto os humanos ganham em profundidade, acumulando avanços a partir de progresso parcial. Configurações híbridas vão dominar a matemática por pelo menos mais uma década. ## [00:00] Kepler era um LLM de alta temperatura Tao reconta como Kepler chegou às três leis do movimento planetário. Kepler partiu de uma teoria errada, porém bela — sólidos platônicos inscritos entre as órbitas dos planetas — e só a abandonou depois de anos analisando as observações a olho nu roubadas de Tycho Brahe. As elipses, a lei das áreas e a lei dos cubos emergiram de uma análise de dados que durou décadas, com a explicação de Newton chegando um século depois. O enquadramento de Dwarkesh: Kepler se parece com um LLM de alta temperatura que percorre relações aleatórias contra um conjunto de dados verificável. Tao concorda com a mecânica, mas questiona onde estava o gargalo. A geração de ideias já era barata — Kepler não faltavam teorias. O que ele precisava eram dos dados uma ordem de grandeza melhores que Brahe possuía e da paciência para descartar as ideias que os dados refutavam. > *Mas como você diz, isso tem que ser acompanhado por uma quantidade igual de verificação, caso contrário é lixo.* ## [11:44] Como identificar um novo conceito unificador em meio a toneladas de lixo gerado por IA? Tao: se a IA reduziu o custo de geração de ideias a quase zero, a revisão por pares e o teste do tempo se tornam a nova restrição. As revistas já estão se afogando em submissões geradas por IA. O valor de qualquer ideia depende do que a ciência posterior faz com ela — Copérnico era menos preciso do que Ptolomeu até Kepler completar o quadro — portanto a avaliação é difícil de automatizar de dentro do momento em que ocorre. Dwarkesh pergunta como a ciência identificaria um conceito unificador ao estilo Bell Labs — o bit de Shannon, o transformer — enterrado em milhões de artigos medíocres. A resposta de Tao aponta para o que pode permanecer humano: os cientistas não apenas produzem teorias, eles constroem narrativas que convencem outros cientistas a investir anos em desdobramentos. A prosa de Darwin fez o trabalho que as equações em latim de Newton não fizeram. > *A IA reduziu o custo de geração de ideias a quase zero, de forma muito semelhante a como a internet reduziu o custo de comunicação a quase zero.* ## [26:10] O excedente dedutivo Tao fala sobre o sinal inexplorado nos dados existentes. A astronomia é a disciplina que extrai o máximo de informação do mínimo de dados há séculos — o que também explica por que fundos de hedge quantitativos contratam preferencialmente PhDs em astronomia. Ele dá um exemplo favorito: pesquisadores mediram com que frequência os cientistas realmente leram os artigos que citam, rastreando quais erros tipográficos se propagavam pelas cadeias de citação. Ele sugere aplicar o mesmo tratamento da sociologia da ciência ao próprio progresso da IA — minerando padrões de citação, menções em conferências e outros rastros para detectar se um resultado realmente constituiu avanço, em vez de esperar que o teste do tempo o faça lentamente. > *Uma conclusão foi que o excedente dedutivo em muitos campos pode ser muito maior do que as pessoas percebem.* ## [30:31] Viés de seleção nas descobertas de IA relatadas A IA resolveu aproximadamente 50 dos cerca de 1.100 problemas de Erdős e depois estacionou. Tao explica o efeito de seleção: esses 50 tinham literatura quase inexistente — uma técnica obscura mais um resultado conhecido era suficiente, e as ferramentas de IA são excelentes em "tentar cada combinação padrão". Quando o problema tem 80% do trabalho feito por métodos existentes, a IA o resolve. Quando exige uma técnica genuinamente nova, as ferramentas param, e a taxa de sucesso por problema em varreduras sistemáticas é de 1 a 2%. A metáfora de Tao: as ferramentas de IA são robôs saltadores soltos em uma cordilheira, no escuro. Eles conseguem superar paredes baixas que os humanos não alcançam, mas não conseguem se agarrar a uma presa, permanecer ali e puxar a partir do progresso parcial. A leitura otimista — uma vez que as IAs atingem determinado nível, você pode rodar um milhão de cópias paralelas em um milhão de problemas, algo que nenhuma comunidade humana consegue fazer — é também a razão estrutural pela qual a ciência precisa de novos paradigmas que realmente explorem essa amplitude. > *Elas se destacam em amplitude, e os humanos se destacam em profundidade, os especialistas humanos ao menos.* ## [46:43] A IA torna os artigos mais ricos e amplos, mas não mais profundos Tao sobre seu próprio padrão de trabalho: os artigos agora trazem mais código, mais figuras, levantamentos bibliográficos mais aprofundados, porque as tarefas auxiliares ficaram cerca de 5 vezes mais baratas. O núcleo real — resolver a parte mais difícil de um problema — ainda acontece no papel. Ele reluta em se chamar "2 vezes mais produtivo" porque a métrica não é unidimensional; o que mudou é o tipo de artigo que ele escreve, não a velocidade com que responde à pergunta com que começou. A distinção entre habilidade e inteligência recai no mesmo lugar. Quando dois humanos colaboram em um problema matemático, cada protótipo fracassado se torna um ponto de apoio para o próximo. Com as IAs atuais, uma nova sessão esquece o que a anterior descobriu. A etapa cumulativa de avançar a partir do progresso anterior está ausente — restam apenas tentativa e erro brutos e, eventualmente, a absorção no próximo ciclo de treinamento. > *Isso tornou os artigos mais ricos e amplos, mas não necessariamente mais profundos.* ## [53:00] Se a IA resolve um problema, os humanos conseguem extrair compreensão disso? Uma IA poderia provar a hipótese de Riemann em Lean e nos deixar sem entender nada? Tao não está preocupado. O Lean tem a propriedade de que qualquer prova pode ser decomposta atomicamente — cada lema pode ser inspecionado, ablacionado e testado em isolamento. Assim, mesmo uma prova gerada de 3.000 linhas se torna matéria-prima: outras IAs podem refatorar em busca de elegância, outros humanos podem extrair o conteúdo conceitual, e o artefato ainda é útil mesmo que a derivação original seja opaca. Ele prevê uma profissão inteira de matemáticos cujo trabalho é desmontar provas gigantes geradas por Lean e encontrar as ideias dentro delas — uma espécie de arqueologia de provas, combinando julgamento humano com ferramentas de ablação por IA. > *Você vai extrair muito mais proveito da interação entre humanos colaborando com essas ferramentas.* ## [59:20] Precisamos de uma linguagem semiformal para a forma como os cientistas realmente se comunicam Dwarkesh pergunta como seria uma linguagem semiformal para estratégias matemáticas — em oposição a provas matemáticas. Tao traça a questão pelo teorema dos números primos de Gauss — a primeira conjectura estatística importante da matemática, derivada de dados brutos antes de qualquer prova existir — e pela conjectura dos primos gêmeos, em que os matemáticos acreditam porque o modelo aleatório dos primos a prediz. A matemática tem tanto provas rigorosas quanto heurísticas rigorosas; apenas o lado das provas foi formalizado em algo que o Lean pode verificar. O motivo pelo qual o lado heurístico não foi formalizado: qualquer avaliador verificável por aprendizado por reforço vira alvo de exploração, e o aspecto subjetivo de "esse argumento é convincente" ainda não admite uma estrutura que possa ser burlada. Tao adoraria uma forma de avaliar geração de conjecturas e seleção de estratégias em escala, possivelmente rodando pequenas IAs em universos matemáticos simplificados e observando quais estratégias emergem. > *Há um aspecto subjetivo da ciência que não sabemos como capturar de uma forma que permita inserir a IA de maneira útil.* ## [69:48] Como Terry usa seu tempo Tao sobre como absorve novos subcampos. Ele se posiciona como uma raposa no sentido de Berlin — sabe um pouco sobre tudo, mas vira ouriço quando necessário. O que o move é uma obsessão por completude: se outro matemático pode provar um resultado com uma técnica que ele não conhece, ele tem que descobrir qual era o truque. Ele teve que parar de jogar videogame pelo mesmo motivo. A colaboração com outros matemáticos é o principal veículo, e escrever no seu blog é o recurso de memória que desenvolveu depois de repetidamente perder argumentos seis meses após tê-los derivado. Na sua agenda, Tao deixa deliberadamente espaço para a serendipidade. Ele detestaria otimizar seu tempo a ponto de nunca sentar em uma reunião fora da sua zona de conforto. O ano que passou no Institute for Advanced Study confirmou a armadilha — duas semanas de pesquisa pura foram ótimas, depois ficou sem inspiração. A descoberta acidental na prateleira seguinte da biblioteca, a conversa informal no corredor e a reunião a que compareceu a contragosto faziam mais trabalho do que pareciam. > *Essas interações fortuitas podem não parecer ideais, mas são de fato muito importantes.* ## [77:05] Híbridos humano-IA vão dominar a matemática por muito mais tempo Quando a IA simplesmente fará matemática? Tao reenquadra a pergunta — a IA já faz matemática que os humanos não conseguem, como as calculadoras, só que em uma fronteira diferente. Em cerca de uma década, ele espera que grande parte do que os estudantes de pós-graduação fazem hoje — aplicar técnicas padrão, varrer a literatura — migre para a IA, mas o campo vai subir um nível assim como aconteceu quando os sistemas de álgebra computacional absorveram a integração simbólica. A genética não acabou quando o sequenciamento ficou barato; escalou para ecossistemas. A matemática vai fazer o mesmo. Seu conselho aos estudantes que ingressam na matemática agora: assuma que haverá mudanças, mas obtenha suas credenciais do jeito tradicional — por enquanto ainda não há substituto para trabalhar a matemática pelo caminho convencional. Ao mesmo tempo, fique adaptável o suficiente para usar modos inteiramente novos de pesquisa à medida que surgirem, incluindo os que ainda não existem. Um fato incomum é que, com ferramentas de IA e Lean, um estudante do ensino médio pode contribuir para pesquisa matemática real hoje, o que não era verdade há cinco anos. > *Acredito que os híbridos humano mais IA vão dominar a matemática por muito mais tempo.* ## Entidades - **Terence Tao** (Pessoa): Medalha Fields (2006), matemático da UCLA, escreve regularmente sobre o papel da IA na pesquisa matemática. - **Dwarkesh Patel** (Pessoa): Apresentador do Dwarkesh Podcast; entrevistas longas sobre IA, ciência e tecnologia. - **Johannes Kepler** (Pessoa): Astrônomo (1571-1630) que derivou as três leis do movimento planetário a partir das observações de Tycho Brahe. - **Tycho Brahe** (Pessoa): Astrônomo dinamarquês que fez décadas de observações planetárias a olho nu; seus dados foram essenciais para Kepler. - **Lean** (Software): Assistente de provas no qual provas matemáticas são formalizadas e podem ser verificadas, decompostas e ablacionadas atomicamente. - **Problemas de Erdős** (Conceito): Os aproximadamente 1.100 problemas em aberto propostos por Paul Erdős; a IA resolveu cerca de 50, quase todos com literatura anterior quase inexistente. - **O excedente dedutivo** (Conceito): A ideia de que os dados existentes já codificam muito mais conhecimento derivável do que foi extraído, tendo a astronomia como modelo. - **Hipótese de Riemann** (Conceito): Conjectura não resolvida sobre a distribuição dos primos; o caso de teste para saber se uma prova gerada por IA avançaria a compreensão matemática humana.

#ai-for-math#terence-tao#kepler
O que são skills?
2:54
EN/ZH
Watch with Captions
ClaudeClaude Code skillshá 3 meses

O que são skills?

As skills do Claude Code são arquivos markdown reutilizáveis que codificam conhecimento especializado uma única vez — o Claude então as ativa automaticamente sempre que uma solicitação corresponde, sem que o usuário precise repetir instruções ou digitar um comando. Este tutorial de três minutos explica o que são skills, onde ficam armazenadas, como diferem dos arquivos CLAUDE.md e o sinal que indica que é hora de criar uma. ## [00:03] O problema de repetição que as skills resolvem Toda vez que você explica os padrões de código da sua equipe, redescreve como quer o feedback de PR estruturado ou lembra o Claude do formato de commit message preferido, você está se repetindo. O narrador abre com três exemplos consecutivos para nomear exatamente o ponto de atrito que as skills resolvem. > *"Toda vez que você explica os padrões de código da sua equipe ao Claude, está se repetindo."* ## [00:20] O que é uma skill e como Claude escolhe uma Uma skill é um arquivo markdown que ensina o Claude a fazer algo uma vez. O Claude armazena a instrução e a aplica automaticamente sempre que a situação exige. No Claude Code, esse arquivo é o SKILL.md. O campo de descrição dentro desse arquivo é o mecanismo central: quando você pede ao Claude para revisar um PR, ele compara sua solicitação com todas as descrições de skills disponíveis e ativa a que corresponder. > *"Claude lê sua solicitação, compara com todas as descrições de skills disponíveis e ativa as que correspondem."* ## [01:05] Onde guardar skills: pessoal versus projeto As skills ficam em dois lugares, dependendo de quem precisa delas. As skills pessoais vão em ~/.claude/skills e acompanham você em todos os projetos: estilo de commit message, formato de documentação, como você prefere que o código seja explicado. As skills de projeto ficam em .claude/skills na raiz do repositório; qualquer pessoa que clonar o repositório as recebe automaticamente. É esse segundo local que guarda os padrões da equipe: diretrizes de marca, fontes e cores preferidas para design web. > *"Qualquer pessoa que clonar o repositório recebe essas skills automaticamente."* ## [01:42] Skills vs CLAUDE.md: automáticas e eficientes em contexto O Claude Code oferece várias camadas de personalização, e as skills ocupam um nicho distinto. Os arquivos CLAUDE.md carregam em toda conversa de forma incondicional — ideal para regras como "sempre use TypeScript strict mode". As skills carregam sob demanda, apenas quando correspondem à solicitação atual, e somente o nome e a descrição entram no contexto nesse momento. O corpo completo da skill só é carregado quando acionada. Isso mantém o checklist de revisão de PR fora da janela de contexto enquanto você está depurando, e o traz apenas quando você de fato pede uma revisão. Slash commands exigem que você os digite; skills, não. > *"Skills são únicas porque são automáticas e específicas para a tarefa."* ## [02:27] Quando criar uma skill Skills funcionam melhor para conhecimento especializado ligado a tarefas específicas: padrões de revisão de código que sua equipe segue, formatos de commit message, diretrizes de marca. A regra final é direta e prática: se você se pega explicando a mesma coisa ao Claude repetidamente, isso é uma skill esperando para ser criada. > *"Se você se pega explicando a mesma coisa ao Claude repetidamente, bem, isso é uma skill esperando para ser criada."* ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): narrador e apresentador da série de tutoriais de skills do Claude Code - **Claude Code** (Software): assistente de programação de IA da Anthropic; o ambiente onde as skills são descobertas e aplicadas - **SKILL.md** (Conceito): o arquivo markdown que define uma skill — contém nome, descrição e instruções para o Claude - **CLAUDE.md** (Conceito): arquivo de instruções em nível de projeto ou global que carrega em toda conversa do Claude Code de forma incondicional, em contraste com as skills - **Anthropic** (Organização): criadora do Claude e do Claude Code

#claude-code#ai-tools#developer-productivity
Compartilhando skills
3:53
EN/ZH
Watch with Captions
ClaudeClaude Code skillshá 3 meses

Compartilhando skills

Uma skill de revisão de PR usada por um único engenheiro é útil; a mesma skill implantada em toda a equipe padroniza as revisões de código e cria uma experiência consistente em toda a organização. Este tutorial percorre quatro métodos concretos de distribuição — commits em repositório, plugins, configurações gerenciadas corporativas e sub-agentes personalizados — e explica exatamente quando cada um se aplica. A seção de sub-agentes traz um detalhe não óbvio: sub-agentes não herdam skills automaticamente, e agentes nativos não conseguem acessá-las de forma alguma. ## [00:01] Por que compartilhar multiplica o valor das skills Uma skill restrita a um desenvolvedor faz seu trabalho. A mesma skill distribuída para toda a equipe consolida padrões, elimina variações individuais e garante que cada revisão tenha o mesmo aspecto e sensação. O narrador abre com um contraste direto entre uso individual e em escala de equipe, antes de listar os quatro mecanismos de compartilhamento. > *"A PR review skill that only you use is helpful. The same skill shared across your team standardizes code review and provides a consistent experience amongst your organization which is much better."* ## [00:18] Enviando skills para o repositório O método de menor atrito: coloque as skills em `.claude/skills` dentro do repositório do projeto. Qualquer pessoa que clonar o repositório recebe essas skills imediatamente — sem etapa de instalação, sem ferramentas extras. As atualizações chegam pelo ciclo normal de `git pull`. Esse caminho é ideal para padrões de codificação da equipe, fluxos de trabalho específicos do projeto e skills que referenciam a própria estrutura da base de código. > *"Anyone who clones the repository gets these skills automatically. No extra installation, it's just what you're doing already."* ## [00:45] Distribuindo skills por plugins Plugins estendem o Claude Code com funcionalidades personalizadas projetadas para ir além de um único projeto. Dentro do projeto do plugin, um diretório `skills/` espelha a estrutura de `.claude/` — nome da skill, `SKILL.md`. Uma vez publicado em um marketplace, qualquer usuário do Claude Code pode baixar e ativar o plugin. Esse canal é mais adequado para skills genéricas o suficiente para servir à comunidade em geral, e não apenas às convenções de uma equipe. > *"Think of plugins as ways to extend Claude Code with custom functionality, but designed to be shared across teams and projects."* ## [01:26] Implantação corporativa via configurações gerenciadas Administradores podem distribuir skills para todos os desenvolvedores de uma organização por meio das configurações gerenciadas. Skills corporativas têm a mais alta prioridade: sobrepõem skills pessoais, de projeto e de plugins que compartilhem o mesmo nome. O uso pretendido é para padrões obrigatórios — requisitos de segurança, fluxos de conformidade, práticas de codificação que precisam ser uniformes. O narrador enfatiza explicitamente a palavra "obrigatório": não são sugestões. > *"This is for mandatory standards, security requirements, compliance workflows, or coding practices that must be consistent across the organization."* ## [01:52] Sub-agentes personalizados e carregamento explícito de skills Sub-agentes não herdam as skills da conversa principal. Agentes nativos (explorer, planner, verify) não conseguem acessar skills de forma alguma. Apenas sub-agentes personalizados — definidos por um arquivo `agent.md` em `.claude/agents` — podem usar skills, e somente as listadas explicitamente no campo `skills:` desse arquivo. As skills são carregadas quando o sub-agente inicia, não sob demanda, portanto a lista deve ser enxuta: apenas as skills sempre relevantes ao propósito do agente. O tutorial demonstra como criar um sub-agente com o criador de sub-agentes do Claude Code e como anexar skills a um `agent.md` existente. > *"Built-in agents like the explorer, planner, and verify can't access skills at all. Only custom sub-agents you define can use them, and only when you explicitly list them."* ## [03:18] Recapitulando: escolhendo o método de distribuição certo A conclusão mapeia cada método ao seu cenário: diretórios de projeto para acesso em equipe, plugins para compartilhamento entre repositórios, implantação corporativa para padrões obrigatórios em toda a organização, e listas explícitas de skills para sub-agentes com delegação de tarefas isoladas. O lembrete sobre sub-agentes volta mais uma vez — liste apenas as skills sempre relevantes ao trabalho de um determinado agente, pois elas são carregadas na inicialização, não de forma preguiçosa. > *"Share skills through project directories for team access, plugins for cross-repository distribution, or enterprise deployment for organization-wide standards."* ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): apresentador único da série de tutoriais de skills do Claude Code - **Claude Code** (Software): assistente de codificação com IA da Anthropic; o ambiente de execução onde as skills são criadas e implantadas - **Skills** (Conceito): conjuntos de instruções reutilizáveis em `.claude/skills` que estendem o comportamento do Claude Code - **Plugins** (Conceito): pacotes distribuíveis que agrupam skills para compartilhamento entre equipes e usuários de marketplace - **Managed settings** (Conceito): mecanismo de administrador corporativo para implantar skills em toda a organização com prioridade máxima de sobreposição - **Sub-agents** (Conceito): agentes personalizados do Claude Code definidos via `agent.md` em `.claude/agents`; o único tipo de agente que pode carregar skills, e somente quando listadas explicitamente - **Anthropic** (Organização): empresa que construiu o Claude Code e produz a série de tutoriais de skills do Claude Code

#claude-code#skills#developer-tools
Configuração e skills com múltiplos arquivos
4:04
EN/ZH
Watch with Captions
ClaudeClaude Code skillshá 3 meses

Configuração e skills com múltiplos arquivos

Um tutorial de quatro minutos da série Claude Code skills cobrindo os campos de configuração avançados que transformam uma skill básica em uma ferramenta confiável e eficiente no uso de contexto. O narrador percorre o conjunto completo de campos do padrão agentskills.io — `name`, `description`, `allowed_tools`, `model` — e explica como estruturar skills maiores usando divulgação progressiva, de modo que o material de referência e os scripts só sejam carregados quando necessário, não a cada invocação. ## [00:02] Visão geral dos campos avançados de skill O padrão aberto agentskills.io define vários campos além dos obrigatórios `name` e `description`. `name` deve ser em minúsculas com hífens, limitado a 64 caracteres, e deve corresponder ao nome do diretório. `description` tem no máximo 1.024 caracteres e é o principal sinal que o Claude usa para correspondência de skills. Dois campos opcionais completam a configuração: `allowed_tools`, que restringe quais ferramentas a skill pode invocar, e `model`, que vincula a skill a uma versão específica do Claude. > *"A basic skill works with just a name and description, but here are some other advanced tips that can make your skills really effective in Claude Code."* ## [00:39] Escrevendo descrições eficazes Uma descrição vaga — "ajudar com cães" — deixa o Claude adivinhando escopo e gatilhos. Uma boa descrição responde exatamente a duas perguntas: o que essa skill faz e quando o Claude deve usá-la? Alinhar palavras-chave à linguagem natural das solicitações dos usuários é o mecanismo para corrigir skills que não disparam corretamente. > *"A good description answers two questions. What does this skill do? And when should Claude use it?"* ## [01:20] Restringindo ferramentas com allowed_tools `allowed_tools` é o mecanismo para limitar uma skill a uma superfície definida — acesso somente leitura para fluxos de trabalho sensíveis à segurança, por exemplo. Com o campo configurado, o Claude só pode chamar essas ferramentas sem pedir permissão; sem edição, escrita ou Bash. Omitir o campo deixa o modelo de permissões normal do Claude intacto. > *"When this skill is active, Claude can only use those tools without asking permission. No editing, no writing, no bash commands."* ## [01:49] Divulgação progressiva para skills com múltiplos arquivos As skills compartilham a janela de contexto do Claude com a conversa em andamento. Colocar tudo em um único `SKILL.md` de 20.000 linhas infla o contexto a cada invocação e torna o arquivo difícil de manter. A solução: colocar as instruções essenciais no `SKILL.md` e mover o material de referência para arquivos separados que o Claude lê apenas quando a solicitação do usuário realmente os exige. O padrão sugere três diretórios de suporte — `scripts/` para código executável, `references/` para documentação e `assets/` para imagens e templates. Um link no `SKILL.md` funciona como uma entrada de sumário; se o tópico nunca aparecer, o arquivo nunca é carregado. Scripts no diretório da skill são executados sem que seu código-fonte seja carregado no contexto — apenas a saída consome tokens. O narrador recomenda manter o `SKILL.md` com menos de 500 linhas; ultrapassar esse limite é sinal de que a skill deve ser dividida. > *"It's like having a table of contents in the context window rather than fitting the whole entire document in there."* ## [03:18] Recapitulação: metadados de skill e boas práticas O tutorial encerra reafirmando a superfície de configuração completa: `name` e `description` são obrigatórios; `allowed_tools` restringe a superfície de ferramentas; `model` fixa a versão do Claude. As descrições precisam de verbos de ação concretos e frases de gatilho para corresponder com confiança. Para skills maiores, a divulgação progressiva mantém o `SKILL.md` abaixo de 500 linhas e adia os arquivos de suporte até que sejam realmente necessários. Scripts executam sem carregar o código-fonte, mantendo o contexto enxuto. > *"Scripts can execute without loading their contents, keeping context efficient."* ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): apresentador único desta série de tutoriais, explicando a configuração de skills do Claude Code. - **Claude Code** (Software): ferramenta CLI da Anthropic que carrega e executa skills seguindo o padrão agentskills.io. - **agentskills.io** (Organização): padrão aberto que define o schema do manifesto de skills, incluindo `name`, `description`, `allowed_tools`, `model` e convenções de diretório. - **SKILL.md** (Conceito): arquivo de manifesto principal de uma skill do Claude Code; deve ter menos de 500 linhas com links para arquivos de suporte. - **allowed_tools** (Conceito): campo opcional de skill que lista ferramentas específicas do Claude em uma whitelist, permitindo modos somente leitura ou em sandbox. - **Progressive disclosure** (Conceito): estruturar uma skill com múltiplos arquivos de modo que arquivos de referência e scripts sejam carregados no contexto apenas quando a solicitação ativa os exige. - **Context window** (Conceito): orçamento de tokens compartilhado entre a conversa e qualquer arquivo de skill que o Claude carrega; o principal recurso que a divulgação progressiva foi projetada para conservar.

#claude-code#skills#configuration
Criando sua primeira skill
3:47
EN/ZH
Watch with Captions
ClaudeClaude Code skillshá 3 meses

Criando sua primeira skill

Este tutorial de 3 minutos mostra como construir uma skill pessoal no Claude Code partindo do zero: criar um diretório com um arquivo SKILL.md, verificar se a skill é carregada na inicialização e observar o Claude aplicando-a em uma solicitação real. A segunda metade explica como funciona o pipeline de carregamento de skills — desde os quatro locais de varredura e a passagem inicial só com nome, até a confirmação do usuário e a hierarquia de quatro camadas que resolve conflitos de nomenclatura. ## [00:03] O Que Este Tutorial Constrói O narrador começa com o objetivo concreto: uma skill que ensina o Claude a explicar código usando diagramas visuais e analogias. Depois de criá-la, o tutorial acompanha o que acontece internamente quando o Claude identifica e executa uma skill. > *"Essa skill vai ensinar ao Claude como gostaríamos que ele explicasse código usando diagramas visuais e analogias."* ## [00:18] Criando o Arquivo de Skill Skills pessoais ficam no diretório home, não dentro de um projeto — então o primeiro passo é criar um novo diretório com o nome da skill dentro de `~/.claude/skills/`. Dentro desse diretório vai um único arquivo `SKILL.md`. Três seções são essenciais: `name` (o identificador que o Claude armazena na inicialização), `description` (os critérios que o Claude usa para decidir se invoca a skill) e tudo após o segundo delimitador `---` (as instruções que o Claude segue quando a skill é ativada). > *"Leve em conta que estamos criando um diretório com o nome da skill dentro do diretório de skills."* ## [00:52] Carregando e Testando Sua Skill O Claude Code varre skills na inicialização, não sob demanda — portanto é preciso reiniciar a sessão após criar o arquivo. Executar `/skills` deve listar "PR description" (ou a skill que acabou de ser criada). Para testar, crie uma branch com algumas alterações e envie a solicitação em linguagem natural "Write a PR description for my changes." O Claude indica que está invocando a skill de PR description, lê o diff e escreve uma descrição seguindo o modelo — no mesmo formato todas as vezes. > *"O Claude vai mostrar que está usando a skill de PR description."* ## [01:25] Como o Claude Carrega Skills Internamente Na inicialização, o Claude Code varre quatro locais: configurações corporativas gerenciadas, `~/.claude/skills/` pessoal, o diretório `.claude/` do projeto e plugins instalados. Ele carrega apenas o `name` e a `description` — não o conteúdo completo. Quando uma solicitação chega, o Claude compara com as descrições armazenadas; "explique o que esta função faz" se sobrepõe a "explicar código com diagramas visuais", então a skill corresponde. O Claude pede confirmação antes de ler o SKILL.md completo, mantendo o usuário ciente do contexto injetado. > *"Ele carrega apenas o nome e a descrição de cada skill, não o conteúdo completo. Isso é importante mais adiante."* ## [02:02] Regras de Prioridade e Conflitos de Nome Clonar um repositório que já traz suas próprias skills pode criar colisões de nome. O Claude resolve isso com uma hierarquia fixa: corporativo (maior prioridade) → pessoal → projeto → plugins (menor prioridade). Uma skill `code-review` corporativa sempre prevalece sobre a pessoal. A solução prática é usar nomes descritivos — `security-review` ou `frontend-pr-review` em vez do genérico `review` — para que conflitos nunca ocorram. > *"Se sua empresa tem uma skill corporativa de code review e você cria uma skill pessoal de code review, a versão corporativa tem precedência."* ## [02:52] Atualizando e Removendo Skills Atualizar uma skill é uma edição direta de arquivo: abra o SKILL.md, faça as alterações e salve. Remover uma skill significa apagar o diretório. Ambas as operações exigem reiniciar o Claude Code para entrar em vigor — a lista de skills é construída uma vez na inicialização da sessão, sem monitoramento de alterações ao vivo. > *"Edite o arquivo skill.md para atualizar uma skill e reinicie o Claude Code para que as mudanças entrem em vigor."* ## Entidades - **Narrador do Tutorial Anthropic** (Pessoa): apresentador único que conduz o tutorial de criação de skills para a série Claude Code skills - **Claude Code** (Software): CLI da Anthropic para Claude; varre skills na inicialização e as aplica quando solicitações do usuário correspondem às descrições das skills - **SKILL.md** (Conceito): o arquivo único que define uma skill — contém frontmatter YAML (name, description) e texto de instrução livre após o segundo delimitador `---` - **Skills** (Conceito): conjuntos de instruções reutilizáveis e nomeados que ensinam ao Claude um padrão de comportamento consistente; armazenados como diretórios contendo um arquivo SKILL.md - **Enterprise Skills** (Conceito): skills gerenciadas pela organização que ficam no topo da hierarquia de quatro camadas, sobrepondo-se a skills pessoais, de projeto e de plugins - **Anthropic** (Organização): criadora do Claude e do Claude Code; produz esta série de tutoriais em claude.com/resources/courses

#claude-code#skills#developer-tools
Como skills se comparam a outros recursos do Claude Code
3:01
EN/ZH
Watch with Captions
ClaudeClaude Code skillshá 3 meses

Como skills se comparam a outros recursos do Claude Code

O Claude Code oferece aos desenvolvedores cinco formas distintas de customização — Skills, CLAUDE.md, subagentes, hooks e servidores MCP — cada uma projetada para um propósito diferente. Este tutorial de três minutos mapeia cada opção ao seu caso de uso correto, para que você não recorra a Skills quando CLAUDE.md resolve, nem configure um hook quando o que precisa é de um subagente. ## [00:02] Cinco opções de customização, um problema de decisão O Claude Code oferece cinco maneiras de moldar seu comportamento: Skills, CLAUDE.md, subagentes, hooks e servidores MCP. O narrador apresenta todos os cinco rapidamente e reorienta a questão de "o que são esses recursos?" para "qual deles serve aqui?" > *"Eles resolvem problemas diferentes. Saber quando usar cada um evita que você construa a coisa errada."* O restante do tutorial é essencialmente uma resposta a essa frase. ## [00:18] CLAUDE.md vs Skills: sempre ativo vs sob demanda CLAUDE.md é um arquivo que o Claude lê no início de cada conversa, sem necessidade de ativação. É o lugar certo para restrições do projeto que nunca podem ser esquecidas — escolhas de framework, estilo de código, regras de banco de dados. As Skills, por sua vez, carregam sob demanda: seu checklist de revisão de PRs só entra no contexto quando você realmente pede uma revisão, não enquanto está escrevendo código novo. > *"Use Claude MD para padrões do projeto que sempre se aplicam — restrições como nunca modificar o schema do banco de dados, preferências de framework e estilo de código."* A linha divisória é permanência versus relevância. Se a instrução deve valer para todo prompt do projeto, ela pertence ao CLAUDE.md. Se é útil apenas às vezes, ela pertence a uma Skill. ## [01:03] Skills vs Subagentes: contexto compartilhado vs execução isolada As Skills injetam conhecimento na conversa atual — suas instruções se integram ao contexto existente. Os subagentes funcionam de forma diferente: recebem uma tarefa, criam um contexto de execução separado, trabalham de forma independente e devolvem os resultados sem tocar na conversa principal. > *"Use subagentes quando quiser delegar uma tarefa a um contexto de execução separado. Você precisa de acesso a ferramentas diferentes das da conversa principal. Quer isolamento entre o trabalho delegado e seu contexto principal."* Use Skills quando o conhecimento deve guiar o raciocínio do Claude ao longo de uma conversa em andamento. Use subagentes quando quiser uma fronteira clara entre a sessão principal e uma unidade de trabalho delegada — ferramentas diferentes, sem contaminação cruzada. ## [01:42] Hooks vs Skills: orientado a eventos vs orientado a requisições Hooks disparam automaticamente em resposta a eventos — executar um linter toda vez que o Claude salva um arquivo, validar uma entrada antes de uma chamada de ferramenta específica. Eles não são ativados pelo que você pede; são ativados pelo que o Claude faz. Skills são o oposto: orientadas a requisições, ativando quando uma consulta corresponde a elas. > *"Um hook pode executar um linter toda vez que o Claude salva um arquivo ou validar a entrada antes de certas chamadas de ferramenta. São todos orientados a eventos, enquanto as skills são orientadas a requisições. Elas ativam com base no que você está pedindo."* Se o comportamento deve ocorrer incondicionalmente em um evento do sistema, é um hook. Se deve moldar como o Claude pensa quando solicitado, é uma Skill. ## [02:15] Combinando todos os cinco para customização abrangente Uma configuração bem estruturada do Claude Code usa cada ferramenta em seu papel natural: CLAUDE.md para padrões do projeto sempre ativos, Skills para conhecimento específico de tarefas que não deve poluir todo prompt, hooks para efeitos colaterais automatizados, subagentes para trabalho delegado isolado e servidores MCP para acesso a ferramentas externas. Não são alternativas — eles se compõem. > *"Não force tudo em skills quando outra opção se encaixa melhor. Você pode usar múltiplas ao mesmo tempo."* Skills ativam automaticamente quando um tema é relevante; CLAUDE.md está sempre presente; subagentes rodam em isolamento; hooks disparam em eventos; MCP fornece ferramentas externas. Escolha a camada certa para cada preocupação e combine-as livremente. ## Entidades - **Anthropic Tutorial Narrator** (Pessoa): Apresentador desta série de tutoriais de skills do Claude Code, em nome da Anthropic. - **Claude Code** (Software): Assistente de programação baseado em IA da Anthropic; objeto da série de tutoriais. - **Skills** (Conceito): Pacotes de conhecimento sob demanda que ativam quando o Claude reconhece uma requisição do usuário; injetam instruções no contexto da conversa atual. - **CLAUDE.md** (Conceito): Arquivo de configuração carregado automaticamente em toda conversa do Claude Code; usado para padrões e restrições do projeto sempre ativos. - **Subagentes** (Conceito): Contextos de execução separados criados para lidar com tarefas delegadas em isolamento da conversa principal. - **Hooks** (Conceito): Automação orientada a eventos que dispara em ações específicas do Claude, como salvar um arquivo ou fazer chamadas de ferramenta, independentemente das requisições do usuário. - **MCP Servers** (Software): Servidores do Model Context Protocol que fornecem ferramentas externas às sessões do Claude Code. - **Anthropic** (Organização): Criadora do Claude Code e publicadora da série de tutoriais de skills do Claude Code.

#claude-code#skills#claude-md