LaiDub

Podcasts

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496
4:18:22
EN/ZH
Watch with Captions
Lex Fridman२० दिन पहले

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496

Lex Fridman sits down with Jean-Baptiste Kempf, president of VideoLAN and lead developer of VLC, and Kieran Kunhya, longtime FFmpeg contributor and the voice behind the infamous FFmpeg account on X, for a four-hour deep dive into the invisible machinery behind virtually all video on the internet. Together they trace the full arc from raw bytes and container formats through hand-written assembly and codec reverse-engineering, confronting the open-source sustainability crisis along the way. The conversation is both a technical masterclass and a meditation on why brilliant volunteers—many of them teenagers—quietly build infrastructure that powers billions of devices every day. ## [00:00] Episode highlight The episode opens with a rapid-fire highlight reel that captures the spirit of what follows. Kempf distills the FFmpeg community's core value: code quality is the only credential that matters—"Maybe you're a dog. I don't care. I need to look at your code." Kunhya adds the scale: FFmpeg is running on roughly 100 million CPUs at any moment, with three billion devices continuously decoding video, and FFmpeg's x86 assembly hand-optimization runs 62 times faster than equivalent C. The segment also previews the CIA-VLC spy story, the intelligence-agency backdoor request Kempf flatly refused, and Kieran's "no regrets" Twitter philosophy. > *"We care about excellent code. We don't care who you are. Like maybe you're a dog. I don't care, right? I need to look at your code."* — Jean-Baptiste Kempf ## [02:17] Introduction Lex sets the scene: FFmpeg is the invisible backbone behind YouTube, Netflix, Chrome, VLC, Discord, and nearly every platform that touches video or audio. VLC has been downloaded more than 6.5 billion times. Both projects are built entirely by volunteers. Lex frames the episode not merely as a technical discussion but as a tribute to engineers who work for the craft rather than for fame or money—"one of the great examples of human beings quietly collaborating across borders to build something useful, durable, and elegant." > *"It is one of the most incredible software systems ever developed, and it's all done by volunteers."* — Lex Fridman ## [05:35] Weirdest things VLC opens The conversation lightens up with playful examples of VLC's legendary tolerance for exotic formats. Kempf describes users capturing VHS tapes via capture cards, support for DVD-Audio with custom encryption, and the Lucasfilm Star Wars game codec that FFmpeg implemented for a single 10-second opening sequence. At a VideoLAN conference, a competition to create the most broken file ever—an MKV where every frame changed resolution, aspect ratio, and rotation—ended with VLC playing it perfectly. The orange traffic-cone logo is discussed: so recognizable that 25% of VLC's website traffic arrives from people searching "cone player." > *"There was a file that's a valid ZIP and a valid MP3 at the same time or something like that—and VLC opened all of the stupid files."* — Kieran Kunhya ## [09:59] How video playback works Kempf and Kunhya walk through what happens the moment you press play: the player fetches a byte stream from a URL, the demuxer separates audio, video, and subtitle tracks, entropy decoding removes mathematical compression, intra prediction reconstructs still-image frames (I-frames), motion-compensation handles temporal redundancy (P- and B-frames), and the final raw pixels are handed to the GPU or audio card. Video compression achieves 100x to 200x reduction by exploiting how human eyes perceive luminance versus color—working in YUV space rather than RGB—and by reusing unchanged background regions across frames. Kunhya warns that every single sentence in this pipeline represents someone's lifetime of work. > *"Everything we've just said in the past couple of minutes, every sentence is someone's lifetime's work. There are books about every sentence."* — Kieran Kunhya ## [19:20] Video codecs and containers The hosts clarify the often-confused distinction between containers and codecs. A container (MP4, MKV, MOV) multiplexes audio, video, and subtitle tracks; the codec (H.264, AV1) compresses the content inside. VLC and FFmpeg deliberately ignore the file extension and probe the actual bytes—because in the real world, extensions lie. The segment covers how AVI was Microsoft's format, MOV became MP4 via Apple, and the Matroska/MKV format emerged from the open-source community. Modern codecs like AV1 are not single algorithms but collections of tools that adapt to content type—screen share, animation, live video—each requiring different coding strategies. > *"We discard the file format. We look into the file to understand what's in it because so many people say, 'Oh, it's a video, it must be MP4,' but technically it's an MOV or maybe it's a MKV."* — Jean-Baptiste Kempf ## [30:07] FFmpeg explained FFmpeg is described as a low-level library suite—libavcodec, libavformat, libavfilter—plus a command-line tool so expressive that Kempf calls it a full programming language. Every person watching a YouTube video, recording with OBS, or editing in a professional broadcast box is likely touching FFmpeg. Kunhya notes that trillion-dollar corporations and grandmothers with home videos operate on exactly the same technology stack. The segment dives into open-source licensing—MIT, GPL, LGPL, AGPL—as "social contracts" that define community norms. Kempf recounts the painstaking process of re-licensing VLC's core from GPL to LGPL, requiring him to track down more than 350 contributors, including visiting the factory-worker father of a deceased contributor to obtain permission for two lines of code. > *"From a philosophical level, it's incredible that your grandmother's home videos and trillion-dollar corporations are on a level playing field using the same technology stack."* — Kieran Kunhya ## [51:07] Linus Torvalds Kempf offers a nuanced defense of Linus Torvalds's legendary harshness. The Linux kernel's core community is tiny—as is FFmpeg's (10–15 active maintainers)—and those few people must maintain every line of code forever. "We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code." Kunhya adds that terseness is often simply fatigue: volunteers arrive home after a full day of work and review patches without the bandwidth to hand-hold. Kempf also points out that most community members are non-native English speakers, and cultural misreadings amplify perceived hostility. > *"We cannot compromise on quality because the core community of FFmpeg is ten to fifteen, and we are the ones who are going to maintain your code."* — Jean-Baptiste Kempf ## [55:46] Turning down millions to keep VLC ad-free Kempf traces VLC's unlikely origin: a French engineering school (École Centrale Paris) whose student-run campus built a satellite video-streaming system in 1995—a decade before YouTube—just to enable faster networks for video games. From that Network 2000 project grew VideoLAN, and VLC emerged as its client. Kempf joined in 2003 when the project had nearly died, grew it from hundreds of thousands to billions of installs, and along the way repeatedly refused "obscene" offers to bundle toolbars, change search engines, or insert advertisements. His reasoning: "I need to go to bed at night and be happy about what I've done. If I had sold out, I would have betrayed so many other people who work here." > *"I refuse dozens of millions of dollars, yes, several times. Yes, I could be a multimillionaire and be somewhere on the beach. But I did not do it because I thought it was not moral and it was not the right thing to do."* — Jean-Baptiste Kempf ## [70:04] FFmpeg & Google drama Kunhya recounts a public controversy in which Google's security team used AI to auto-generate bug reports for FFmpeg, filing them under tight 90-day deadlines—with some vulnerability reports going to the press before patches could be written—without contributing corresponding fixes or meaningful funding. Kunhya compares it to "a denial of service by AI-generated bug reports" on obscure 1990s game codecs. The saga escalated via spicy FFmpeg tweets (a "rap battle" in Kunhya's words), but produced concrete results: Google began sending patches and established a financial reward system for fixes. A parallel incident saw Microsoft Teams engineers file a high-priority bug on the volunteer tracker, name-dropping their product's scale, and offering a one-time payment of a few thousand dollars in response to a request for a long-term support contract. > *"Google uses FFmpeg at a scale probably you or I couldn't even contemplate—millions of CPU cores. And yes, they contribute in areas mostly regarding their own products. But in a wider sense, there's a disproportionate level of contribution."* — Kieran Kunhya ## [89:18] FFmpeg developers What motivates FFmpeg's volunteer engineers? Kempf identifies three drivers: passion for the subject matter (many contributors arrived because they loved anime), excellence of the craft ("this is the best school ever of programming"), and pride in impact ("you can tell your grandma: I do this so you can play video on your laptop"). Kunhya adds that Andrew Kelley, creator of the Zig programming language, was an FFmpeg developer who credits his time there as his real-world education. Teenagers have written thousands of lines of hand-optimized assembly for FFmpeg. Kieran's favorite quote, from John Collison: "The world is a museum of passion projects." > *"If you're good in C, if you know how to write assembly in FFmpeg, I assure you you're going to be one of the best programmers ever—even if you're working on writing TypeScript."* — Jean-Baptiste Kempf ## [95:55] VLC and FFmpeg Kunhya frames the FFmpeg-VLC relationship as a "binary star system": VLC is to FFmpeg as Android is to Linux—they depend on each other and succeed because of each other. Roughly 80% of FFmpeg pipelines depend on at least one VideoLAN project (most often x264). VLC gives FFmpeg exposure to a vast zoo of real-world broken files. When compiled for Windows, VLC links against about 16 million lines of code, of which only 1 million live in the VLC repository itself. The two projects share many developers and collectively demonstrate that complex software ecosystems can be built entirely from interdependent open-source components. > *"VLC is to FFmpeg as Android is to Linux. They depend on each other, but they coexist because of each other."* — Kieran Kunhya ## [100:29] History of FFmpeg The "eras tour" of FFmpeg begins with Fabrice Bellard creating the initial concept, followed by the Michael Niedermayer era of the early 2000s—exhaustive support for DivX, Xvid, Windows Media, and RealMedia, eliminating the need for bloated, spyware-ridden codec packs. The late 2000s brought H.264 maturity and the rise of high-definition video. Throughout, VLC served as FFmpeg's field test: millions of users exposing edge cases that no lab could anticipate. > *"At the time you needed a new player to play every different type of file format. Having a single library that was fast and open source—that was a massive achievement."* — Kieran Kunhya ## [103:46] Reverse engineering codecs The segment showcases the art of reverse engineering proprietary codecs. Kostya Shishkov—described as "borderline genius"—reverse-engineered 20–30 megabyte binary blobs (each megabyte representing roughly a month of normal work) for fun, producing decoders for Windows Media, RealMedia, and GoToMeeting formats. Kunhya explains the methodology: hook into the proprietary player to dump raw YUV data, open a disassembler, step through machine code instruction by instruction to infer the entropy coding, prediction, and IDCT stages, then validate bit-exactness against sample files. For months, the work produces no visible output—pure debugging in memory. > *"He looked at the world as a binary specification. He didn't need documentation or anything. He would go away and come back and do interesting stuff."* — Kieran Kunhya ## [117:01] FFmpeg testing FFmpeg's FATE (FFmpeg Automated Testing Environment) system runs a pivot table of test combinations: dozens of compilers (GCC, Clang, MSVC, Apple Clang, Intel Compiler), operating systems (Linux, macOS, Windows, BSD, Solaris), and CPU architectures (x86, ARM, RISC-V, PowerPC). All test machines are volunteer-hosted. The system catches compiler miscompilations—rare but devastating, since even a single wrong bit in a frame dependency chain can cascade into major visual corruption. Kunhya notes that the Macs at the top of the FATE dashboard are hosted in his own office. > *"It's not just a matrix at this point. It's like a pivot table of different combinations—all run by volunteers."* — Kieran Kunhya ## [121:08] Assembly code (handwritten) This extended chapter is the technical heart of the episode. Handwritten x86/ARM SIMD assembly in FFmpeg and x264 runs up to 62 times faster than equivalent C—a gap that modern compilers and auto-vectorization cannot close despite years of trying. VLC still supports Windows XP through Windows 11, macOS 10.7 through macOS 26, iOS 9 through the latest, BSD, Solaris, and even OS/2. Understanding assembly forces programmers to internalize CPU pipeline stages, SIMD registers, L1/L2/L3 cache, and memory bus constraints. Kempf and Kunhya introduce the x86inc framework built by Loren Merritt for x264 and JB's Assembly Lessons tutorial series, which have attracted contributions from teenagers learning directly from the source. > *"I believe it's necessary to understand assembly language, even if you don't do it much, to understand what's going on inside your computer. That will make you a better programmer."* — Jean-Baptiste Kempf ## [145:26] Rust programming language Kempf and Kunhya hold divergent opinions on Rust. Kunhya respects the memory-safety goal but finds the community self-important—"It has a very big Esperanto vibe"—and argues that Rust rewrites reaching only 85–90% of required feature coverage are insufficient; "the last 1% takes 99% of the time." Kempf has written Rust VLC modules and sees genuine value, but notes that the lack of training data for low-level SIMD work means AI tools cannot yet assist meaningfully. The discussion broadens to the two assembly wizards of the community: Henrik Gramner, whose knowledge of Intel x86 cycle counts exceeds Intel's own engineers, and Martin Storsjö, who writes ARM Neon assembly on a virtual keyboard while watching his kids play in the playground. > *"Rust reminds me of the Sinclair C5. In order to get people to move, you have to build something as good as, if not better than, what you have now."* — Kieran Kunhya ## [154:42] FFmpeg and Libav fork In 2011, FFmpeg split into FFmpeg and Libav, primarily over governance and leadership style rather than technical disagreements. Several Linux distributions temporarily shipped Libav instead of FFmpeg. Kempf describes open-source forks as healthy—they force projects to confront structural weaknesses. Eventually most of Libav's developers returned to FFmpeg, and the projects merged back. Kempf draws a parallel to the XZ Utils attack, where a lone maintainer, exhausted by coordinated social engineering, granted commit access to an attacker—highlighting how burnout creates the very single-point-of-failure vulnerabilities that make critical open-source infrastructure fragile. > *"Forks are important because they change the status quo of a community. FFmpeg today is better than it was before the fork."* — Jean-Baptiste Kempf ## [163:04] Open source burnout Kempf and Kunhya confront the mental health crisis among open-source maintainers. Kempf has received physical death threats—including a letter containing powder—over decisions such as dropping PowerPC support. The security community's habit of filing alarming CVEs for hobby-project edge cases adds psychological load without providing patches. Kempf now maintains several libraries whose original maintainers burned out. The conversation broadens to the systemic problem: critical infrastructure like libxml and XZ is maintained by one or two people, unknown to the trillion-dollar enterprises that depend on them. > *"The mental health of the open source maintainers is something that large corporations don't care or don't see."* — Jean-Baptiste Kempf ## [170:51] x264 and internet video H.264 transformed internet video by arriving exactly when Intel Core 2/Nehalem CPUs made real-time software decoding practical. The key innovation of x264 was psychovisual rate-distortion optimization—encoding decisions driven by visual quality metrics rather than mean squared error, producing sharper, more natural-looking video. This was driven by the anime community's high standards for perceived sharpness. AV1 offers 40–60% bandwidth savings over H.264 at the same quality, but encoding costs two orders of magnitude more CPU. YouTube therefore re-encodes only popular videos in AV1, making the extra compute worthwhile by amortizing it over millions of viewers. > *"Thirty percent of the video from Netflix is now in AV1, fifty percent of YouTube."* — Jean-Baptiste Kempf ## [184:07] Video compression basics The chapter clarifies I/P/B frame structure: I-frames are complete still images, P-frames reference only previous frames, and B-frames can reference both past and future frames. ProRes is an intra-only codec designed for nonlinear editing—no temporal dependencies, fast seeking. The segment also covers constant-bitrate versus constant-quality encoding, group-of-pictures length, and the thousands of engineers at Netflix, YouTube, and Meta whose entire job is tuning FFmpeg parameters for specific content types. A historical curiosity: Google Video originally used VLC as an ActiveX plugin inside Internet Explorer; today VLC is compiled to WebAssembly to run inside browser JavaScript engines. > *"You have I-frames that are complete frames, P-frames that depend only on I-frames, and B-frames that can depend on frames in front."* — Jean-Baptiste Kempf ## [191:04] CIA and fake VLC WikiLeaks' Vault 7 release revealed that the CIA built a modified version of VLC with an additional DLL (psapi.dll) that silently encrypted and exfiltrated documents while the victim watched a movie, using the expected high CPU load of video playback as cover. VideoLAN issued a press release directing users to download only from the official website. A separate incident involved Chinese state hackers distributing a fake VLC using legitimate signed VideoLAN DLLs to target Indian users, causing India to ban VLC until Kempf fought a successful legal battle to reverse the ban. The segment also surfaces a hidden feature: VLC can render movies as ASCII art in a terminal, useful for diagnosing multicast network paths via SSH. > *"If we had to compromise our software, we would shut it down. This is clear."* — Jean-Baptiste Kempf ## [201:39] Ultra low latency streaming Kempf explains adaptive streaming (HLS, DASH): the player downloads segments, times the download, and adjusts quality tier accordingly. The real engineering frontier is live broadcasting with strict CBR constraints—satellite uplinks cannot burst even for one second. Kempf describes his company Kyber, an open-source (AGPL dual-licensed) ultra-low-latency streaming stack targeting robotics and XR, streaming compressed video feeds to devices without onboard compute. The segment ends with a discussion of teleop for robots, where latency directly determines safety. > *"Kyber is open source. Everything on Kyber is open source. If you want to use it in your product and not open source it, you pay the commercial license."* — Jean-Baptiste Kempf ## [219:07] AV2 codec and video patents AV2, the successor to AV1 within the Alliance for Open Media (of which VideoLAN is a member), promises a further 30% bandwidth reduction. VideoLAN's dav1d decoder will be followed by "dav2d." The Alliance exists specifically to escape the HEVC/H.265 patent thicket: HEVC's three separate patent pools demanded fees so large that HP removed HEVC support from new laptops, and streaming giants calculated they could build a new royalty-free codec for less than the annual licensing cost. France's rejection of software patents means Kempf has never paid codec licensing fees—if he had to, the bill would exceed 200 euros per user. > *"At a hundred million per year, you know, I could create my own codec—and this is what they did."* — Jean-Baptiste Kempf ## [228:59] VLC backdoors Intelligence agencies from two different countries approached Kempf asking him to insert backdoors into VLC. He declined both, in terms he describes as "a lot less polite" than a simple no. The chapter broadens into a discussion of European entrepreneurship: Kempf argues that French startup culture has transformed over 15 years—failure stigma has fallen, AI companies are proliferating—while acknowledging that over-regulation remains a real drag. He closes by reflecting on his strategy for remaining calm under legal and political pressure: always ask "am I dying? Am I hurting someone?" If not, move on. > *"If we had to compromise our software, we would shut it down. Also because what we do is good and it's done for everyone."* — Jean-Baptiste Kempf ## [239:14] Video archiving Kieran profiles the archiving preservation community, led in part by Dave Rice of CUNY, which relies on FFmpeg as a "Rosetta Stone" for playing future-proof multimedia. The community funded FFV1, FFmpeg's lossless codec, to guarantee that archived footage loses no information—critical because lossy compression could destroy forensic or historical details visible only on close inspection. A famous cautionary tale: the BBC's 1986 New Domesday Book project archived content on BBC Micros, and within 20 years no one had working software to read it. There are now more historical video tapes in archives than functional tape heads in the world to digitize them, forcing painful triage decisions about what human history to preserve. > *"C will be like Latin. It will be a thing you learn from the past, but it will still be usable in certain contexts."* — Kieran Kunhya ## [245:51] Future of FFmpeg and VLC The closing chapter surveys where multimedia is heading: volumetric video, point-cloud codecs for robotics, RGBD depth streams, XR/VR streaming, and—speculatively—neural interfaces that may one day require codecs for compressed brain data. Kempf is confident FFmpeg will exist in 100 years; VLC he rates as "maybe." He closes with his personal philosophy: "Regrets are a tax on your mind. Learn from your mistakes, but don't regret." The episode ends with Lex reading Linus Torvalds: "Most good programmers do programming not because they expect to get paid or get adulation by the public, but because it is fun to program." > *"Regrets are a tax on your mind. Learn from your mistakes, but don't regret. Because you've done it, so unless you have a time machine, don't regret."* — Jean-Baptiste Kempf ## Entities - **Jean-Baptiste Kempf** (Person): President of VideoLAN, primary maintainer of VLC, founder of Kyber and several other companies; declined tens of millions of dollars to keep VLC ad-free. - **Kieran Kunhya** (Person): Veteran FFmpeg contributor, codec engineer, founder of Open Broadcast Systems, the voice behind the FFmpeg account on X. - **Lex Fridman** (Person): Host of the Lex Fridman Podcast, AI researcher, longtime VLC and FFmpeg advocate. - **Fabrice Bellard** (Person): Creator of FFmpeg, QEMU, and tcc; foundational figure of the project. - **Michael Niedermayer** (Person): Long-time FFmpeg maintainer who drove exhaustive codec support through the 2000s. - **Kostya Shishkov** (Person): Legendary FFmpeg reverse engineer who decoded proprietary binary blobs for Windows Media, RealMedia, and GoToMeeting codecs. - **Henrik Gramner** (Person): Assembly wizard with deeper knowledge of Intel x86 cycle counts than Intel's own engineers. - **Linus Torvalds** (Person): Creator of Linux and Git; referenced as a model of uncompromising code quality standards in open-source communities. - **FFmpeg** (Software): Open-source multimedia framework providing codecs, muxers, filters, and command-line tools; the invisible backbone of nearly all internet video. - **VLC** (Software): Open-source media player with 6.5+ billion downloads, built on libVLC and FFmpeg; plays virtually any format on any platform. - **x264** (Software): VideoLAN's open-source H.264 encoder; the dominant software encoder for internet video, famous for psychovisual optimizations. - **dav1d** (Software): VideoLAN's fast open-source AV1 decoder; widely deployed in browsers and streaming clients. - **VideoLAN** (Organization): French nonprofit that stewards VLC, x264, dav1d, and related open-source multimedia libraries. - **Alliance for Open Media** (Organization): Industry consortium including Google, Netflix, Apple, Amazon, and VideoLAN that created AV1 and is developing AV2 as royalty-free codec standards. - **FATE** (Software): FFmpeg Automated Testing Environment; volunteer-hosted CI grid testing hundreds of compiler/OS/architecture combinations. - **Kyber** (Organization): JB Kempf's startup building an ultra-low-latency open-source streaming stack for robotics and XR, dual-licensed AGPL/commercial. - **H.264 / AVC** (Concept): The dominant internet video codec standard; open-source implementation is x264; basis of Blu-ray and most MP4 files. - **AV1 / AV2** (Concept): Royalty-free next-generation video codec standards from the Alliance for Open Media; AV1 saves 40-60% bandwidth vs H.264; AV2 adds another 30%.

#ffmpeg#vlc#open-source
Claude Code क्या है?
2:55
EN/ZH
Watch with Captions
ClaudeClaude Code 101२१ दिन पहले

Claude Code क्या है?

Claude Code का Anthropic का आधिकारिक परिचय — यह क्या है, Claude.ai से कैसे अलग है, और किसी LLM को अपने कोडबेस पर कमांड चलाने देने से पहले आपको तीन चीजें जाननी चाहिए। पहली बार टर्मिनल टूल इंस्टॉल करने वाले डेवलपर्स के लिए। ## [00:04] Claude Code क्या है और यह कहाँ चलता है Claude Code को एक एजेंटिक कोडिंग टूल के रूप में स्थापित किया गया है: यह आपके कोडबेस को समझता है, फाइलें एडिट करता है, कमांड चलाता है और आपके मौजूदा डेवलपर टूल्स के साथ इंटीग्रेट होता है। यह कई जगहों पर उपलब्ध है — टर्मिनल, VS Code, JetBrains IDEs, Claude डेस्कटॉप ऐप और वेब — लेकिन यह गाइड टर्मिनल को मानक अनुभव के रूप में लेती है। > *Claude Code is an agentic coding tool that understands your code base, edits your files, run commands, and integrates with your existing developer tools to help you get things done faster.* ## [00:34] यह Claude.ai से कैसे अलग है मुख्य अंतर मॉडल की क्षमता में नहीं बल्कि एक्सेस में है: Claude Code सीधे आपके टर्मिनल और पूरे कोडबेस तक पहुंचता है, इसलिए चैट में कॉपी-पेस्ट करने का चक्र खत्म हो जाता है — टूल काम उसी जगह करता है। इसे "AI एजेंट" कहना उस सीधी निष्पादन सतह का संक्षिप्त वर्णन है। > *Unlike Claude AI, Claude Code has direct access to your files in your terminal and your entire code base.* ## [00:51] AI एजेंट और Claude Code क्या कर सकता है यहाँ AI एजेंट का अर्थ है वह सॉफ्टवेयर जो अपने वातावरण के साथ इंटरैक्ट करता है और एक निर्धारित लक्ष्य को हासिल करने के लिए कदम उठाता है — अपने सबसे बुनियादी रूप में, टूल्स, बाहरी सेवाओं और अन्य एजेंटों तक पहुंच के साथ रियल-टाइम लूप में चलने वाला एक LLM। Claude Code के लिए यह ठोस क्षमताओं में तब्दील होता है: आपके कोडबेस को पढ़ना और समझाना, फाइलों में बग ट्रेस करना, बिल्ड स्क्रिप्ट और टेस्ट चलाना, पैकेज इंस्टॉल करना, और अगला कदम तय करने के लिए वेब से नवीनतम API दस्तावेज़ लाना। > *An AI agent is a software that can interact with its environment and perform actions to complete a defined goal.* ## [01:45] शुरू करने से पहले जानने योग्य तीन अवधारणाएं नैरेटर तीन विशेषताएं बताते हैं जो रोज़मर्रा के उपयोग को प्रभावित करती हैं। पहली, **कॉन्टेक्स्ट विंडो** Claude की कार्यशील मेमोरी है — बड़ी लेकिन सीमित — इसीलिए एजेंट को पूरा कोडबेस लोड करने के बजाय रणनीतिक तरीके से नेविगेट करना पड़ता है। दूसरी, Claude Code कमांड चलाने या फाइलें बदलने से पहले **अनुमति मांगता है**; आप हर चरण को नियंत्रित करना चाहें या इसे अधिकतर स्वायत्त रूप से चलने दें — नियंत्रण आपके पास ही रहता है। तीसरी, **यह गलत हो सकता है**: इरादे को गलत समझना, बग डालना या किसी समाधान को जरूरत से ज्यादा जटिल बनाना। आउटपुट को किसी भी अन्य टूल की तरह समझें, इसे अंतिम सत्य न मानें। > *By default, Claude Code will ask you before running commands or making changes to your code base.* ## [02:34] सारांश Claude Code एक एजेंटिक कोडिंग टूल है जो आपका कोडबेस पढ़ता है, फाइलें एडिट करता है, कमांड चलाता है और बाहरी टूल्स से कनेक्ट होकर आपको तेज़ी से डिलीवर करने में मदद करता है — आज टर्मिनल, VS Code, JetBrains और Claude डेस्कटॉप ऐप पर उपलब्ध है। > *Claude Code is an agentic coding tool. It reads your code base, edits your files, runs commands, and connects to external tools to help you ship faster.* ## एंटिटीज़ - **Anthropic Tutorial Narrator** (Person): Claude Code 101 ट्यूटोरियल सीरीज़ के लिए Anthropic का आधिकारिक वॉयस-ओवर नैरेटर। - **Claude Code** (Software): Anthropic का एजेंटिक टर्मिनल-आधारित कोडिंग असिस्टेंट जो सीधे आपके कोडबेस पर काम करता है। - **Claude.ai** (Software): चैट-आधारित Claude प्रोडक्ट — Claude Code के इन-एनवायरनमेंट एक्सीक्यूशन के विपरीत। - **AI agent** (Concept): एक LLM जो एक निर्धारित लक्ष्य को हासिल करने के लिए टूल्स, बाहरी सेवाओं और अन्य एजेंटों तक पहुंच के साथ रियल-टाइम लूप में चलता है। - **Context window** (Concept): Claude की कार्यशील मेमोरी — सीमित, इसीलिए एजेंट पूरे कोडबेस को लोड करने के बजाय रणनीतिक तरीके से नेविगेट करता है। - **VS Code / JetBrains IDEs** (Software): एडिटर इंटीग्रेशन जिनमें Claude Code टर्मिनल और Claude डेस्कटॉप ऐप के साथ-साथ उपलब्ध है।

#claude-code#ai-agent#developer-tools
🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI
1:31:51
EN/ZH
Watch with Captions
Latent Space२१ दिन पहले

🔬How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI

Alex Lupsasca — 2024 New Horizons Breakthrough Prize winner and OpenAI resident scientist — recounts how GPT-5 resolved a year-long open problem in quantum field theory: proving that single-minus gluon tree amplitudes are non-zero and finding their compact closed form. He then describes how the publicly available GPT Pro, given the gluon paper as a seed, independently generalized the result to graviton amplitudes in under three days of human clock time. Throughout the conversation, Lupsasca reflects on what this trajectory means for how physics is done, how the next generation of physicists will be trained, and where the remaining bottlenecks — verification, creativity, and publishing infrastructure — still lie. ## [00:00] Introduction to AI's impact on physics research Lupsasca opens in medias res, framing the episode's central claim before the formal introduction: AI has crossed a threshold where it can resolve questions that stumped human experts for over a year. He describes this not as a curiosity for theoretical physicists but as a profound, if underappreciated, change in the nature of scientific discovery itself. > *"That's a certain milestone that we've passed, and I think maybe for the average person on the street who doesn't care about theoretical physics, this is not very noticeable, but I think it's a very profound change and we've really passed some kind of a threshold."* ## [00:43] Guest introduction: Alex Luposka The hosts — Brandon (Atomic AI) and RJ Honicky (Miro Omix) — introduce Lupsasca as a Vanderbilt professor and OpenAI fellow who holds both the 2024 New Horizons in Physics Breakthrough Prize (often called the "Oscars for science") and the IUPAP Young Scientist Award. Lupsasca immediately sets the narrative arc: a year ago, AI was useful for email but not for his work; ChatGPT o3 was the first model that genuinely helped with research math; then GPT-5 reproduced one of his hardest published results in 30 minutes. > *"When GPT-5 came out it was able to reproduce one of my best papers that took me a very long time to come up with in like 30 minutes. And that's when I really became AI pilled."* ## [02:49] Alex joining OpenAI and the shift in physics research After GPT-5's release, Lupsasca began evangelizing the shift to colleagues who were skeptical. Finding OpenAI equally excited, and being on sabbatical, he joined as resident scientist — the person physicists around the world now email when something astonishing happens. He describes receiving an inbound that week about Codex simulating the Sachdev-Ye-Kitaev (SYK) model in 10 minutes, a feat that many research groups had struggled to achieve due to the narrow Venn diagram of physicists with strong coding skills. > *"I talked to OpenAI. They were also really excited and I thought I have to get in on this and to understand that this is happening and not be a part of it is a huge mistake so I have to go to OpenAI."* ## [04:08] The release of GPT-5 and the shift in capabilities Lupsasca contrasts the lukewarm Twitter reception of GPT-5 (complaints that it was not better at writing email) with what he observed at the science frontier. He notes GPT-5.4 is another significant jump, and describes how AI capabilities for physics have been accelerating rapidly since o3, the first reasoning model strong enough for research-grade mathematics. He uses this as a bridge to the central technical story of the episode: a pair of new papers on gluon and graviton scattering amplitudes. > *"At the science frontier the capabilities were really taking off."* ## [10:05] Explaining Quantum Field Theory and amplitude calculations Lupsasca gives an accessible primer on quantum field theory (QFT), the framework that reconciles special relativity and quantum mechanics. The key objects in QFT are scattering amplitudes — complex-valued functions that encode the quantum probability for a set of incoming particles (with given energies, momenta, and polarizations) to scatter into a set of outgoing particles. These amplitudes are computed at particle colliders like the LHC, and knowing the n-point amplitude (for any number n of particles) encodes essentially the full content of the theory. > *"If you have a particular force and you're able to compute the n-point amplitudes... you know everything about the theory."* ## [14:20] Overview of gluons and the strong force Gluons are the force-carrying particles of the strong nuclear force — the force that, despite like-charge repulsion between protons, holds the atomic nucleus together. They are the QFT analog of photons for electromagnetism and gravitons for gravity. Like photons, gluons carry a polarization (helicity): positive (right-handed) or negative (left-handed). This helicity structure is central to the paper discussed next. > *"The strong force is mediated by the exchange of the particles of the strong force, which are called gluons, because they're what glues together the nucleus of the atom."* ## [14:38] Discussing the first research paper on single-minus gluon tree amplitudes Lupsasca unpacks the paper's title — "Single-Minus Gluon Tree Amplitudes Are Non-Zero" — piece by piece. Tree amplitudes are the leading-order (no-loop) contributions to scattering. All-plus-helicity amplitudes are exactly zero by a symmetry argument. Single-minus amplitudes — where all but one gluon have positive helicity — were assumed in textbooks to also be zero by the same argument. The paper proves they are not. The result involves collaboration with Alfredo Guevara (IAS), David Skinner (Cambridge), Andrew Strominger (Harvard), and Kevin Wheel. > *"If you look at the lecture notes and textbooks that have been written on this, the same argument that rules out the all-plus amplitudes also appears to rule out the single-minus amplitudes."* ## [20:56] How ChatGPT helped solve a year-long physics puzzle Strominger, Guevara, and Skinner had understood for about a year that the textbook argument has a loophole: when particles are collinear (exactly aligned in momentum), the standard dimensional-analysis reasoning fails, and single-minus amplitudes can be non-zero. But computing what those non-zero amplitudes equal had eluded them. Lupsasca invited Strominger to visit OpenAI and work on it with AI. The week before Strominger's flight, Lupsasca began using ChatGPT Pro. By the time Strominger landed, they had the answer. > *"Using ChatGPT we solved the problem before he even got off the plane."* ## [23:02] Complexity of manual calculations in physics Lupsasca shows the audience a concrete illustration of the difficulty: the six-point single-minus amplitude, worked out by hand by Alfredo Guevara, is a sum of 32 terms each of which is itself a product of four complicated factors. The number of terms grows factorially with the number of particles n — super-exponential growth. This is the messy representation that the group had been staring at for a year, seeking the analog of the elegant Parke-Taylor formula. > *"By the time you get to six terms, it explodes in your face."* ## [26:12] The history and mechanics of Feynman diagrams Feynman diagrams are a visual language introduced by Richard Feynman to organize perturbative QFT calculations: diagrams represent possible intermediate histories of a scattering process, and the full amplitude is a sum over all of them. Diagrams are organized by number of vertices (interaction points); each additional vertex is suppressed by the coupling constant, so tree diagrams (fewest vertices) dominate. Loop diagrams — where intermediate particles are created and annihilated — contribute smaller corrections. The combinatorial explosion of tree diagrams is the root cause of factorial growth. > *"In principle, there are infinitely many pictures to sum over."* ## [27:44] The Parke-Taylor formula and the quest for simplification In the 1980s, Parke and Taylor computed the "maximally helicity violating" (MHV, or double-minus) gluon amplitudes through a heroic Feynman diagram expansion. Despite the factorial number of terms, everything canceled to leave a single compact formula — the Parke-Taylor formula — that fits in half a line. Strominger, Guevara, and Skinner spent a year looking for the analogous compact formula for the single-minus case. Their search stalled at the level of the messy Feynman representation. > *"Andy, Alfredo and David spent the last year chasing the analog of the Parke-Taylor formula, the very simple answer that was obtained in the '80s for the double minus amplitudes."* ## [31:26] Using ChatGPT to find the simplification in the special phase space region When the five-point single-minus amplitude was fed to ChatGPT Pro, the model identified a special subregion of phase space (where one particle's frequency has opposite sign) in which the amplitude simplifies from eight terms to a product of just three. This appears not to have been a known fact; the model wrote Python code and tested thousands of possibilities to deduce it. Moving to the six-point amplitude (Guevara's hand calculation), ChatGPT simplified 32 terms to a product of 4. It then conjectured the general n-point formula — with only linear growth in the number of terms, the best possible behavior. GPT-5.2 Pro guessed the formula but could not prove it. > *"The formula that it proposed, instead of having this factorial growth... here it's actually linear. So if you double the number of particles, you only double the number of terms."* ## [38:07] Proving the formula from scratch to ensure validity To obtain a proof, Lupsasca used an internal OpenAI model with extended reasoning. He gave it the problem cold — without the conjectured formula — and asked it to find the general answer in the special phase-space region. After 12 hours of computation, the model independently rediscovered the same formula and produced a complete three-step proof. The proof constitutes the bulk of the published paper. The team kept the AI attribution to one paragraph, framing the paper as a physics result that stands on its own merits. > *"We gave it the whole problem from scratch... and it came back with the same formula which we had not given it. So it rediscovered the correct formula. But this time it also found the proof."* ## [41:00] Determining the scientific impact and future research Asked to compare the result to the Parke-Taylor formula, Lupsasca is candid that scientific impact is only assessable decades later, but argues the result is genuinely surprising and should open a line of attack toward deeper questions in quantum gravity. The conversation pivots naturally to the second paper. > *"I think the true value of a paper can only be assessed decades into the future based on how much future work it leads to and what developments it opens up."* ## [42:27] Introduction to the second paper on graviton amplitudes Gravitons are the hypothetical quanta of gravity — the spin-2 force carrier analogous to the spin-1 photon (electromagnetism) and gluon (strong force). Unlike gluons, gravitons have never been directly detected, but they are central to quantum gravity theory. The second paper, "Single-Minus Graviton Tree Amplitudes Are Non-Zero," shows the same loophole applies to gravity and that a compact formula extends there too — despite gravitons being mathematically more complex than gluons. > *"We wrote this paper which is called single minus graviton tree amplitudes are non-zero. So it's the same title almost, except with graviton instead of gluon."* ## [45:41] Defining particles, irreducible representations, and symmetry Lupsasca sketches the modern QFT definition of a particle (an irreducible representation of the Poincaré group, classified by Wigner according to mass, spin, and charge) and explains why gravitons are spin-2 while gluons and photons are spin-1, making graviton polarization data twice as rich. Crucially, the second paper was complete within three days of the first going public — most elapsed time was spent verifying correctness, not computing. > *"Most of the time was spent verifying the answer, not writing, which is insane, actually, if you take a step back."* ## [47:46] How GPT Pro generalized the research to gravity For the graviton paper, no internal model was needed — the publicly available ChatGPT GPT-5.2 Pro sufficed. Lupsasca provided the gluon paper as context plus two paragraphs describing the key mathematical changes, then said "Good luck. You're a brilliant theoretical physicist." Over a 110-page exchange, the model worked through the graviton calculation — applying the directed matrix tree theorem, a piece of known combinatorics that neither Lupsasca nor collaborators had thought to invoke — produced correct intermediate results, and wrote a draft paper very close to the final arXiv version from section 3 onward. > *"It's a real solid result in quantum gravity that was done pretty much completely by an AI with human steering it and asking kind of the right questions."* ## [53:57] The epistemological shift: Is this a new way of doing physics? The hosts raise the central epistemological question: if an undergraduate with domain knowledge and good prompting could have done this, what does graduate training mean now? Lupsasca agrees this is the hardest open question facing academia. He notes that arduous calculation trains not just skill but self-confidence, that the gap between coursework and the research frontier is growing, and that many "easy" problems professors once assigned to students are now solvable by AI in minutes. He offers two concrete ways AI has already changed his own workflow: dramatically reducing time spent confused between steps, and enabling parallel AI scouts that explore multiple research directions simultaneously. > *"With AI, actually, you can launch 10 instances of chat and have each one try a different route and send it as a scout that moves very fast into the unknown."* ## [59:27] The use of AI as a 'scout' for research directions Lupsasca elaborates on the scout metaphor: rather than carefully mapping a route from A to C before committing to it, a researcher can now dispatch many AI "scouts" in parallel, get rapid feedback on which directions are promising, and redirect human attention accordingly. Even when a scout makes errors, its signposts reduce orientation cost for the human following. This constitutes a qualitatively new mode of research — one where the bottleneck shifts from calculation to judgment about which directions matter. > *"Even if ChatGPT doesn't always get everything right, just kind of having a scout that signposts some key steps along the way that you can use to anchor your own movement is extremely helpful."* ## [61:44] The role of 'taste' and collaboration with AI The hosts push on the problem of "taste" — the ability to identify which questions are at the productive edge of knowledge. Lupsasca argues that working effectively with ChatGPT requires the same skill a professor develops advising students: knowing what question to give, at what level of detail. "Taste" — knowing where the frontier is and which questions there are tractable — is the last skill to develop and the one AI currently lacks. AI is, he says, like an extremely technically skilled graduate student: given a sharp, well-posed question, it can do incredibly hard computations correctly, but it does not yet know which question to ask. > *"The difference between a good physicist and a great physicist is knowing what is the right question to ask — that is actually the hardest part of being a scientist."* ## [70:23] Personal evolution from AI skeptic to resident scientist Lupsasca recapitulates his personal arc: skeptic → converted by o3 (which solved in 11 minutes a calculation that would have taken him days) → "AI-pilled" by GPT-5 (which reproduced, in 30 minutes, his best published result on black hole Love numbers and tidal symmetries — a paper whose training cutoff predated its arXiv release) → now resident scientist at OpenAI. He notes that no competing model at the time could match GPT Pro on that calculation. > *"In under 30 minutes, with one hint... it completely solved this problem, which is one of the nicest calculations that I've ever done."* ## [72:46] Solving a black hole perturbation problem with GPT-5 Lupsasca details the "Move 37" moment that converted him: his paper "Why Is There No Love in Black Holes?" establishes new symmetry generators for perturbations of a Kerr black hole (explaining why black hole Love numbers — tidal response coefficients, named after mathematician Augustus Love — are exactly zero). When GPT-5 Pro was first given the full problem cold, it failed. But after being primed with the simpler flat-space warm-up (a 200-year-old known result), it then solved the full Kerr black hole problem in 18 minutes. > *"GPT-5 was able to reproduce one of my hardest calculations, which I think the number of people in the world that could do that you could count on your hands."* ## [76:34] Discussing whether AI can make original, conceptual leaps The hosts ask whether AI is doing genuine recombination versus true creative leaps. Lupsasca cites Terry Tao, who has not yet seen an AI proof that cannot be traced to an obscure reference. But Lupsasca has been impressed and frames the distinction as one of degree rather than kind — humans may also be recombination machines. He believes continued scaling will produce feats of insight that look like creativity, and notes OpenAI is actively working on enabling models to take bigger, more out-of-distribution leaps suited to scientific discovery. > *"I'm not sure there's a qualitative difference. I think it's just a matter of degree — as we continue scaling the capabilities, I don't see why it's going to stop."* ## [80:09] Challenges of 'AI slop' and the future of academic publishing With models now capable of turning out a physics paper in 30 minutes when properly steered, the arXiv preprint server is being flooded with submissions. Lupsasca distinguishes legitimate use (expert steering + careful verification) from "AI slop" — poorly prompted outputs submitted without adequate checking. His proposed response: raise the bar rather than increase volume. The single-minus amplitude papers open a clear line of attack toward genuine quantum gravity questions; the goal should be to pursue harder problems, not to publish incrementally. > *"Instead, I think now that we have this new tool that gives us AI superpowers, I think we should just raise the bar for what it means to write a good paper."* ## [83:13] The bottleneck of writing academic papers Asked what single bottleneck he would remove, Lupsasca nominates the paper-writing process itself — finding it increasingly strange that researchers use AI to do calculations, compress results into a static paper, and then readers feed that paper back into AI to understand it. He envisions interactive, LLM-embedded papers as a plausible future. He also identifies two missing capabilities in current models: (1) the spark of creativity to identify the next important question, and (2) reliable self-verification, so that the onus of checking long AI-generated proofs does not fall entirely on humans. > *"Maybe some kind of interactive paper which lives in some LLM. Maybe your whole paper is some ChatGPT page... I think we're going to head in that direction."* ## [90:19] Final takeaways and looking ahead to the next year Lupsasca's closing message: pay attention. The trajectory from "useful for email" to "solves open problems in quantum gravity" has taken roughly 18 months. Models are solving open problems that expert communities spent years on. Extrapolating forward, with more scaling already in the pipeline, the next 6 to 12 months should bring further surprises. The right posture is excitement, careful verification, and a commitment to pursuing harder problems. > *"If you just extrapolate that into the future, imagine where we're going to be in 6 months or a year — I think it's kind of surreal to live through this time, but it's really happening."* ## Entities - **Alex Lupsasca** (Person): Theoretical physicist, Vanderbilt University professor and OpenAI resident scientist; 2024 New Horizons Breakthrough Prize and IUPAP Young Scientist Award winner; expert in black hole physics and scattering amplitudes. - **Andrew Strominger** (Person): Harvard professor and Lupsasca's former PhD advisor; pioneer of celestial holography; co-author of both single-minus amplitude papers. - **Alfredo Guevara** (Person): Postdoctoral researcher at the Institute for Advanced Study (IAS); performed the foundational hand calculations underpinning the AI-assisted breakthrough. - **David Skinner** (Person): Professor at Cambridge University; co-author of the single-minus gluon amplitude paper. - **Terry Tao** (Person): Fields Medal-winning mathematician at UCLA; referenced regarding the question of whether AI proofs involve genuine creativity. - **Scattering Amplitudes** (Concept): Complex-valued functions in quantum field theory encoding probabilities for particles to scatter; the central mathematical objects of both papers discussed. - **Single-Minus Gluon/Graviton Amplitudes** (Concept): Tree-level scattering amplitudes where all but one particle have positive helicity; previously assumed zero in textbooks but shown non-zero in a collinear phase-space region. - **Parke-Taylor Formula** (Concept): Compact closed-form result for maximally helicity violating (MHV, double-minus) gluon amplitudes derived in the 1980s; the template whose analog was sought for single-minus amplitudes. - **Feynman Diagrams** (Concept): Diagrammatic technique to organize perturbative QFT calculations; individual diagrams represent distinct intermediate-particle histories whose amplitudes are summed. - **Love Numbers** (Concept): Coefficients encoding tidal deformability; famously vanish for black holes, a fact connected to hidden symmetries studied in Lupsasca's "Why Is There No Love in Black Holes?" paper. - **Celestial Holography** (Concept): Research program exploring symmetries of quantum gravity via scattering amplitude structure; motivates studying graviton amplitudes. - **OpenAI** (Organization): AI research company where Lupsasca serves as resident scientist; developer of GPT-5 and the internal extended-reasoning model used for the amplitude proof. - **arXiv** (Organization): Open-access physics and mathematics preprint server; mentioned in the context of AI-generated "slop" flooding submissions. - **GPT-5 / ChatGPT Pro** (Software): OpenAI's frontier language model used as the primary AI tool in both amplitude papers; capable of extended reasoning steps of 20-34 minutes per prompt.

#theoretical-physics#quantum-field-theory#gpt-5
Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!
1:58:11
EN/ZH
Watch with Captions
The Diary Of A CEO२२ दिन पहले

Scott Galloway: AI Wasn't Built For You. The Rich Don't Need You Anymore!

NYU Stern professor and serial entrepreneur Scott Galloway delivers a two-hour reality check on artificial intelligence: the doom-and-gloom predictions from AI CEOs are largely fundraising theatre, yet the technology poses a genuinely insidious risk that almost nobody is discussing — an epidemic of loneliness. Galloway argues that AI primarily benefits the already-wealthy, that tech leaders should not be trusted to self-regulate, and that the most valuable human skill in the AI era is not coding or Mandarin — it is the ability to endure rejection. The conversation weaves through geopolitics, investing, the masculinity crisis, and what it means to find purpose, closing with a raw reflection on grief and fatherhood. ## [00:00] Intro Host Stephen introduces Scott Galloway against a backdrop of rapid AI development and unsettling quotes from tech CEOs predicting total job replacement. Galloway opens with his central thesis: the two greatest brand collapses of the past 18 months are the United States' global reputation and artificial intelligence itself — both victims of overpromising and poor trust management. He signals that he is an AI optimist at the macro level, but insists the people building it do not have the public's best interests at heart. > *"These techs, they do not have our best interests at heart."* ## [02:45] What's Actually True About AI Galloway reveals a striking data point: approval of AI is directly correlated with income. Only households earning over $200,000 per year hold a net-positive view of the technology, because they benefit through rising portfolios and are the heaviest users. Everyone else sees higher electricity bills, no equity stake in the companies, and dismissive comments from leaders like Sam Altman telling people to stop complaining about energy costs. The AI brand, he argues, has shifted in 18 months from "scary but optimistic" to "scary and only good for the already rich." > *"Your view of AI is directly correlated to your wealth. The only cohort that has a positive rating of AI is people making over $200,000."* ## [05:00] Are AI CEOs Exaggerating The Future To Raise Billions? Galloway lays out the economic logic behind AI catastrophizing. These companies sit on astronomical valuations that can only be justified if either (a) a trillion dollars in incremental revenue materialises from AI-powered products, or (b) there is a massive wave of labour cost savings. Because option (a) is not yet visible — he sees no AI-driven products at meaningful scale — the CEOs amplify option (b), painting vivid pictures of job destruction to justify the efficiency gains enterprises need to believe in. He calls some of the doom talk "thinly veiled fundraising," noting that founders catastrophize and then take secondaries and leave for Santorini. > *"The catastrophizing is nothing more than a thinly veiled attempt to say my technology is so devastating that it's going to shift society and you should invest at this crazy valuation."* ## [09:00] What Would Prove The AI Skeptics Wrong? Asked where he could be wrong, Galloway is specific: if unemployment rises to 20% even temporarily, history shows civil unrest follows regardless of eventual job recovery. He points to radiologists and coders as cases where AI has augmented rather than eliminated roles — new coder job listings are up 11% year-on-year. His benchmark for being wrong is sustained destruction outpacing creation fast enough that the recovery "V" triggers social breakdown before the other side is reached. > *"At 20% unemployment, especially among youth, especially young men tend to get very angry and take to the streets."* ## [11:05] Could AI Move Too Fast For Society To Handle? The conversation turns to pace of change. Galloway uses the host's own media empire — 220 hires in 24 months — as a live counter-example to the apocalypse narrative. He notes a structural inversion: for the first time in decades, unemployment among non-college graduates is lower than among college graduates because AI data centres are driving a boom in trades. He praises the entrepreneurial wave unlocked by AI tools and flags Denmark's 2% GDP commitment to retraining versus America's inadequate equivalent as the real policy failure. > *"AI is not going to take your job. Someone who understands AI is going to take your job."* ## [16:05] What Happens When AI Combines With Robots? Galloway addresses Elon Musk's Optimus robot predictions and the convergence of physical automation with AI cognition. His 2026 stock pick is Amazon, which already holds more industrialised robots than the rest of the US combined and plans to double its retail operation by 2032 without additional headcount. He is sceptical of domestic humanoid robots but takes seriously the military application of weaponised autonomous systems as a genuinely dark unknown frontier. > *"Amazon is saying they're going to double their largest business, which is their retail business by 2032 without an incremental hire using robotics, industrialised robots."* ## [19:05] Is Elon Musk Selling Vision or Reality? Galloway separates Musk the innovator from Musk the stock promoter. He calls Starlink the best tech product of the past several years and credits Musk with inspiring the EV race. But Tesla should trade at 30x earnings, not 150x, and capital will migrate to SpaceX when it IPOs at a projected 90–110x revenues. The core insight: the modern CEO's job has inverted from underpromise-and-overdeliver to overpromise-and-underdel in order to access cheap capital and pull the future forward. > *"The key attribute of an innovator right now is storytelling — to make sure the promise is way ahead of the performance such you can access cheap capital and pull the future forward."* ## [24:05] Which Jobs Are First To Disappear In The AI Shift? Long-haul trucking is Galloway's clearest near-term casualty: autonomous trucks can run the 10 pm to 4 am window and trucking is the largest single employer of non-high-school-graduate males in America. Legal work at the junior associate level is already being displaced — he now routes contracts through two competing LLMs rather than a $400–$2,000 law firm review, projecting a third reduction in his annual legal spend. The pattern he observes is multiplication: one AI-fluent analyst replaces five, yet the resulting EBITDA funds expansion that creates new jobs elsewhere in the ecosystem. > *"AI is not going to take your job. Someone who understands AI is going to take your job. So have a second screen — always have a second screen open that has nothing but AI on it."* ## [30:05] What Skills Will Actually Matter In The Future? Storytelling tops Galloway's list — the ability to look at data, construct a narrative arc, and communicate it compellingly across every medium. He holds up Jeff Bezos's 1997 shareholder letter, Jensen Huang's stadium keynotes, and Alex Karp's walk-and-talk earnings calls as models. Relationships are the second pillar: as technology converges and products commoditise, the differentiator is whether people want to work with you. He is honest that predicting specific skills is unreliable — private schools doubled down on computer science and Mandarin a decade ago, and neither bet has paid off as expected. > *"The enduring skill is storytelling — your ability to look at data, create a narrative arc and then communicate that story in a compelling way via all the different mediums."* ## [33:45] Are Young People Losing The Ability To Handle Rejection? Galloway identifies the erosion of rejection-tolerance as the most underrated threat facing young people, especially young men. Frictionless online relationships offer a simulacrum of connection without the emotional labour of real-world risk. He mentors young men by assigning deliberate rejection exercises: approach a stranger for friendship, ask someone out for coffee. The goal is not the yes; it is learning that a no is survivable. He argues his own superpower is simply the willingness to mourn failure and try again. > *"The secret to my success is rejection. I ran for sophomore, junior, and senior class president of my high school. I lost all three times."* ## [39:55] Can You Trust The People Building AI? A sharp cultural critique: America has replaced declining religious institutions with tech idolatry, crowning each new CEO as a secular Jesus Christ. Steve Jobs, then Zuckerberg, then Sam Altman, now Dario Amodei — each is briefly positioned as the good guy before completing the villain's journey. Galloway's argument is not that these people are evil but that they are doing exactly what capitalism demands: maximising earnings regardless of wider harm. The answer is not more trustworthy tech founders; it is competent elected officials who regulate them. > *"Can we trust Sam Altman? No. But we shouldn't need to trust him. We should be able to trust that we have smart elected officials that will regulate these companies."* ## [44:50] Are Tech Leaders Quietly Preparing For The End? Galloway reveals that roughly one in three billionaires maintain a "go bag" — a fully funded escape plan, typically a private jet to Auckland and a fortified New Zealand bunker. He calls this nihilism: the ultra-wealthy have sequestered themselves so completely from ordinary infrastructure — private aviation, concierge medicine, private security, elite schools — that they are no longer invested in the health of society. Their disproportionate political donations are therefore not directed at making the system work for everyone. > *"The problem is the 0.1% are not invested in the health of America. They don't have to put up with TSA lines. They fly private."* ## [52:00] Do Some AI Leaders Believe The Risk Is Worth It? A secondhand but chilling account: a source with direct access to an AI CEO described someone who genuinely believes there is a roughly 7–10% chance their work ends in catastrophe, but considers being the person who summoned this new intelligence consequential enough to proceed regardless. Galloway connects this to widening inequality — the delta between middle-class and ultra-wealthy life has expanded so dramatically across healthcare, travel, and security that the incentives of the 0.1% are structurally misaligned with the rest of society. > *"The bottom 99% of Western societies are essentially being optimised and monetised to make the life of the 1% just unbelievable."* ## [58:04] Ads Sponsored segments for LinkedIn Hiring Pro and Function Health. ## [60:05] Could AI Make Us More Human? Galloway offers a surprising positive: unlike social media algorithms that push users toward political extremes, AI models appear to moderate views by seeking statistical medians. He sees genuine value in AI companionship for isolated elderly users. But he returns to his central fear: the biggest downside of AI is not weapons, not election contamination, not even income inequality — it is loneliness. Men aged 20 to 30 are spending less time outdoors than prison inmates, and 42% of men aged 18 to 24 have never asked a woman out in person. > *"The biggest downside of AI in my view is loneliness. AI is convincing people they can have a reasonable facsimile of life on a screen with an algorithm."* ## [65:00] What Happens When AI Becomes Your Closest Companion The conversation shifts to the Iran conflict as a case study in what happens when strategic incompetence meets operational excellence. Galloway credits the initial military strike as tactically credible but argues the absence of Congressional briefing, Gulf ally coordination, and clear exit objectives has produced a quagmire — and notes Iran's IRGC-produced propaganda is outperforming US information operations in the global war of memes. > *"The problem with wars is that the enemy has a say. And all the enemy needs to do — whether it's the Viet Cong or the Taliban or the IRGC — is survive, and they win."* ## [70:00] The Hidden Trade-Off Between Convenience And Real Relationships Galloway diagnoses America's Iran strategy as a product of a gutted diplomatic corps. When senior officials fly to Islamabad expecting a deal, 97% of the preparatory work that career diplomats would normally complete simply has not happened. The IRGC understands the game better: all they need to do is survive, and every day the conflict continues they look like the underdog who stood up to the superpower. His most optimistic scenario is a multinational force enforcing freedom of navigation through the Strait of Hormuz. > *"Do you know what we have done in the US to our diplomatic corps? We've absolutely gutted it."* ## [75:00] Why Loneliness Could Explode US stock markets hit an all-time high during active Middle East conflict — a sign that the wealthy are so insulated from geopolitical risk that war no longer registers in asset prices. The top 10% account for 50% of consumer spending, and that cohort does not care if gasoline hits six dollars a gallon. The pain is outsourced to lower-income households and oil-dependent nations. Galloway frames this dissociation from shared risk as one of the most dangerous structural features of contemporary inequality. > *"We've outsourced the downside of war to less wealthy nations who are very oil dependent, to the Gulf, which is incurring damage here."* ## [79:26] The Real Reason Human Connection Might Become More Valuable Extended discussion of AI market valuations and the historical pattern of infrastructure overbuild. Every great infrastructure boom — railroads, electrification, the internet — ended in a crash, and AI capex now constitutes a significant share of US GDP growth. Galloway argues there is a one-in-three chance AI ends up like jet aviation or vaccines: transformative for humanity but impossible to monetise exclusively for a small group of companies, because open-weight Chinese models could commoditise the entire stack through "AI dumping." > *"AI puts AI out of business. And that is if you look at the convergence of the technologies, all the models are converging."* ## [85:00] What This Means For The Next Generation Galloway argues that a market correction might actually benefit younger generations by making assets affordable again. He flags GLP-1 drugs as his technology pick over AI in terms of real-world human impact. His personal investment philosophy at age 61: aggressive diversification, no single position above 3% of net worth, rotation out of overheated US markets into Europe and Latin America. For young people, the only wealth-building path he trusts is compound interest through low-cost index funds, with money automatically invested before it can be spent. > *"The only answer I have is slowly — find out a way to start saving when you're a teenager, 25 bucks a month, then in your 20s 100, then 500."* ## [90:00] How Power, Politics, And AI Are Becoming Intertwined Drawing on his experience losing 70% of New York Times ad revenue in 60 days during 2008, Galloway warns that younger entrepreneurs have never experienced a true recession. He argues that the political class has systematically bailed out asset-owning baby boomers — COVID relief, corporate bailouts, perpetual market support — while denying younger generations the chance to buy assets at distressed prices. Recessions historically created entry points; that mechanism is now deliberately suppressed. > *"Your generation really doesn't know what a recession looks like. Like, everything stops."* ## [95:00] The Dangerous Gap Between Technology And Regulation Personal finance advice combined with a reflection on the limits of prediction. Galloway's investment rule for young people: put money in yourself first, then in relationships, then in diversified index funds. He is honest that picking winning sectors is largely futile, and that anyone claiming certainty does not know. His own investment in Pokemon cards with his son illustrates that the best investments compound in non-financial ways — relationships and shared experience accrue value that conventional ROI cannot measure. > *"The only answer I have is slowly and it requires some discipline. Save money, diversify, compound interest, invest in relationships early."* ## [100:00] What Happens If Governments Can't Keep Up With AI Asked what a 33-year-old should know that a 61-year-old has learned, Galloway offers three lessons: be humble in success because much of it is luck; forgive yourself in failure because much of it is also circumstance; and invest aggressively in relationships in your 30s, because he spent his prime years professionally focused and nearly ended up isolated. He frames every major disappointment as something people later regret not the thing itself but how upset they allowed themselves to be. > *"Nothing's ever as good or as bad as it seems. Be humble when you're successful. And forgive yourself and realise this will pass."* ## [105:00] The Future Of Work, Power, And Who Really Wins Fatherhood as purpose. Galloway confesses he did not want children and did not fall in love with his sons immediately after birth. What changed his view was discovering that fatherhood is the one investment where a positive financial return is structurally impossible — and that is precisely what makes it purposeful. The same logic applies to any cause large enough to demand more than you can ever get back: veterans, activism, caregiving. He closes with frank advice on partnership, timing, and the liberation of having no choice but to lean into your children's interests. > *"Finding your purpose is finding that thing that you can never get a real positive return on. I will never get a positive return for my children."* ## [110:00] Why The Biggest AI Risks Aren't What You've Been Told The final chapter opens with Galloway's emotional description of his sons' contrasting personalities — one a mirror of himself, one a "different species" he observes with fascination. He discusses his book *Notes on Being a Man*, framing it as letters he hopes his boys will read in 30 years. The closing question — the biggest setback and its lesson — draws the most emotionally raw answer of the episode: his mother's death. He says he has not gotten over it and does not want to, because grief is the receipt for love, and he hopes his sons will one day feel the same about losing him. > *"My mother dying. And you can never tell your parents how much you love them too much. The reverse of love is grief."* ## Entities - **Scott Galloway** (Person): NYU Stern Professor of Marketing, serial entrepreneur, author of *The Four*, *The Algebra of Happiness*, and *Notes on Being a Man*; host of the Prof G Pod and Pivot podcast - **Sam Altman** (Person): CEO of OpenAI; used as the primary case study in the recurring tech-leader idolisation and disillusionment cycle - **Elon Musk** (Person): CEO of Tesla, SpaceX, and xAI; discussed as visionary storyteller whose real products (Starlink, SpaceX) are transformative but whose timelines consistently overshoot - **Dario Amodei** (Person): CEO of Anthropic; cited as the current tech industry "good guy" before the inevitable villain turn - **Jensen Huang** (Person): CEO of Nvidia; held up as a model of storytelling-driven CEO performance via stadium keynotes - **OpenAI** (Organization): Developer of ChatGPT; primary subject of fundraising-hype and overvaluation critique - **Anthropic** (Organization): AI safety company; referenced as beneficiary of the "latest hero" investor narrative - **SpaceX** (Organization): Musk's rocket company; flagged as likely destination for capital migrating away from Tesla at IPO - **Amazon** (Organization): Galloway's top large-cap stock pick for 2026 due to robotics leadership and warehouse automation scale - **Tesla** (Organization): Great car company trading at an unjustifiable multiple that will correct when SpaceX IPOs - **GLP-1 drugs** (Concept): Weight-loss and metabolic medications (Ozempic/Wegovy class) that Galloway argues will create more real-world human impact and shareholder value than AI - **AI dumping** (Concept): Galloway's term for China flooding the US with cheap open-weight AI models to undermine American AI valuations and destabilise the economy - **Go bag / billionaire nihilism** (Concept): The practice among roughly one-in-three billionaires of maintaining funded escape plans as a symptom of disengagement from shared societal wellbeing - **Rejection tolerance** (Concept): Galloway's candidate for the most underrated skill of the AI era — the willingness to hear no, mourn briefly, and try again

#ai#economics#future-of-work
Robotics' End Game: Nvidia's Jim Fan
20:03
EN/ZH
Watch with Captions
Sequoia Capital२६ दिन पहले

Robotics' End Game: Nvidia's Jim Fan

Jim Fan, lead of Nvidia's embodied AI research, outlines the transition from language-centric models to World Action Models (WAM) that simulate physical reality. He details a roadmap toward the 'Physical Turing Test' and autonomous factories by 2040, driven by video pre-training and human egocentric data scaling. ## [00:00] Introduction Host Sonya Huang introduces Jim Fan, who leads Nvidia's embodied autonomous research group. Fan reflects on his early days as an intern and the excitement surrounding the future of robotics. > *robots are just one of the most thrilling things that's going to happen.* > *[0, 12]* ## [00:30] DGX One Origin Story Jim Fan recounts the 2016 delivery of the first DGX-1 by Jensen Huang to Elon Musk and the OpenAI team. He highlights how this moment catalyzed the deep learning revolution that led to current AI breakthroughs. > *If you believe in deep learning, deep learning will believe in you.* > *[1, 26]* ## [01:42] The Great Parallel Fan proposes 'The Great Parallel,' applying the successful LLM scaling playbook to robotics. Instead of predicting the next token in a string, the goal is to predict the next physical world state through simulation and alignment. > *instead of simulating strings can we simulate next physical world state?* > *[2, 56]* ## [03:31] Robotics Endgame Setup The strategy for achieving the robotics end game is divided into two primary pillars: model strategy and data strategy. Fan notes that while LLMs are in their final 'boss fight,' robotics is just beginning its scaling journey. > *It boils down to two things, model strategy and data strategy.* > *[3, 32]* ## [03:39] Why VLA Falls Short Visual Language Action (VLA) models are criticized for being 'head-heavy' on language while lacking a fundamental grasp of physics and verbs. Fan argues they are better at encoding static knowledge than dynamic physical interaction. > *VLAs are great at encoding knowledge and nouns, but not so much at physics and verbs.* > *[4, 8]* ## [04:32] Video World Models Fan explains how video models like VEO3 learn internal physics—such as gravity and buoyancy—simply by predicting pixels at scale. These models act as simulators that can solve mazes and plan visual sequences internally. > *Physics emerge by predicting the next blob of pixels at scale.* > *[5, 15]* ## [06:09] DreamZero World Action Nvidia introduces 'Dreamer' and World Action Models (WAM), which jointly decode future world states and motor actions. This allows robots to perform zero-shot tasks by 'dreaming' the correct motion sequence before executing it. > *Dreamer jointly decodes the next world states and next actions.* > *[6, 29]* ## [07:46] Scaling Data Collection To overcome the physical limits of teleoperation, Fan discusses Universal Manipulation Interfaces (UMI) and exoskeletons like Dex-UMI. These tools allow humans to collect high-dexterity data directly without the robot being in the loop. > *we're able to break the curse of 24 hours per robot per day* > *[10, 6]* ## [11:06] EgoScale And Scaling Laws Fan introduces Ego-Exo, a policy trained on 21,000 hours of human egocentric video. This research uncovered a neural scaling law for dexterity, showing a mathematical relationship between pre-training volume and robot performance. > *we discovered this neural scaling law for dexterity.* > *[12, 39]* ## [15:39] DreamDojo And The Roadmap Fan outlines the roadmap to 2040, including the Physical Turing Test and 'lights-out' factories. He introduces Dream Dojo, a neural simulator that replaces classical physics engines with data-driven world models. > *I can say with 95% certainty that we'll get to the end of the end game... by 2040.* > *[19, 19]* ## Entities - **Jim Fan** (person): Lead of the embodied autonomous research group at Nvidia. - **Nvidia** (organization): The technology company developing the hardware and software for the robotics end game. - **Jensen Huang** (person): CEO of Nvidia, mentioned for delivering the first DGX-1 to OpenAI. - **OpenAI** (organization): The research lab that received the first DGX-1 for deep learning development. - **DGX-1** (product): The world's first deep learning supercomputer delivered in 2016. - **VEO3** (model): A video world model capable of simulating physics and visual planning. - **Dreamer** (model): A policy model that predicts future world states and actions simultaneously. - **Ego-Exo** (project): A robotics pre-training framework using large-scale human egocentric video data.

#robotics#nvidia#world-models
Andrej Karpathy: From Vibe Coding to Agentic Engineering
29:49
EN/ZH
Watch with Captions
Sequoia Capital२७ दिन पहले

Andrej Karpathy: From Vibe Coding to Agentic Engineering

Andrej Karpathy explores the paradigm shift from traditional programming to Software 3.0, where LLMs act as programmable computers driven by context. He details the transition from 'vibe coding' to 'agentic engineering,' emphasizing that while AI handles execution, human taste and understanding remain the ultimate bottlenecks. ## [00:00] Introduction Stephanie Zhan introduces Andrej Karpathy, highlighting his foundational work at OpenAI and Tesla. She notes his unique ability to simplify complex AI shifts and introduces the concept of vibe coding. > *He has a rare gift of making the most complex technical shifts feel both accessible and inevitable. [00:22]* ## [00:44] Feeling Behind as a Coder Karpathy describes a turning point in December 2023 when agentic tools began producing perfect code without manual intervention. This shift led him to adopt vibe coding, trusting the AI to handle complex workflows autonomously. > *I just start to notice that with the latest models the chunks just came out fine. [01:29]* ## [02:28] Software 3.0 Explained Karpathy defines Software 3.0 as a paradigm where the LLM acts as a programmable computer and the context window serves as the primary programming lever. This follows Software 1.0's manual rules and Software 2.0's data-driven weight training. > *Software 3.0 is kind of about your programming now turns to prompting and what's in the context window is your lever. [03:20]* ## [03:44] Agents as the Installer Using the installation of OpenClaw as an example, Karpathy explains how agents replace rigid bash scripts with intelligent, environment-aware execution. This approach allows the AI to debug and adapt to specific system requirements autonomously. > *The agent has its own intelligence that it packages up and then it kind of like follows the instructions. [04:29]* ## [04:49] Menu Gen vs Raw Prompts Karpathy contrasts his custom-coded MenuGen app with raw prompts to models like Gemini, concluding that many traditional software layers are now redundant. He emphasizes that AI can now perform general information processing that was previously impossible with structured code. > *The software 3.0 paradigm is a lot more kind of raw. It just your neural network is doing more and more of the work. [06:11]* ## [07:37] What’s Obvious by 2026 Looking toward 2026, Karpathy envisions neural computers that process raw video and audio directly. These systems would use diffusion models to generate dynamic user interfaces, potentially making traditional UI code obsolete. > *You could imagine completely neural computers... a device that takes raw videos or audio into basically what's a neural net. [08:22]* ## [09:41] Verifiability and Jagged Skills AI models develop 'jagged' capabilities, peaking in verifiable domains like math and code due to reinforcement learning rewards. Karpathy notes the paradox where a model can refactor a massive codebase yet fail simple logic. > *state-of-the-art models today will tell you to walk [to a car wash] because it's so close... This is insane. [11:36]* ## [13:39] Founder Advice and Automation Model performance is heavily dictated by the specific data distributions chosen by frontier labs. Karpathy advises founders to explore the 'circuits' of these models to understand their strengths or use fine-tuning to fill gaps. > *we are slightly at the mercy of whatever the labs are doing, whatever they happen to put into the mix. [12:57]* ## [15:46] From Vibe Coding to Agent Engineering While 'vibe coding' raises the accessibility floor, 'agentic engineering' focuses on maintaining professional quality. This discipline involves coordinating powerful but stochastic agents to accelerate development without sacrificing the engineering bar. > *agentic engineering is about preserving the quality bar of what existed before in professional software. [16:07]* ## [25:17] Agents Everywhere and Learning Karpathy advocates for agent-native infrastructure, expressing frustration with human-centric documentation. He argues that while thinking can be outsourced to AI, human understanding remains a critical bottleneck for directing agents. > *You can outsource your thinking, but you can't outsource your understanding. [28:10]* ## Entities - **Andrej Karpathy** (person): AI researcher and former Director of AI at Tesla and founding member of OpenAI. - **Stephanie Zhan** (person): Partner at Sequoia Capital and host of the discussion. - **Software 3.0** (concept): A paradigm where LLMs act as programmable computers via prompting and context. - **Agentic Engineering** (concept): The professional discipline of coordinating AI agents to maintain software quality. - **MenuGen** (project): An app Karpathy built to OCR and visualize restaurant menus, used as a case study. - **OpenAI** (organization): AI research company co-founded by Karpathy. - **Gemini** (ai-model): Google's LLM used in Karpathy's software comparison. - **Vercel** (organization): A cloud platform used by Karpathy to deploy projects.

#vibe-coding#software-3-0#ai-agents
Ivanka Trump: मैंने 9 साल की उम्र में वो सीखा जो ज़्यादातर लोग कभी नहीं सीखते!
1:36:12
EN/ZH
Watch with Captions
The Diary Of A CEOलगभग २ महीने पहले

Ivanka Trump: मैंने 9 साल की उम्र में वो सीखा जो ज़्यादातर लोग कभी नहीं सीखते!

Ivanka Trump अपने जीवन की एक स्पष्ट झलक प्रस्तुत करती हैं — प्रसिद्ध माता-पिता और तीव्र मीडिया जाँच से आकार लेने वाले अनोखे बचपन से लेकर व्यापार और सार्वजनिक सेवा में उनके प्रभावशाली करियर तक। वो अपनी माँ से सीखे सबक़, विश्वास बनाने की चुनौतियाँ, और माता-पिता के तलाक़ तथा पिता पर हत्या के प्रयास जैसे महत्वपूर्ण अनुभवों से मिली दृढ़ता साझा करती हैं। Trump जानबूझकर जीने के दर्शन, कम आँके जाने की शक्ति, और मातृत्व तथा थेरेपी के माध्यम से व्यक्तिगत विकास की यात्रा पर भी चर्चा करती हैं, जो Planet Harvest के साथ उनके मिशन-संचालित कार्य में परिणत होती है। ## [00:00] विश्वास करना आसान क्यों नहीं है और यह क्या प्रकट करता है Ivanka Trump ने बहुत कम उम्र में सीखा — विशेषकर नौ साल की उम्र में अपने माता-पिता के बहुचर्चित तलाक़ के दौरान — कि लगातार मीडिया जाँच और आक्रामक पैपराज़ी के कारण झूठे रिश्तों से सतर्क रहना ज़रूरी है। उनकी माँ ने उन्हें कम आँके जाने की शक्ति और दबाव में बाहरी "शोर" को छानने का महत्व सिखाया। शुरू में दूसरों पर भरोसा करने के विरुद्ध एक मज़बूत रक्षा तंत्र विकसित करने के बावजूद, उन्होंने बाद में जानबूझकर गहरे संबंधों के लिए अधिक भरोसेमंद दृष्टिकोण अपनाया, इसमें निहित जोखिमों को स्वीकार करते हुए। > *मेरी माँ ने मुझे सिखाया कि कम आँका जाना बुरी बात नहीं है। यह वास्तव में बहुत शक्तिशाली चीज़ है [00:22]* > *मैंने वास्तव में ख़ुद को अधिक भरोसेमंद बनना सिखाया है। [05:48]* ## [03:32] जब आपको पता चले कि आप अलग हैं तो आगे क्या होता है Ivanka Trump को बहुत कम उम्र में ही एहसास हो गया कि लगातार मीडिया का ध्यान और सार्वजनिक जाँच के कारण उनका जीवन असामान्य है — एक ऐसी घटना जिसकी तुलना वो आज बच्चों के लिए सोशल मीडिया के बढ़े हुए प्रभाव से करती हैं। वो बताती हैं कि उनके माता-पिता ने उन्हें और उनके भाई-बहनों को इस तीव्र सार्वजनिक दृष्टि से बचाने के प्रयास किए। वो बार-बार के इंटरव्यू की तुलना में गहन बातचीत को प्राथमिकता देती हैं। > *मुझे लगता है कि हमेशा बहुत मीडिया का ध्यान और जाँच रही। आप इसे देखते हैं, बहुत कम उम्र में ही अनुभव करते हैं। [06:24]* > *हर किसी को नहीं लगता कि हमारे बच्चों का अनुभव ऐसा है जहाँ वो कहीं भी जाएँ लोगों के हाथ में रिकॉर्डिंग डिवाइस हो [06:40]* ## [05:44] बंद दरवाज़ों के पीछे उनकी माँ वास्तव में कैसी थीं Ivanka Trump अपनी माँ Ivana को एक अनुशासित पूर्व राष्ट्रीय स्कीयर के रूप में वर्णित करती हैं जिन्होंने खेल का महत्व सिखाया, जिसके कारण Ivanka बैले की ओर गईं। वो Michael Jackson के उनके Nutcracker प्रदर्शन में उपस्थित होने की एक असामान्य बचपन की स्मृति याद करती हैं। इन असाधारण अनुभवों के बावजूद, उनका दैनिक जीवन उनकी नानी "Bubby" द्वारा स्थिर रखा गया, जिन्होंने बिना शर्त प्यार दिया और खाना बनाकर उसे व्यक्त किया। > *मेरी माँ एक अद्भुत स्कीयर थीं... उन्हें अनुशासन विकसित करने के लिए खेल के महत्व में सच में विश्वास था [07:07]* > *मेरी दादी ने... वास्तव में हमें पाला... उन्होंने मुझे एक प्रकार का बिना शर्त प्यार और कोमलता सिखाई [08:44]* ## [11:47] वो मुख्य अंतर जिसने उन्हें वो बनाया जो वो हैं Ivanka Trump का पालन-पोषण उनकी स्नेहमयी दादी "Bubby" — जिन्होंने बिना शर्त प्यार और दैनिक देखभाल प्रदान की — और उनकी माँ Ivana दोनों से गहराई से प्रभावित हुआ, जिन्होंने एक पथप्रदर्शक आदर्श के रूप में काम किया। Ivana ने ताक़त, महत्वाकांक्षा और दृढ़ता का उदाहरण प्रस्तुत किया, यह दिखाते हुए कि एक प्यारी माँ होने के साथ-साथ पेशेवर लक्ष्यों को कैसे पूरा किया जा सकता है। Ivanka स्पष्ट करती हैं कि अपने माता-पिता के व्यस्त करियर के बावजूद, वो उपस्थित थे और उन्होंने उन्हें प्राथमिकता का एहसास कराया, जबकि उनकी दादी ने पारंपरिक देखभाल की भूमिका निभाई। > *मेरी माँ एक अविश्वसनीय पथप्रदर्शक थीं... ताक़त और दृढ़ता और शान और संकल्प और महत्वाकांक्षा का मेरे लिए एक अद्भुत उदाहरण। [11:57]* > *मेरे मन में कभी संदेह नहीं था कि मैं उनकी सर्वोच्च प्राथमिकता हूँ और वो मेरे लिए उपलब्ध हैं। [14:42]* ## [15:43] Donald और Ivana Trump के तलाक़ का उनके लिए असल में क्या मतलब था Donald और Ivana Trump के बहुचर्चित तलाक़ ने — जिसके बारे में Ivanka को नौ साल की उम्र में एक अख़बार से पता चला — उन पर गहरा प्रभाव डाला। वो तीव्र मीडिया जाँच से डरने और माता-पिता के अलगाव के दौरान एक बच्चे के सामान्य डर अनुभव करने की बात करती हैं। इस चुनौतीपूर्ण दौर ने — जिसने O.J. Simpson मुक़दमे से भी अधिक सुर्खियाँ बटोरीं — उनके और उनके भाई-बहनों के बीच एक अनूठा बंधन बनाया। बाद में, अपनी माँ के निधन के बाद, Ivanka को Ivana के जटिल व्यक्तित्व की गहरी समझ मिली — जो साम्यवादी Czechoslovakia में उनके पालन-पोषण से आकार लिया था — और वो चाहती हैं कि उन्होंने माँ के जीवित रहते और सवाल पूछे होते। > *इस तलाक़ ने स्पष्ट रूप से O.J. Simpson मुक़दमे से भी अधिक सुर्खियाँ बटोरीं। [20:04]* > *मेरे और मेरे भाई-बहनों के लिए सकारात्मक बात यह थी कि हमने वाक़ई एक अलग तरह से बंधन बनाया क्योंकि हम साथ में इससे गुज़र रहे थे। [23:21]* ## [18:27] Trump की बेटी होने की हक़ीक़त — लोग क्या ग़लत समझते हैं Donald Trump की बेटी होने का मतलब था कम उम्र से ही तीव्र सार्वजनिक जाँच का सामना करना — विशेषकर माता-पिता के तलाक़ के दौरान — जिसने उन्हें विश्वास के बारे में आवश्यक सावधानी सिखाई। तब से उन्होंने "शोर में संकेत ढूँढना" सीखा है और लड़ाकू सोशल मीडिया से बचकर आंतरिक शांति को प्राथमिकता दी है। Ivanka अपने माता-पिता की गहरी प्रामाणिकता को नोट करती हैं, और जबकि वो संवाद को अधिक नाज़ुकी से करती हैं, वो Stoic दर्शन से निर्देशित एक मज़बूत आत्मबोध बनाए रखती हैं — प्रामाणिक रूप से जीने और बाहरी दबावों का विरोध करने के लिए। > *अगर मुझे वो सबक़ नहीं मिला होता, तो मुझे नहीं पता कि मैं मज़बूत होती। इसने मुझे किसी पर भरोसा न करना सिखाया। [18:53]* > *मैं पलटकर वार नहीं करती क्योंकि मैं... अपना समय और ध्यान लड़ाकू होने में... सोशल मीडिया के उस गंदे भँवर में कूदने में लगाने में विश्वास नहीं करती। [26:19]* ## [23:36] सत्ता और प्रसिद्धि से घिरे रहकर आप ख़ुद को कैसे पाते हैं सत्ता और प्रसिद्धि से घिरी Ivanka Trump ने जानबूझकर व्यक्तिगत विकास और मातृत्व के परिवर्तनकारी अनुभव से अपनी पहचान पाई — जिसने उन्हें "खोल दिया" और प्रेम की क्षमता को गहरा किया। वो बाहरी दबावों का विरोध करने और ख़ुद को परिभाषित करने के लिए आत्म-जागरूकता के महत्व पर ज़ोर देती हैं, बजाय इसके कि "भीड़ जीत जाए।" वो इस दर्शन को अपने पालन-पोषण में लागू करती हैं — अपने बच्चों में व्यक्तित्व को बढ़ावा देती हैं — और अपने माता-पिता को सम्मानजनक असहमति की अनुमति देने का श्रेय देती हैं, जिससे वो ख़ुद के प्रति सच्ची रह सकीं। > *अगर आप नहीं जानते कि आप कौन हैं तो भीड़ जीत जाती है। [29:55]* > *उन्होंने एक ऐसा माहौल बनाया जहाँ असहमति ठीक थी। [32:44]* ## [30:57] कम आँका जाना उनका सबसे बड़ा फ़ायदा कैसे बना Ivanka Trump ने अपनी माँ से सीखा कि कम आँका जाना एक शक्तिशाली फ़ायदा हो सकता है। अपने शुरुआती रियल एस्टेट करियर में, उन्हें अक्सर ग़लत आँका गया — सफल माता-पिता की संतान और पुरुष-प्रधान उद्योग में एक युवा महिला के रूप में। उन्होंने इस धारणा का उपयोग किया, इसे अधिक मेहनत करने और अत्यधिक तैयार रहने की प्रेरणा बनाया, और अंततः इसे उन लोगों के विरुद्ध अपने लाभ के लिए इस्तेमाल किया जिन्होंने उन्हें कम आँका। > *मेरी माँ ने मुझे सिखाया कि कम आँका जाना बुरी बात नहीं है। यह वास्तव में बहुत शक्तिशाली चीज़ है [00:22]* > *मैंने उस डर को, उस भावना को अपनाया और इसका उपयोग ख़ुद को आगे बढ़ाने के लिए किया। [35:06]* ## [32:59] नियुक्ति करते समय वो वास्तव में क्या देखती हैं और यह क्यों मायने रखता है नियुक्ति करते समय Ivanka Trump मज़बूत आत्मबोध, एजेंसी, अच्छी निर्णय क्षमता और "व्यावहारिक बुद्धि" वाले व्यक्तियों को प्राथमिकता देती हैं, क्योंकि ये जन्मजात गुण सिखाना कठिन है। वो ऐसे "अच्छे लोगों" के साथ काम करने के महत्व पर ज़ोर देती हैं जिन पर वो भरोसा और सम्मान करती हैं, इन गुणों को सफल कार्य संबंधों और समग्र टीम गतिशीलता के लिए मूलभूत मानती हैं। > *लोगों को सिखाना बहुत कठिन है, आप जानते हैं, एक शानदार व्यक्ति हो सकता है, लेकिन अगर उसमें अच्छी निर्णय क्षमता नहीं है या वो स्वयं-प्रेरित नहीं है, तो उसे यह देना बहुत कठिन है। [38:15]* > *मैं ऐसे लोगों के साथ काम नहीं करना चाहती जिन्हें मैं पसंद नहीं करती, जो मुझे अच्छे लोग नहीं लगते, क्योंकि मैं अपना समय किसी ऐसे व्यक्ति के साथ नहीं बिताना चाहती जिस पर मुझे भरोसा नहीं या जिसका मैं सम्मान नहीं करती। [39:00]* ## [37:49] उन्होंने फ़ैशन छोड़कर सरकार क्यों चुनी Wharton से स्नातक होने पर Anna Wintour से Vogue में एक प्रतिष्ठित नौकरी के प्रस्ताव के बावजूद, Ivanka Trump ने रियल एस्टेट के अपने आजीवन जुनून को अपनाया। बाद में उन्होंने एक सफल फ़ैशन ब्रांड, Ivanka Trump.com बनाया, जो सालाना लगभग $800 मिलियन की बिक्री तक पहुँचा। हालाँकि, जब उन्होंने अपने पिता के अनुरोध पर उनके प्रशासन में सेवा करने का फ़ैसला किया, तो सरकारी नैतिकता नियमों का पालन करने के लिए उन्होंने इस फलते-फूलते व्यवसाय को बंद करने का जानबूझकर निर्णय लिया। उन्होंने इस अवसर को अपने देश के प्रति एक अनिवार्य विशेषाधिकार और कर्तव्य के रूप में देखा — महत्वपूर्ण व्यक्तिगत और पेशेवर क़ुर्बानियों के बावजूद। > *जब मैंने सरकार में जाकर इसे बंद किया तब हम सालाना लगभग $800 मिलियन की बिक्री कर रहे थे। [42:30]* > *मैं अविश्वसनीय रूप से विशेषाधिकृत महसूस करती हूँ कि उन्होंने हमें उस देश की सेवा करने का अवसर दिया जिससे हम बहुत प्यार करते हैं। [43:30]* ## [41:06] जब Trump ने चुनाव लड़ने का फ़ैसला किया तो वास्तव में क्या हुआ Donald Trump का 2015 में राष्ट्रपति पद के लिए चुनाव लड़ने का निर्णय Bedminster में एक पारिवारिक बैठक में घोषित किया गया, जिसकी तेज़ी ने Ivanka को चौंका दिया — हालाँकि 1980 के दशक से उनकी दीर्घकालिक, यद्यपि अव्यक्त, राजनीतिक महत्वाकांक्षाएँ थीं। वो 16 साल की उम्र में बोर्डिंग स्कूल में एक बचपन की घबराहट याद करती हैं, जब उन्हें डर था कि वो चुनाव लड़ेंगे, लेकिन उन्हें आश्वस्त किया गया कि ऐसा नहीं होगा। राष्ट्रपति की राजनीति में उनका प्रवेश परिवार के लिए एक "आमूल परिवर्तन" था, जिसने Ivanka के दृष्टिकोण को उनके New York City के "बुलबुले" से परे व्यापक रूप से विस्तारित किया और सार्वजनिक सेवा की एक "असाधारण यात्रा" शुरू की। > *मुझे याद है एक बार मुझे लगा कि यह सच है। मैं 16 की थी और बोर्डिंग स्कूल में थी और मैंने उन्हें फ़ोन किया... 'यह मेरी ज़िंदगी बर्बाद कर देगा।' [51:48]* > *उनके अभियान ने मेरे लिए इसे खोल दिया और मुझे एहसास हुआ कि मैं किस बुलबुले में थी [48:02]* ## [46:23] Trump का राष्ट्रपति पद के लिए चुनाव लड़ना — सब कुछ कैसे बदल गया Donald Trump का राष्ट्रपति पद के लिए चुनाव लड़ने का निर्णय Ivanka के लिए मौलिक रूप से सब कुछ बदल गया, पूरे परिवार के लिए एक "आमूल परिवर्तन"। पारंपरिक करियर मार्गों को दरकिनार करते हुए राजनीति में उनका अपरंपरागत प्रवेश "आग की नली से पानी पीने" जैसा था। अभियान ने Ivanka के New York City के अनुभव के "बुलबुले" को तोड़ दिया, उनके दृष्टिकोण को गहराई से विस्तारित किया और उन्हें अपने देश की सेवा करने के विशेषाधिकार को अपनाने के लिए प्रेरित किया। > *यह हम सब के लिए आग की नली से पानी पीने जैसा था। [47:08]* > *उनके अभियान ने मेरे लिए इसे खोल दिया और मुझे एहसास हुआ कि मैं किस बुलबुले में थी [48:02]* ## [48:52] Ads इस खंड में Shopify का विज्ञापन है — एक ई-कॉमर्स प्लेटफ़ॉर्म जो ऑनलाइन स्टोर बनाना, सोशल मीडिया पर बेचना और AI टूल्स से संचालन प्रबंधित करना आसान बनाता है। इसमें Pipe Drive का भी प्रचार है — एक बुद्धिमान CRM जिसका उपयोग होस्ट करते हैं, जो स्पष्ट बिक्री प्रक्रिया दृश्यता के लिए विज़ुअल पाइपलाइन डैशबोर्ड प्रदर्शित करता है। > *Shopify, शुरुआत करना आसान बनाता है क्योंकि आप अपना स्टोर बना सकते हैं, सोशल पर बेच सकते हैं, भुगतान ले सकते हैं, AI टूल्स का उपयोग कर सकते हैं, और सब कुछ एक ही जगह प्रबंधित कर सकते हैं। [49:22]* > *Pipe Drive एक उपयोग में आसान बुद्धिमान CRM है... यह आपकी बिक्री प्रक्रिया को एक डैशबोर्ड के माध्यम से दृश्यमान बनाता है। [50:17]* ## [51:04] क्या उन्होंने कभी सोचा था कि उनके पिता सच में ऐसा करेंगे जबकि Donald Trump 1980 के दशक से राष्ट्रपति पद के लिए चुनाव लड़ने पर विचार कर रहे थे, Ivanka बताती हैं कि उनके बचपन में इस महत्वाकांक्षा पर स्पष्ट रूप से चर्चा नहीं हुई। वो 16 साल की उम्र के एक पल को स्पष्ट रूप से याद करती हैं जब उन्होंने घबराकर सोचा कि उनके पिता चुनाव लड़ रहे हैं, लेकिन उन्हें आश्वस्त किया गया कि ऐसा नहीं हो रहा। वो नोट करती हैं कि व्यापार नीति जैसे मुद्दों पर उनके दृष्टिकोण दशकों से सुसंगत बने रहे। > *मुझे याद है एक बार मुझे लगा कि यह सच है। मैं 16 की थी और बोर्डिंग स्कूल में थी और मैंने उन्हें फ़ोन किया... 'यह मेरी ज़िंदगी बर्बाद कर देगा।' [51:48]* > *व्यापार नीति के बारे में उनका दृष्टिकोण समय के साथ सुसंगत रहा और आज तक बिल्कुल उसी पर सुसंगत है [52:35]* ## [54:26] White House छोड़ना राहत थी या कुछ और White House छोड़ना अफ़सोस के अर्थ में राहत नहीं था, क्योंकि Ivanka Trump को लगता है कि उन्होंने "मैदान में सब कुछ झोंक दिया" और अपनी चार साल की सार्वजनिक सेवा की उपलब्धियों पर गर्व है। वो सेवा के अवसर को एक "अद्भुत विशेषाधिकार" मानती हैं लेकिन राजनीति में लौटने की कोई इच्छा नहीं रखतीं — अपने बच्चों को प्राथमिकता देती हैं और उन्हें आगे के सार्वजनिक जीवन की क़ीमत चुकाने नहीं देना चाहतीं। वो अपने योगदान से संतुष्ट हैं और महसूस करती हैं कि अब उनके पिता के पास उनका समर्थन करने के लिए एक मज़बूत टीम है। > *मैंने मैदान में सब कुछ झोंक दिया, आप जानते हैं? मैं पीछे मुड़कर नहीं कहती... मुझे कोई अफ़सोस नहीं है। [53:33]* > *मेरी पहली ज़िम्मेदारी उनकी माँ बनना है। [56:49]* ## [58:08] क्या कोई वाक़ई White House के जीवन के लिए तैयार था Ivanka Trump मानती हैं कि उच्च-स्तरीय राजनीति और White House के अंदर के जीवन के तीव्र अनुभव के लिए कोई भी वास्तव में तैयार नहीं होता। उन्होंने देखा कि सत्ता, धन की तरह, लोगों के अंतर्निहित गुणों को बढ़ाती है। विश्व नेताओं — राजाओं से लेकर निर्वाचित अधिकारियों तक — के साथ उनकी बातचीत ने उन्हें रहस्यमुक्त किया, यह प्रकट करते हुए कि मूल रूप में वो "बस लोग" हैं जिनकी सामान्य समस्याएँ हैं, जिसने अंततः किसी भी भय को दूर कर दिया। > *इस अनुभव के लिए कुछ भी आपको तैयार नहीं करता। [58:26]* > *आपको अंत में एहसास होता है कि लोग बस लोग हैं। [59:03]* ## [59:44] हत्या के प्रयास ने हमेशा के लिए क्या बदल दिया जुलाई 2024 में उनके पिता पर हत्या के प्रयास ने Ivanka Trump के जीवन को मूल रूप से बदल दिया, सुरक्षा चिंताओं को तीव्र करते हुए और US Secret Service सुरक्षा को आवश्यक बनाते हुए। अपने बच्चों के साथ वास्तविक समय में इस घटना को देखते हुए, उनकी तत्काल प्रतिक्रिया बच्चों को बचाना थी, हालाँकि उन्हें सहज रूप से महसूस हुआ कि उनके पिता ठीक होंगे। इस भयावह अनुभव ने — अन्य पारिवारिक स्वास्थ्य संकटों के साथ — जीवन की अनमोलता में उनके विश्वास और सकारात्मकता चुनने तथा हर पल को महत्व देने की प्रतिबद्धता को मज़बूत किया — सार्वजनिक सेवा और हिंसा के चिंताजनक सहसंबंध के बावजूद। > *मेरी पहली प्रतिक्रिया उन्हें दूसरी तरफ़ मोड़ना थी। [62:02]* > *जीवन में, आपके पास केवल यह चुनाव है कि आप कैसे प्रतिक्रिया करें। और मैं सकारात्मक परिणाम देखना चुनती हूँ। [66:05]* ## [1:07:20] राजनीति से दूर होने के बाद जीवन कैसा दिखता है 2022 में राजनीति से दूर होने के बाद, Ivanka Trump का जीवन अब उनके छोटे बच्चों और निजी पारिवारिक जीवन को प्राथमिकता देता है, क्योंकि उन्होंने राजनीति की "अँधेरी दुनिया" को अपने स्वभाव के विपरीत पाया। वो "चील और कौआ" रूपक का उपयोग करके सार्वजनिक आलोचना से निपटती हैं — नकारात्मकता से जुड़ने के बजाय ऊपर उठना चुनती हैं। तीव्र सार्वजनिक जाँच के इस दौर ने — जिसमें उनके पिता का मौत से निकट का अनुभव शामिल है — व्यक्तिगत विकास की "औषधि" के रूप में काम किया, उन्हें अपने नियंत्रण में आंतरिक शांति और सामंजस्य खोजना और जीवन के आशीर्वादों के लिए कृतज्ञता पर ध्यान केंद्रित करना सिखाया। > *राजनीति एक काफ़ी अँधेरी दुनिया है। बहुत अँधेरा है, बहुत नकारात्मकता है, और यह वास्तव में एक इंसान के रूप में मुझे जो अच्छा लगता है उसके विपरीत है। [67:45]* > *इसके प्रति चील की प्रतिक्रिया... मुड़ना और कौए को गिराना या बचाव करना नहीं है... बस ऊपर उड़ जाना है। [69:28]* ## [1:11:04] Ads यह अध्याय पॉडकास्ट के भीतर एक संक्षिप्त विज्ञापन विराम का प्रतिनिधित्व करता है। ## [1:14:24] थेरेपी ने उनका सब कुछ देखने का नज़रिया कैसे बदला Ivanka Trump ने वयस्क थेरेपी शुरू की, इसे एक "आंतरिक सूची" उपकरण के रूप में देखते हुए — उनकी "विकास-उन्मुख मानसिकता" और महत्वपूर्ण जीवन घटनाओं को संसाधित करने की इच्छा से प्रेरित। प्रमुख उत्प्रेरकों में उनके पति Jared का दूसरी बार थायरॉइड कैंसर का निदान, Washington से उनकी विदाई और उनकी माँ का अप्रत्याशित निधन शामिल था। थेरेपी ने उन्हें भावनाओं को विभाजित करने के बजाय ख़ुद का पोषण करने और उन्हें संसाधित करने में मदद की, अंततः आत्म-समझ और आगे बढ़ने पर उनका नज़रिया बदल दिया। > *मेरी बहुत विकास-उन्मुख मानसिकता है... मैं हमेशा ख़ुद के और दुनिया के बारे में सीखने की तलाश में रहती हूँ [74:35]* > *Jared को दूसरी बार थायरॉइड कैंसर का निदान हुआ। और फिर मेरी माँ का निधन हो गया [75:59]* ## [1:20:28] माँ को खोना और इससे उन्होंने क्या सीखा Ivanka Trump 2022 में अपनी माँ Ivana Trump की अचानक और दुखद मृत्यु पर विचार करती हैं, अप्रत्याशित माता-पिता की हानि के अनूठे प्रभाव को उजागर करते हुए। उन्होंने एक उचित शोक प्रक्रिया के लिए प्रतिबद्धता जताई — असुविधा का सामना करते हुए और अपनी भावनाओं को संसाधित करते हुए। एक माता-पिता के रूप में, वो अब अपनी माँ के सकारात्मक गुणों को अपने बच्चों के सामने प्रकट करने का लक्ष्य रखती हैं, साथ ही जानबूझकर उनकी चुनौतियों को आगे बढ़ाने से बचती हैं — अपनी माँ के जीवन का एक स्पष्ट वयस्क दृष्टिकोण प्राप्त करते हुए। > *उन्होंने एक अच्छा जीवन जिया था। [81:07]* > *मैंने वास्तव में उनके बारे में सोचने का समय लिया — उस बच्चे की नज़रों से नहीं जो उन्हें पूरी तरह आदर्श मानता था, बल्कि एक वयस्क की नज़रों से जो उन्हें स्पष्ट रूप से देखता था। [83:15]* ## [1:26:28] वो 3 नियम जो उनके अनुसार सफलता और ख़ुशी को परिभाषित करते हैं Ivanka Trump मानती हैं कि सच्ची सफलता और ख़ुशी तीन मुख्य सिद्धांतों से परिभाषित होती है — विशेषकर उद्यमिता के लिए — जो वो अपनी बेटी Arabella के साथ साझा करतीं। पहला, व्यक्ति को अपने काम से सच में प्यार होना चाहिए, क्योंकि समर्पण के लिए जुनून आवश्यक है। दूसरा, प्रामाणिकता सर्वोपरि है; स्वयं होना और अपना रास्ता बनाना महत्वपूर्ण है, क्योंकि नक़ल हार की ओर ले जाती है। तीसरा, और सबसे मूलभूत, दुनिया आप पर विश्वास करे उससे पहले व्यक्ति को आत्म-विश्वास विकसित करना होगा, क्योंकि यह किसी भी उपलब्धि का शुरुआती बिंदु है। वो यह भी नोट करती हैं कि पारंपरिक "कार्य-जीवन संतुलन" मायावी है — इसके बजाय वो प्राथमिकताओं के साथ तालमेल बैठाने का प्रयास करती हैं। > *मैंने कभी किसी को अपने शिखर पर नहीं देखा जो अपने काम से बिल्कुल प्यार न करता हो। [92:46]* > *दुनिया आप पर विश्वास करे उससे पहले आपको ख़ुद पर विश्वास करना होगा। [94:48]* ## [1:28:37] Planet Harvest क्या है और यह आपकी सोच से ज़्यादा अहम क्यों हो सकता है Planet Harvest Ivanka Trump का मिशन-संचालित उद्यम है जिसका उद्देश्य खाद्य अपव्यय को कम करना और अमेरिकी किसानों का समर्थन करना है। यह पहल COVID-19 महामारी के दौरान प्रेरित हुई जब उन्होंने आपूर्ति श्रृंखला की समस्याओं के कारण बड़ी मात्रा में नाशवान उत्पादन को फेंके जाते देखा। Planet Harvest उस निरंतर समस्या का समाधान करता है जिसमें पूरी तरह अच्छा भोजन सख़्त कॉस्मेटिक मानकों को पूरा न करने के कारण खुदरा विक्रेताओं द्वारा अस्वीकार कर दिया जाता है — इस प्रकार किसानों को अतिरिक्त राजस्व प्रदान करता है और पर्यावरण को लाभ पहुँचाता है। > *Planet Harvest का जन्म हुआ... यह सुनिश्चित करने के लिए कि जब लोगों को भोजन की ज़रूरत हो, तो खेतों में भोजन बर्बाद न हो — जैसा कि हमने महामारी के शुरुआती दिनों में देखा। [89:18]* > *हर साल 400 मिलियन पाउंड स्ट्रॉबेरी खेतों में छोड़ दी जाती हैं... इसलिए नहीं कि वो अपूर्ण हैं। बस वो एक बहुत सख़्त कॉस्मेटिक विनिर्देश को पूरा नहीं करतीं। [90:57]* ## इकाइयाँ - **Ivanka Trump** (व्यक्ति): Donald और Ivana Trump की बेटी, व्यवसायी और पूर्व सरकारी अधिकारी। - **The Diary Of A CEO** (संगठन): इंटरव्यू की मेज़बानी करने वाला पॉडकास्ट। - **Donald Trump** (व्यक्ति): Ivanka Trump के पिता, संयुक्त राज्य अमेरिका के पूर्व राष्ट्रपति। - **Ivana Trump** (व्यक्ति): Ivanka Trump की माँ, Czechoslovakia की पूर्व स्कीयर। - **Michael Jackson** (व्यक्ति): प्रसिद्ध अमेरिकी गायक, गीतकार और नर्तक। - **O.J. Simpson** (व्यक्ति): पूर्व अमेरिकी फ़ुटबॉल खिलाड़ी, प्रसारक, अभिनेता और दोषसिद्ध अपराधी। - **Marcus Aurelius** (व्यक्ति): रोमन सम्राट और Stoic दार्शनिक। - **Shopify** (संगठन): ऑनलाइन स्टोर बनाने के लिए ई-कॉमर्स प्लेटफ़ॉर्म। - **Pipe Drive** (संगठन): बुद्धिमान CRM (ग्राहक संबंध प्रबंधन) सॉफ़्टवेयर। - **Anna Wintour** (व्यक्ति): Vogue की प्रधान संपादक। - **Vogue** (संगठन): फ़ैशन और जीवनशैली पत्रिका। - **Wharton School of Business** (संगठन): University of Pennsylvania का बिज़नेस स्कूल। - **Office of Government Ethics** (संगठन): हितों के टकराव को रोकने के लिए ज़िम्मेदार अमेरिकी सरकारी एजेंसी। - **Jared Kushner** (व्यक्ति): Ivanka Trump के पति, जिन्होंने सरकार में भी सेवा की। - **US Secret Service** (संगठन): Ivanka Trump और उनके परिवार की सुरक्षा के लिए ज़िम्मेदार सरकारी एजेंसी। - **Planet Harvest** (संगठन): Ivanka Trump द्वारा सह-स्थापित व्यवसाय जो खाद्य अपव्यय कम करने और किसानों का समर्थन करने पर केंद्रित है। - **Arabella** (व्यक्ति): Ivanka Trump की सबसे बड़ी बेटी। - **Stoicism** (दर्शन): एक प्राचीन ग्रीक दार्शनिक संप्रदाय। - **Buddhism** (दर्शन): एक पूर्वी दर्शन। - **Daoism** (दर्शन): एक पूर्वी दर्शन। - **Czechoslovakia** (स्थान): मध्य यूरोप का एक पूर्व देश। - **New York City** (स्थान): संयुक्त राज्य अमेरिका का एक प्रमुख शहर। - **Bedminster, New Jersey** (स्थान): वो स्थान जहाँ Ivanka Trump को अपने पिता पर हत्या के प्रयास की ख़बर मिली। - **Child Tax Credit** (नीति): परिवारों के लिए अमेरिकी कर क्रेडिट। - **Great American Outdoors Act** (नीति): Ivanka Trump द्वारा समर्थित विधान। - **Human Trafficking Legislation** (नीति): वो विधान जिस पर Ivanka Trump ने अपनी सार्वजनिक सेवा के दौरान काम किया। - **Vocational Education and Skills Training** (पहल): अमेरिकी श्रमिकों को कौशल और पुनः कौशल प्रदान करने के लिए Ivanka Trump द्वारा प्रोत्साहित कार्यक्रम। - **Meditations** (पुस्तक): Marcus Aurelius के व्यक्तिगत लेखन की श्रृंखला।

#ivanka-trump#family#childhood
Claude Code में एक्सप्लोर→प्लान→कोड→कमिट वर्कफ़्लो
3:11
EN/ZH
Watch with Captions
ClaudeClaude Code 101लगभग २ महीने पहले

Claude Code में एक्सप्लोर→प्लान→कोड→कमिट वर्कफ़्लो

Anthropic का तीन मिनट का वॉकथ्रू उस लूप का जिसे वे Claude Code के साथ काम करते समय सबसे महत्वपूर्ण आदत मानते हैं: पहले प्लान मोड में रिसर्च करें, किसी भी फ़ाइल को छूने से पहले "पूर्ण" का अर्थ परिभाषित करें, फिर पुश करने से पहले सबएजेंट से diff रिव्यू कराएं। ## [00:03] एक्सप्लोर-प्लान-कोड-कमिट सीधे शुरू करने से बेहतर क्यों है शुरुआत सीधी है — अगर कोर्स से केवल एक आदत अपनानी हो तो यही वर्कफ़्लो चुनें। यह जिस विफलता पैटर्न से लड़ता है वह है Claude में टास्क पेस्ट करके तुरंत कोड जनरेट करवाने का रिफ्लेक्स, जो आगे चलकर सुधार की लागत बढ़ा देता है। > *Without this, most people jump straight to pasting in Claude to write code, which means more course correcting later on.* ## [00:21] प्लान मोड: किसी भी संपादन से पहले रीड-ओनली रिसर्च प्लान मोड एक्सप्लोर और प्लान को एक ही कदम में संकुचित करता है। Claude फ़ाइलें पढ़ और वेब सर्च कर सकता है लेकिन लिखने की अनुमति नहीं है — Shift+Tab से प्रॉम्प्ट पर स्विच करें। नैरेटर एक वास्तविक अनुरोध के साथ डेमो करता है (इमेज अपलोड पाइपलाइन में WebP कन्वर्जन जोड़ें, पता करें यह कहाँ फिट होगी, क्या डिपेंडेंसी चाहिए, कैसे अप्रोच करें)। Claude एक प्लान लौटाता है; आप इसे पढ़ें और अगर कुछ छूट गया हो तो संशोधन मांगें। यह पूरे चक्र में दिशा बदलने का सबसे सस्ता बिंदु है क्योंकि अभी तक कुछ भी नहीं लिखा गया। > *With plan mode, Claude can't edit files. It just reads files to gather research on how to tackle this implementation.* ## [01:11] प्लान स्वीकृत करें, फिर Claude के कोडिंग के दौरान सुधार करें प्लान सही लगने पर Approve Claude को चेकलिस्ट पूरी करने के लिए एक्जीक्यूशन वापस देता है। आप चुन सकते हैं कि फ़ाइल एडिट ऑटो-एक्सेप्ट हों या हर बार पुष्टि मांगें। Claude खुद समस्याएं सुलझाएगा लेकिन दखल देने के लिए तैयार रहें — और यहां प्लान मोड का फायदा यह है कि एजेंट उस रिसर्च संदर्भ को साथ रखता है जिसने प्लान बनाया था, इसलिए बीच उड़ान में किए सुधार सही जगह उतरते हैं, शुरुआत से नहीं। > *This is the benefit of working with plan mode because after the plan is finished, we also have the context of how it got to the results to help it guide its next decision.* ## [01:39] सफलता मानदंड स्पष्ट करें और Claude को असली टूल दें "सही" की परिभाषा के बिना प्लान Claude को अनुमान लगाने पर छोड़ देता है। सफलता का स्वरूप स्पष्ट करें, फिर एजेंट को वास्तव में सत्यापित करने के लिए उपकरण दें: Claude+Chrome एक्सटेंशन इसे ब्राउज़र टैब चलाकर अभी-अभी बनाई गई UI टेस्ट करने देती है; एक टेस्ट सूट हर लूप पर सत्यापन के लिए कुछ देती है, और Claude टेस्ट भी लिख सकता है — लेकिन केवल तभी जब आपने उन्हें ग्राउंड ट्रुथ के रूप में पहले ही सत्यापित किया हो। एक टिकाऊपन टिप: जब Claude बार-बार एक ही समस्या से टकराए तो उसे CLAUDE.md फ़ाइल में समाधान पर्सिस्ट करवाएं ताकि यह बार-बार न सीखे। > *In order for Claude to be confident in its results, it has to be clear on what it deems correct.* ## [02:24] सबएजेंट रिव्यू, कमिट और रिकैप पुश करने से पहले diff पर सबएजेंट कोड रिव्यूअर चालू करें — बिना इम्प्लीमेंटेशन से जुड़ाव के दूसरी नज़र। फिर Claude से अपनी शैली में कमिट संदेश लिखवाएं और शिप करें। रिकैप हर चरण को फिर से परिभाषित करता है: एक्सप्लोर संदर्भ देता है, प्लान सफलता परिभाषित करता है, कोड प्लान की ओर अभिसरण करने वाला आदान-प्रदान है, कमिट रिव्यू करके पुश करता है ताकि आप आगे बढ़ सकें। > *A tip before you commit, run a sub agent code reviewer to look at your code.* ## Entities - **Anthropic Tutorial Narrator** (Person): Claude Code 101 कोर्स के लिए Anthropic की आधिकारिक आवाज। - **Claude Code** (Software): एजेंटिक टर्मिनल कोडिंग टूल जिसकी अनुशंसित दैनिक लूप इस एपिसोड का विषय है। - **Plan mode** (Feature): Shift+Tab से टॉगल होने वाला रीड-ओनली मोड — Claude रिसर्च करके प्लान प्रस्तावित करता है लेकिन फ़ाइलें संपादित नहीं कर सकता। - **Claude + Chrome extension** (Software): Claude Code को टास्क पूर्ण घोषित करने से पहले Chrome टैब चलाकर UI बदलाव सत्यापित करने देती है। - **CLAUDE.md** (File): प्रोजेक्ट मेमोरी फ़ाइल जिसे यहाँ Claude द्वारा बार-बार सीखे जाने वाले सुधारों के पर्सिस्टेंस लक्ष्य के रूप में उपयोग किया गया है। - **Subagent code reviewer** (Pattern): प्री-कमिट Claude सबएजेंट जो मानव के पुश करने से पहले diff रिव्यू करता है।

#claude-code#plan-mode#agentic-coding
Claude Code में संदर्भ प्रबंधन
3:51
EN/ZH
Watch with Captions
ClaudeClaude Code 101लगभग २ महीने पहले

Claude Code में संदर्भ प्रबंधन

Anthropic के Claude Code 101 ट्यूटोरियल में संदर्भ पर विस्तृत चर्चा — क्या विंडो भरता है, ऑटो-कॉम्पैक्शन कब शुरू होता है, और सत्र को कुशल बनाए रखने के व्यावहारिक उपाय (/compact, /clear, /context, claude.md, MCP टॉगल, स्किल्स, सब-एजेंट)। ## [00:03] संदर्भ सीमित क्यों है और यह क्यों मायने रखता है संदर्भ Claude की कार्यशील स्मृति है: हर प्रॉम्प्ट, हर फाइल रीड, हर टूल कॉल का परिणाम एक ही विंडो में जमा होता है। विंडो बड़ी है लेकिन सीमित है, इसलिए बहु-चरण सत्र शुरू करते ही इनपुट को अनुकूलित करना अनिवार्य हो जाता है। > *Every file it reads, every command it runs, every message you send, it all takes up space in the context window.* ## [00:39] ऑटो-कॉम्पैक्शन और /compact कमांड सीमा के करीब पहुंचने पर Claude Code स्वचालित रूप से कॉम्पैक्ट करता है: महत्वपूर्ण बातों को सारांशित करता है और अनावश्यक टूल कॉल परिणामों को हटाकर जगह बनाता है। आप `/compact` को मैन्युअल रूप से भी चला सकते हैं — तब उपयोगी जब आप जगह चाहते हों लेकिन अब तक के काम की याददाश्त बनाए रखना चाहते हों। समझौता: कॉम्पैक्शन से पुराने टर्न के विवरण खो सकते हैं। > *Compaction will summarize important details and remove the unnecessary tool call results and free up a lot of space in your context window.* ## [01:11] /clear और /context: नए सिरे से शुरुआत और उपयोग देखना यदि पिछले सत्र की कोई याद न रखते हुए पूर्ण रीसेट चाहिए, तो `/clear` सब कुछ मिटा देता है। जगह वास्तव में कहां जा रही है यह देखने के लिए `/context` कुल आकार, सबसे अधिक खपत करने वाली श्रेणियां और एक ग्राफिक दिखाता है — compact और clear के बीच निर्णय लेने से पहले का निदान। > *To check the state of your context, run the /context command.* ## [01:35] व्यावहारिक नियम: फीचर के बीच compact, फीचर बदलते समय clear नैरेटर एक स्पष्ट अनुमान-नियम देता है: अभी भी एक फीचर पर काम कर रहे हैं और सीमा के करीब हैं? Compact करें — संबंधित इतिहास आगे जाना चाहिए। योजना पूरी हो गई और कुछ नया शुरू कर रहे हैं? Clear करें — पुरानी बातचीत नए काम में पक्षपात ला सकती है। > *If you have finished the plan and want to start on a new feature, then clear. You don't want the previous conversation to present bias in anything new that you want to create.* ## [01:57] claude.md, प्रॉम्प्ट की सटीकता और कम लिखकर अधिक पाना Claude को सत्रों में याद रखनी चाहिए वाली हर बात `claude.md` में डालें ताकि उसे हर बार वही तथ्य दोबारा न खोजने पड़ें। और विरोधाभासी रूप से, छोटे प्रॉम्प्ट अधिक संदर्भ खर्च करते हैं: अस्पष्ट सवाल पर Claude कोडबेस में grep करता है और अधिक तर्क करता है — यह सब विंडो भरता है। एक-दो वाक्य की स्पष्टता बाद में बहुत जगह बचाती है। > *The irony behind writing a smaller prompt is that it in the long run, it will take up more context.* ## [02:26] संदर्भ उपकरण के रूप में MCP सर्वर, स्किल्स और सब-एजेंट MCP सर्वर डिफ़ॉल्ट रूप से अपने सभी टूल संदर्भ में लोड करते हैं — प्रासंगिक हों तो ठीक, अन्यथा महंगा, इसलिए प्रोजेक्ट से असंबंधित बंद कर दें। स्किल्स MCP सर्वर की तरह काम करती हैं लेकिन पूरी टूल सतह को संदर्भ में नहीं डालतीं। सब-एजेंट अपनी अलग विंडो के साथ समानांतर चलते हैं, इसलिए "ऑथ एंडपॉइंट कहां हैं?" जैसी जानकारी खोजने की कार्यों में सब-एजेंट को भेजकर केवल उत्तर प्राप्त करें, पूरी यात्रा नहीं। > *Sub agents run in parallel with your main agent but has a complete separate context window.* ## [03:06] सारांश Claude Code में संदर्भ प्रबंधन एक लंबे उत्पादक सत्र और एक अटके हुए सत्र के बीच का अंतर है। `/compact` से लंबे सत्रों को सारांशित करें, `/clear` से नई शुरुआत करें, प्रॉम्प्ट में सटीक रहें, `/context` से देखें क्या विंडो खा रहा है, और केवल-उत्तर वाले काम सब-एजेंट को सौंपें। > *Managing context within cloud code is crucial. Use slash compact to summarize long sessions and slashclear to start fresh.* ## संस्थाएं - **Anthropic Tutorial Narrator** (Person): Claude Code 101 ट्यूटोरियल श्रृंखला के लिए Anthropic की आधिकारिक आवाज। - **Claude Code** (Software): Anthropic का एजेंटिक टर्मिनल कोडिंग असिस्टेंट जिसकी संदर्भ विंडो इस एपिसोड का विषय है। - **Context window** (Concept): Claude की कार्यशील स्मृति — सीमित, प्रॉम्प्ट, फाइल रीड और टूल कॉल परिणामों से भरती है। - **/compact** (Command): स्लैश कमांड (और ऑटो-ट्रिगर) जो इतिहास का सारांश बनाता है और टूल कॉल शोर हटाकर जगह बनाता है। - **/clear** (Command): स्लैश कमांड जो नए काम के लिए पूरा सत्र मिटा देता है। - **/context** (Command): स्लैश कमांड जो कुल संदर्भ आकार और उपभोग करने वाली श्रेणियां बताता है। - **claude.md** (File): प्रोजेक्ट-स्तरीय मेमोरी फाइल जो Claude सत्रों में पढ़ता है ताकि वही तथ्य दोबारा न खोजे। - **MCP servers** (Software): टूल प्रदाता जो डिफ़ॉल्ट रूप से सभी उजागर टूल संदर्भ में लोड करते हैं — असंबंधित होने पर बंद करें। - **Skills** (Feature): MCP सर्वर का हल्का विकल्प जो पूरी टूल सतह संदर्भ में नहीं लोड करता। - **Sub agents** (Feature): अपनी संदर्भ विंडो वाले समानांतर एजेंट जो मुख्य विंडो को प्रदूषित किए बिना सीमित प्रश्नों के उत्तर देते हैं।

#claude-code#context-window#compact
AI अभी गणितज्ञों की जगह क्यों नहीं लेगा – टेरेंस ताओ
4:12
EN/ZH
Watch with Captions
Dwarkesh Patelलगभग २ महीने पहले

AI अभी गणितज्ञों की जगह क्यों नहीं लेगा – टेरेंस ताओ

टेरेंस ताओ गणित में AI की बदलती भूमिका पर चर्चा करते हैं और कहते हैं कि AI बहुत से रूटीन कार्यों को स्वचालित ज़रूर करेगा, लेकिन मानव गणितज्ञों को पूरी तरह प्रतिस्थापित नहीं करेगा; बल्कि उनका ध्यान नई सीमाओं की ओर मोड़ देगा। वे मानव-AI सहयोग के भविष्य और वैज्ञानिक खोज पर AI के दीर्घकालिक प्रभाव की अप्रत्याशित प्रकृति पर ज़ोर देते हैं। ## [00:10] सीमांत गणित में AI की वर्तमान भूमिका टेरेंस ताओ बताते हैं कि AI पहले से ही ऐसी "सीमांत गणित" कर रहा है जो मनुष्य नहीं कर सकते, हालाँकि यह अलग किस्म की सीमा है। वे इसकी तुलना इस बात से करते हैं कि कैसे कैलकुलेटर ने अतीत में गणितीय क्षमताओं का विस्तार किया था — मनुष्य की क्षमता से परे के काम, लेकिन विशिष्ट तरीके से। > *किसी अर्थ में वे पहले से ही सुपर-इंटेलिजेंट सीमांत गणित कर रहे हैं जो मनुष्य नहीं कर सकते, पर यह उस सीमा से अलग किस्म की है जिसके हम आदी हैं।* ## [00:52] AI स्वचालन का औज़ार है, विकल्प नहीं ताओ भविष्यवाणी करते हैं कि एक दशक के भीतर AI आज गणितज्ञों द्वारा किए जा रहे कई रूटीन कार्यों को संभाल लेगा, जिससे मनुष्य और अधिक जटिल व महत्त्वपूर्ण समस्याओं पर ध्यान केंद्रित कर सकेंगे। वे ऐतिहासिक बदलावों से तुलना करते हैं — कंप्यूटरों ने पहले मानव "कंप्यूटर" द्वारा किए जा रहे काम को स्वचालित किया, जीनोम अनुक्रमण भी स्वचालित हो गया, पर जेनेटिक्स जैसे क्षेत्र नए पैमानों पर विकसित होते रहे। > *एक दशक में आज गणितज्ञ जो बहुत कुछ करते हैं… वह AI कर सकेगा। पर हम पाएँगे कि असल में वही हमारे काम का सबसे महत्त्वपूर्ण हिस्सा नहीं था।* ## [02:46] गणित में मानव-AI सहयोग का भविष्य Dwarkesh Patel पूछते हैं कि क्या AI स्वायत्त रूप से मिलेनियम प्राइज़ समस्याएँ हल कर सकता है। टेरेंस ताओ मानते हैं कि "मानव + AI हाइब्रिड" गणित पर और भी लंबे समय तक हावी रहेगा, क्योंकि मौजूदा AI में बौद्धिक कार्यों के पूर्ण प्रतिस्थापन के लिए ज़रूरी सभी तत्व नहीं हैं — यह अधिकतर पूरक औज़ार की तरह काम करता है। > *मैं वास्तव में मानता हूँ कि यह मानव-प्लस-AI हाइब्रिड गणित पर बहुत अधिक समय तक हावी रहेगा।* ## [03:43] वैज्ञानिक खोज पर अप्रत्याशित प्रभाव ताओ स्वीकार करते हैं कि AI विज्ञान और नई खोजों की गति बढ़ाएगा, पर यह भी संभव है कि वह "संयोगवश होने वाली खोज (serendipity)" को नष्ट करके कुछ प्रकार की प्रगति को रोक दे। उनका निष्कर्ष है कि वैज्ञानिक खोज पर AI का भविष्य का प्रभाव अत्यंत अप्रत्याशित है। > *यह संभव है कि किसी तरह संयोगवश होने वाली खोज को नष्ट करके हम कुछ प्रकार की प्रगति को सचमुच अवरुद्ध कर दें।* ## इकाइयाँ - **टेरेंस ताओ (Terence Tao)** (व्यक्ति): अतिथि; हमारे समय के अग्रणी गणितज्ञ। - **Dwarkesh Patel** (व्यक्ति): पॉडकास्ट के होस्ट। - **AI** (अवधारणा): कृत्रिम बुद्धिमत्ता; गणित और वैज्ञानिक खोज में इसकी भूमिका पर चर्चा की गई। - **Mathematica / Wolfram Alpha** (सॉफ़्टवेयर): गणित में स्वचालन के उदाहरण के रूप में उल्लिखित गणनात्मक औज़ार। - **मिलेनियम प्राइज़ समस्याएँ (Millennium Prize Problems)** (अवधारणा): गणित की सात अनसुलझी समस्याएँ; प्रत्येक के समाधान पर एक मिलियन डॉलर का पुरस्कार है।

#ai#mathematics#terence-tao
सबएजेंट्स का प्रभावी उपयोग
4:44
EN/ZH
Watch with Captions
ClaudeClaude Code subagents२ महीने पहले

सबएजेंट्स का प्रभावी उपयोग

सबएजेंट्स तब शक्तिशाली होते हैं जब बीच का काम आपके मुख्य थ्रेड में नहीं होना चाहिए — लेकिन बिना सोचे-समझे सब कुछ सौंप देना चीज़ें और उलझा देता है। यह ट्यूटोरियल उपयोगी डेलीगेशन (रिसर्च, कोड रिव्यू, डोमेन-विशिष्ट सिस्टम प्रॉम्प्ट) और आम गलतियों (एक्सपर्ट पर्सोना, क्रमिक पाइपलाइन, टेस्ट रनर) के बीच की रेखा खींचता है — जो संदर्भ खा जाती हैं और ज़रूरी जानकारी खो देती हैं। ## [00:03] परिचय: सबएजेंट्स कब मदद करते हैं और कब नुकसान सीरीज़ में अब तक सबएजेंट्स बनाना और डिज़ाइन करना कवर हुआ। यह आखिरी एपिसोड डिप्लॉयमेंट के सवाल पर आता है: कौन से काम वाकई अलग एजेंट से बेहतर होते हैं, और किनमें नुकसान होता है? जवाब एक परीक्षण पर टिका है: क्या बीच का काम आपके मुख्य थ्रेड के लिए मायने रखता है? जब एक्सप्लोरेशन एग्जीक्यूशन से अलग हो, तो सबएजेंट्स फायदेमंद हैं। जब हर कदम पिछले कदम की खोज पर निर्भर हो, तो हैंडऑफ की कीमत में वही ब्योरे चले जाते हैं जिनकी आपको सबसे ज़्यादा ज़रूरत है। > *"सीधे शब्दों में, फर्क इस बात पर निर्भर करता है कि बीच का काम आपके मुख्य थ्रेड के लिए मायने रखता है या नहीं।"* ## [00:32] रिसर्च टास्क: एक्सप्लोरेशन को अलग रखना ऑथेंटिकेशन ट्रेसिंग एक ठोस उदाहरण है। आपके मुख्य थ्रेड को बस यह जानना है कि JWT वैलिडेशन कहाँ होता है — रास्ते में पढ़े गए दर्जनों फ़ाइलें नहीं चाहिए। एक रिसर्च सबएजेंट पूरी कोडबेस स्कैन कर सकता है, फ़ाइलों के पार फ़ंक्शन कॉल्स फॉलो कर सकता है, और एक सटीक जवाब लौटा सकता है: JWT वैलिडेशन middleware/auth.js में लाइन 42 पर होता है, route/api.js से कॉल किया गया। वह सारी एक्सप्लोरेशन सबएजेंट के संदर्भ में ही बंद रहती है। मुख्य थ्रेड को निष्कर्ष मिलता है और वह सर्च हिस्ट्री की भीड़ के बिना आगे बढ़ता है। > *"आपके मुख्य थ्रेड को मिलता है: JWT वैलिडेशन middleware/auth.js में लाइन 42 पर है, Express राउटर और route/api.js से कॉल किया गया — कुछ ऐसा।"* ## [01:15] कोड रिव्यू सबएजेंट्स: ताज़ी नज़र से फीडबैक Claude उस कोड की समीक्षा करते समय पक्षपाती हो जाता है जिसे उसने खुद लिखने में मदद की — वह हर निर्णय में मौजूद था और बाहर से क्या गलत लगता है, यह आसानी से नहीं देख पाता। एक रिव्यूअर सबएजेंट इसे पूरी तरह दरकिनार करता है: वह केवल diff और बदले गए फ़ाइलें देखता है, कोड के विकास का कोई इतिहास नहीं। यह साफ स्लेट एक दूसरा फायदा भी देती है। प्रोजेक्ट-विशिष्ट रिव्यू मानदंड — नामकरण परंपराएँ, सुरक्षा पैटर्न, आर्किटेक्चर नियम — सबएजेंट के सिस्टम प्रॉम्प्ट में एक बार कोड किए जा सकते हैं और लगातार लागू होते हैं, बिना मुख्य थ्रेड पर हर मोड़ पर याद रखने का बोझ डाले। > *"एक रिव्यूअर सबएजेंट बदलावों को अलग संदर्भ में देखता है। वह git diff चलाता है, बदले गए फ़ाइलें पढ़ता है और अपने विशेष रिव्यू मानदंड लागू करता है — कोड कैसे लिखा गया, इसके इतिहास के बिना।"* ## [01:59] कस्टम सिस्टम प्रॉम्प्ट: कॉपीराइटिंग और स्टाइलिंग Claude Code का डिफ़ॉल्ट प्रॉम्प्ट संक्षिप्त, तकनीकी आउटपुट के लिए बना है — लैंडिंग पेज या मार्केटिंग ईमेल के लिए यह बिल्कुल गलत है। एक कॉपीराइटिंग सबएजेंट को टोन, ऑडियंस और संरचना के बारे में पूरी तरह अलग निर्देश मिलते हैं, और वह ऐसा आउटपुट देता है जो मुख्य थ्रेड के डिफ़ॉल्ट से कभी नहीं निकलता। यही तर्क CSS पर भी लागू होता है। एक स्टाइलिंग सबएजेंट जो आपके डिज़ाइन सिस्टम फ़ाइलों का ज़िक्र करता है, एक भी लाइन लिखने से पहले अपने संदर्भ में कलर वेरिएबल्स, स्पेसिंग कन्वेंशन और कंपोनेंट पैटर्न अपने आप लोड कर लेता है — यह सुनिश्चित करता है कि हर स्टाइल निर्णय असली सिस्टम को दर्शाए, न अनुमानों को। > *"Claude Code का डिफ़ॉल्ट प्रॉम्प्ट संक्षिप्त, तकनीकी लेखन की ओर झुकता है, जो लैंडिंग पेज या ईमेल कैंपेन के लिए सही नहीं है — जब तक आप अपने ग्राहकों को बोर नहीं करना चाहते।"* ## [02:57] एंटी-पैटर्न: एक्सपर्ट दावे, पाइपलाइन, टेस्ट रनर तीन पैटर्न लगातार चीज़ें खराब करते हैं। पहला, पर्सोना प्रॉम्प्ट — "आप एक Python एक्सपर्ट हैं" या "आप एक Kubernetes विशेषज्ञ हैं" — कुछ नहीं जोड़ते, क्योंकि Claude के पास पहले से वह ज्ञान है। केवल एक्सपर्ट लेबल लगाने के लिए सबएजेंट शुरू करना अलगाव का ओवरहेड बर्बाद करता है, बिना कुछ ऐसा दिए जो मुख्य थ्रेड नहीं कर सकता। दूसरा, क्रमिक पाइपलाइन जब भी कदम सच में स्वतंत्र नहीं होते, तब टूट जाती हैं। तीन एजेंट का प्रवाह — बग रिप्रोड्यूस करो, डीबग करो, ठीक करो — साफ लगता है लेकिन व्यवहार में विफल होता है: डीबग एजेंट को रिप्रोड्यूस एजेंट का लाइव संदर्भ चाहिए, उसका संकुचित सारांश नहीं। तीसरा, टेस्ट रनर सबएजेंट जानकारी को सक्रिय रूप से छुपाते हैं। जब टेस्ट फेल हों, आपको कच्चा आउटपुट चाहिए। एक सबएजेंट जो केवल "टेस्ट फेल" लौटाता है, वह आपको अतिरिक्त डीबग स्क्रिप्ट लिखने पर मजबूर करता है उन ब्योरों के लिए जो सीधे आउटपुट में दिखते। > *"एक सबएजेंट जो 'टेस्ट फेल' लौटाता है, वह आपको ऐसे ब्योरे पाने के लिए अतिरिक्त डीबग स्क्रिप्ट बनाने पर मजबूर करता है जो सीधे आउटपुट में दिखाई देते।"* ## [04:10] सीरीज़ का सारांश और निर्णय की मुख्य कसौटी पूरी सीरीज़ में: सबएजेंट्स अलग थ्रेड हैं जो सारांश लौटाते हैं, /agents से बनाए जाते हैं, स्ट्रक्चर्ड आउटपुट और विशिष्ट विवरणों के साथ डिज़ाइन किए जाते हैं। रिसर्च, कोड रिव्यू और कस्टम सिस्टम प्रॉम्प्ट वाले कामों के लिए इनका उपयोग करें। एक्सपर्ट-पर्सोना दावों, परस्पर निर्भर मल्टी-स्टेप पाइपलाइन और टेस्ट एग्जीक्यूशन के लिए नहीं। पूरा ढाँचा एक सवाल पर सिमट जाता है: क्या बीच का काम मायने रखता है? अगर जवाब नहीं है, तो सौंप दें। > *"मुख्य सवाल: क्या बीच का काम मायने रखता है? अगर नहीं, तो सौंप दें।"* ## इकाइयाँ - **Anthropic Tutorial Narrator** (व्यक्ति): Claude Code सबएजेंट्स ट्यूटोरियल सीरीज़ के होस्ट, Anthropic - **Claude Code** (सॉफ्टवेयर): Anthropic का AI कोडिंग असिस्टेंट; वह वातावरण जिसमें सबएजेंट्स बनाए और ऑर्केस्ट्रेट किए जाते हैं - **Subagent** (अवधारणा): मुख्य संदर्भ से लॉन्च किया गया Claude का एक अलग थ्रेड, जो पूरे वर्किंग संदर्भ को उजागर करने के बजाय संकुचित सारांश लौटाता है - **JWT (JSON Web Token)** (अवधारणा): कोडबेस में ऑथेंटिकेशन लॉजिक ट्रेस करने वाले रिसर्च सबएजेंट के उदाहरण के रूप में उपयोग किया गया - **System prompt** (अवधारणा): प्रति-सबएजेंट निर्देश सेट जो Claude Code के डिफ़ॉल्ट प्रॉम्प्ट से अलग डोमेन-विशिष्ट व्यवहार सक्षम करता है - **Anthropic** (संगठन): Claude और Claude Code सबएजेंट्स ट्यूटोरियल सीरीज़ के डेवलपर

#claude-code#subagents#ai-agents
सबएजेंट बनाना
3:45
EN/ZH
Watch with Captions
ClaudeClaude Code subagents२ महीने पहले

सबएजेंट बनाना

Claude Code में बिल्ट-इन सबएजेंट पहले से मौजूद हैं, लेकिन कस्टम सबएजेंट आपको विशेष कार्यों के लिए विशेष व्यवहार सेट करने देते हैं। यह ट्यूटोरियल एक कोड-रिव्यू सबएजेंट शुरू से बनाता है — `/agents` कमांड, टूल चयन, मॉडल विकल्प और कॉन्फ़िग फ़ाइल के उन फ़ील्ड से गुज़रते हुए जो यह तय करते हैं कि Claude कब और कैसे डेलिगेट करता है। ## [00:03] कस्टम सबएजेंट क्या होते हैं Claude Code में बिल्ट-इन सबएजेंट शामिल हैं, लेकिन आप अपने खुद के सबएजेंट भी बना सकते हैं जो विशेष कार्यों में माहिर हों। एक कस्टम सबएजेंट YAML front matter वाली एक markdown फ़ाइल होती है: front matter Claude को बताता है कि उस एजेंट को कब रूट करना है और उसकी क्या क्षमताएं हैं, जबकि markdown बॉडी वह सिस्टम प्रॉम्प्ट है जिसके तहत सबएजेंट काम करता है। > *"Custom sub aents are markdown files with YAML front matter. These markdown files contain configuration that helps claude understand when to use the sub aent and provides directions to the sub aent itself."* ## [00:28] /agents से सबएजेंट बनाना `/agents` कमांड एजेंट मैनेजमेंट पैनल खोलता है। "नया एजेंट बनाएं" चुनने पर दो सवाल पूछे जाते हैं: स्कोप (मौजूदा प्रोजेक्ट या मशीन के सभी प्रोजेक्ट में शेयर) और जेनरेशन का तरीका। अनुशंसित तरीका यह है कि Claude को अपने आप एजेंट जेनरेट करने दें — नैरेटर सामान्य भाषा में एक ऐसे सबएजेंट का अनुरोध टाइप करता है जो कोड क्वालिटी और सुरक्षा समस्याओं की समीक्षा करे, और Claude बाकी काम संभाल लेता है। > *"Now, the easiest way to create a sub agent is with the / agents command. Next, you can create a sub agent manually, but we recommend using claw code to automatically generate it for you."* ## [00:56] टूल, मॉडल और रंग कॉन्फ़िगर करना Claude फ़ाइल लिखने से पहले, आप चुनते हैं कि सबएजेंट कौन से टूल एक्सेस कर सकता है। एक कोड-रिव्यू एजेंट को सख्ती से एडिट टूल की ज़रूरत नहीं है, लेकिन एक्सीक्यूशन इनेबल रखने से वह pending बदलावों को आसानी से देख सकता है। टूल के बाद, मॉडल चुनते हैं: haiku स्पीड के लिए, opus गहराई के लिए, sonnet बीच का रास्ता। आखिरी विकल्प है रंग — यह UI में दिखता है ताकि आप सबएजेंट को एक नज़र में पहचान सकें। > *"Now, given that our sub agent is only responsible for reviewing code, you might decide to disallow tools for editing, but I'll leave an execution to allow the sub agent to more easily identify pending changes."* ## [01:43] कॉन्फ़िग फ़ाइल को समझना जेनरेट की गई फ़ाइल सारांश विंडो में दिखाए गए पाथ पर प्रोजेक्ट में सेव होती है। चार फ़ील्ड सबसे अहम हैं। `name` यूनिक आइडेंटिफायर है — आप किसी मैसेज में `@agent-code-quality-reviewer` टाइप करके इसे रेफर कर सकते हैं। `description` वह है जिसे Claude पढ़कर तय करता है कि डेलिगेट करना है या नहीं; यह एक ही लाइन में होना चाहिए (escaped `\n` characters literal हैं)। description में "proactively" जोड़ने से Claude उस एजेंट का अधिक बार उपयोग करता है; उदाहरण बातचीत जोड़ने से रूटिंग अधिक सटीक होती है। `tools` जेनरेशन के दौरान दिए गए एक्सेस को दर्शाता है लेकिन फ़ाइल में सीधे एडिट किया जा सकता है। > *"If you want Claude to use the sub agent automatically more often, add in the word proactively to the description."* ## [02:41] सिस्टम प्रॉम्प्ट और Claude इसका उपयोग कैसे करता है `model` फ़ील्ड `haiku`, `sonnet`, `opus` या `inherit` स्वीकार करता है — `inherit` सबएजेंट को parent conversation के ही मॉडल पर चलाता है। front matter के नीचे सब कुछ सिस्टम प्रॉम्प्ट है: यह सबएजेंट को उसके काम में गाइड करता है और बताता है कि मुख्य एजेंट को परिणाम कैसे लौटाने हैं। > *"The system prompt will provide guidance to the sub agent, helping it understand how to complete its task and how it should return information back to the main agent."* ## [03:15] अपने सबएजेंट का परीक्षण करना कॉन्फ़िग सेव करने के बाद, कुछ कोड बदलाव करें और Claude से उनकी समीक्षा करने को कहें। अगर सबएजेंट उम्मीद के अनुसार ट्रिगर नहीं होता, तो सबसे पहले `description` फ़ील्ड को एडजस्ट करें — अधिक विशिष्ट उदाहरण Claude की डेलिगेट करने की समझ को तेज़ करते हैं। > *"If the sub agent isn't being used when you expect, check your description. Adding more specific examples helps Claude understand when to delegate."* ## इकाइयां - **Anthropic Tutorial Narrator** (व्यक्ति): इस एपिसोड के एकमात्र होस्ट; Anthropic के आधिकारिक YouTube चैनल पर Claude Code subagents ट्यूटोरियल श्रृंखला का वर्णन करते हैं - **Claude Code** (सॉफ़्टवेयर): Anthropic का AI कोडिंग असिस्टेंट; बिल्ट-इन और उपयोगकर्ता-निर्मित कस्टम सबएजेंट दोनों को सपोर्ट करता है - **कस्टम सबएजेंट** (अवधारणा): YAML front matter वाली एक markdown फ़ाइल जो Claude Code को विशेष कार्यों को एक विशेषज्ञ एजेंट इंस्टेंस को डेलिगेट करने के लिए कॉन्फ़िगर करती है - **/agents command** (अवधारणा): सबएजेंट बनाने और प्रबंधित करने के लिए Claude Code UI एंट्री पॉइंट; प्रोजेक्ट-स्कोप या ग्लोबल स्कोप प्रदान करता है - **सिस्टम प्रॉम्प्ट** (अवधारणा): सबएजेंट कॉन्फ़िग फ़ाइल का markdown बॉडी; रनटाइम पर सबएजेंट को टास्क गाइडेंस और आउटपुट फ़ॉर्मेट निर्देश प्रदान करता है - **Anthropic** (संगठन): Claude और Claude Code प्लेटफ़ॉर्म के निर्माता

#claude-code#subagents#ai-agents
प्रभावी सबएजेंट डिज़ाइन करना
3:42
EN/ZH
Watch with Captions
ClaudeClaude Code subagents२ महीने पहले

प्रभावी सबएजेंट डिज़ाइन करना

Anthropic की Claude Code सीरीज़ का यह ट्यूटोरियल चार ठोस पैटर्न बताता है जो भरोसेमंद सबएजेंट को उन सबएजेंट से अलग करते हैं जो भटकते हैं, रुक जाते हैं या गलत फ़ाइलें छू देते हैं। नैरेटर कोड-रिव्यूअर और वेब-सर्च सबएजेंट को उदाहरण बनाकर हर पैटर्न समझाते हैं — कौन सी सेटिंग बदलनी है और क्यों, यह सब दिखाते हुए। ## [00:03] नाम और विवरण से सबएजेंट के व्यवहार को नियंत्रित करना मुख्य एजेंट को भेजे गए हर मैसेज में सिस्टम प्रॉम्प्ट के ज़रिए प्रत्येक पंजीकृत सबएजेंट का नाम और विवरण शामिल होता है। यानी विवरण दोहरा काम करता है: ऑर्केस्ट्रेटर को बताता है कि सबएजेंट *कब* शुरू करना है और इनपुट प्रॉम्प्ट लिखने का टेम्पलेट भी देता है। ट्यूटोरियल एक कोड-रिव्यूअर सबएजेंट से दिखाता है। मूल कॉन्फ़िग में ऑर्केस्ट्रेटर एक सामान्य प्रॉम्प्ट लिखता है जिसमें सबएजेंट खुद `git diff` चलाता है। विवरण में "आपको एजेंट को बिल्कुल वे फ़ाइलें बतानी होंगी जिन्हें आप रिव्यू करवाना चाहते हैं" जोड़ने पर फ़ाइल चयन की ज़िम्मेदारी ऑर्केस्ट्रेटर पर आ जाती है — अगली बार इनपुट प्रॉम्प्ट काफी अधिक विशिष्ट बनता है। वेब-सर्च सबएजेंट के लिए भी यही काम करता है: विवरण में "ऐसे स्रोत लौटाएं जिन्हें उद्धृत किया जा सके" जोड़ने पर मुख्य एजेंट काम सौंपते समय यह निर्देश अपने आप शामिल कर लेता है। > *"यदि आप यह बेहतर नियंत्रित करना चाहते हैं कि मुख्य एजेंट सबएजेंट को स्वचालित रूप से कब लॉन्च करे, तो आपको नाम और विवरण में बदलाव करना चाहिए।"* ## [01:41] आउटपुट फ़ॉर्मेट परिभाषित करना नैरेटर आउटपुट फ़ॉर्मेट को सबसे अधिक प्रभाव डालने वाला सुधार मानते हैं। बिना किसी फ़ॉर्मेट के सबएजेंट को यह स्पष्ट संकेत नहीं मिलता कि काम कब खत्म हुआ — वह चलता रहता है, संदर्भ जमा करता रहता है और टोकन खर्च करता रहता है। संरचित आउटपुट फ़ॉर्मेट एक स्वाभाविक रुकने की जगह बनाता है। जब ज़रूरी फ़ील्ड भर जाती हैं तो सबएजेंट जान जाता है कि काम हो गया। व्यावहारिक रूप से इसका मतलब है सबएजेंट के सिस्टम प्रॉम्प्ट में सीधे एक स्पष्ट स्कीमा जोड़ना — सारांश ब्लॉक, निष्कर्षों की सूची, स्टेटस फ़ील्ड। > *"परिभाषित आउटपुट फ़ॉर्मेट के बिना सबएजेंट यह तय करने में संघर्ष करते हैं कि पर्याप्त शोध कब हो गया और वे उन सबएजेंट की तुलना में बहुत अधिक समय तक चलते हैं जिन्हें आउटपुट फ़ॉर्मेट दिया गया हो।"* ## [02:04] सारांश में बाधाओं की रिपोर्ट करना जब कोई सबएजेंट किसी समस्या को हल करता है — कोई डिपेंडेंसी कॉन्फ्लिक्ट, कोई ऐसा कमांड जिसे अप्रत्याशित फ्लैग चाहिए, कोई एनवायरनमेंट की खासियत — तो मुख्य एजेंट को वह जानकारी चाहिए, नहीं तो वह अगले चरण में वही दीवार से टकराएगा। समाधान यह है कि आउटपुट फ़ॉर्मेट में ही बाधाओं की रिपोर्ट ज़रूरी कर दी जाए। नैरेटर उन श्रेणियों की सूची देते हैं जो हमेशा सामने आनी चाहिए: मिली बाधाएं, सेटअप से जुड़ी समस्याएं, खोजे गए वर्कअराउंड, ऐसे कमांड जिन्हें विशेष फ्लैग या कॉन्फ़िगरेशन की ज़रूरत पड़ी, और ऐसे इम्पोर्ट या डिपेंडेंसी जिन्होंने समस्या पैदा की। इन्हें अनिवार्य आउटपुट स्कीमा में शामिल करने से मुख्य एजेंट सबएजेंट की मेहनत से मिली जानकारी सीधे पा लेता है, बजाय उसे फिर से खोजने के। > *"नहीं तो मुख्य एजेंट को वही समाधान फिर से खोजने पड़ते हैं — मिली बाधाएं, कोई भी सेटअप समस्याएं, खोजे गए वर्कअराउंड या एनवायरनमेंट की खासियतें, विशेष फ्लैग या कॉन्फ़िगरेशन वाले कमांड, डिपेंडेंसी या इम्पोर्ट जिन्होंने समस्या पैदा की।"* ## [02:42] भूमिका के अनुसार टूल एक्सेस सीमित करना टूल एक्सेस सिर्फ सुरक्षा नियंत्रण नहीं है — यह स्पष्टता का साधन भी है। केवल `glob`, `grep` और `read` वाला रीड-ओनली सबएजेंट गलती से फ़ाइलें बदल नहीं सकता, जो कॉन्फ़िग पढ़ने वाले किसी भी व्यक्ति को उसकी भूमिका स्पष्ट कर देता है। नैरेटर तीन एक्सेस स्तरों को तीन सबएजेंट भूमिकाओं से जोड़ते हैं: रिसर्च सबएजेंट को रीड-ओनली एक्सेस मिलता है क्योंकि कोडबेस एक्सप्लोर करने में लिखना नहीं पड़ता; रिव्यूअर को `git diff` के लिए `bash` मिलता है लेकिन फ़ाइल-एडिटिंग टूल नहीं; केवल वे सबएजेंट जिन्हें कोड बदलने का काम है — जैसे CSS अपडेट लागू करने वाला — `edit` और `write` पाते हैं। कई सबएजेंट होने पर टूल सूची मशीन-पठनीय सारांश बन जाती है कि हर सबएजेंट क्या करने वाला है। > *"edit और write केवल उन सबएजेंट को दें जिन्हें वास्तव में आपका कोड बदलना है, जैसे CSS अपडेट लागू करने वाला स्टाइलिंग एजेंट।"* ## [03:27] प्रभावी सबएजेंट के चार पैटर्न ट्यूटोरियल चारों पैटर्न के एक-एक वाक्य के सारांश के साथ समाप्त होता है: संरचित आउटपुट, बाधा रिपोर्टिंग, विशिष्ट विवरण और प्रतिबंधित टूल एक्सेस। हर पैटर्न दूसरों को मज़बूत करता है — सटीक विवरण इनपुट प्रॉम्प्ट में अस्पष्टता कम करते हैं, आउटपुट फ़ॉर्मेट रुकने की जगह बनाते हैं, बाधा रिपोर्टिंग एजेंट सीमाओं के पार संदर्भ सुरक्षित रखती है, और न्यूनतम टूल एक्सेस साइड इफेक्ट रोकता है जो किसी भी बची अस्पष्टता को बढ़ा सकते थे। > *"तो प्रभावी सबएजेंट संरचित आउटपुट उपयोग करते हैं, बाधाओं की रिपोर्ट करते हैं, विशिष्ट विवरण रखते हैं और टूल एक्सेस सीमित करते हैं।"* ## इकाइयाँ - **Anthropic Tutorial Narrator** (व्यक्ति): Claude Code सबएजेंट ट्यूटोरियल सीरीज़ के प्रस्तुतकर्ता, Anthropic की ओर से - **Claude Code** (सॉफ़्टवेयर): Anthropic का एजेंटिक कोडिंग टूल जो बहु-चरण इंजीनियरिंग कार्यों के लिए सबएजेंट को ऑर्केस्ट्रेट करता है - **Subagent** (अवधारणा): एक ऑर्केस्ट्रेटर एजेंट द्वारा शुरू किया गया Claude का विशेष इंस्टेंस, जिसका अपना सिस्टम प्रॉम्प्ट, टूल एक्सेस और इनपुट प्रॉम्प्ट होता है - **Output format** (अवधारणा): सबएजेंट के सिस्टम प्रॉम्प्ट में परिभाषित अनिवार्य स्कीमा जो रुकने की शर्त बनाती है और मुख्य थ्रेड को लौटाई जाने वाली जानकारी को संरचित करती है - **Obstacle reporting** (अवधारणा): सबएजेंट से वर्कअराउंड, डिपेंडेंसी समस्याएं और एनवायरनमेंट की खासियतें उनके आउटपुट में सामने लाने का पैटर्न, ताकि ऑर्केस्ट्रेटर को उन्हें फिर से न खोजना पड़े - **Tool access scoping** (अवधारणा): प्रत्येक सबएजेंट को केवल उन टूल तक सीमित करना जो उसकी भूमिका के लिए ज़रूरी हैं — रिसर्च के लिए रीड-ओनली, रिव्यू के लिए bash, केवल फ़ाइल बदलने वाले एजेंट के लिए edit/write - **Anthropic** (संगठन): Claude और Claude Code एजेंटिक कोडिंग प्लेटफ़ॉर्म की निर्माता

#claude-code#subagents#ai-agents
सब-एजेंट क्या होते हैं?
2:48
EN/ZH
Watch with Captions
ClaudeClaude Code subagents२ महीने पहले

सब-एजेंट क्या होते हैं?

सब-एजेंट विशेष सहायक होते हैं जिन्हें Claude Code काम सौंप सकता है — हर सब-एजेंट अपने अलग context window में चलता है, स्वतंत्र रूप से काम पूरा करता है, और फिर एक संक्षिप्त सारांश वापस भेजता है जबकि सारी अंतरिम प्रक्रिया हटा दी जाती है। Anthropic का यह दो-मिनट का tutorial बताता है कि यह अलगाव main context window को साफ रखने के लिए क्यों ज़रूरी है, एक code-exploration का उदाहरण दिखाता है जो इस tradeoff को स्पष्ट करता है, और Claude Code के साथ आने वाले built-in सब-एजेंटों की सूची देता है। ## [00:03] सब-एजेंट क्या होते हैं सब-एजेंट अपने अलग conversation context window में चलता है, जिसे आपके दिए गए custom system prompt से शुरू किया जाता है। Parent agent (main thread में Claude Code) सब-एजेंट को आपकी ज़रूरत के हिसाब से एक task description देता है। सब-एजेंट उसे स्वतंत्र रूप से पूरा करता है, फिर main thread को एक सारांश लौटाता है — और सारा बीच का काम अलग ही रहता है। > *"Sub-agents are specialized assistants that Claude can delegate tasks to."* एक अहम बात: जैसे ही सब-एजेंट काम खत्म करता है, उसका पूरा conversation thread हटा दिया जाता है। सिर्फ वापस भेजा गया सारांश main conversation में आता है। ## [00:24] Context window को संभालना Main thread में Claude का हर tool call — file reads, searches, function traces — main context window में जमा होता रहता है। लंबे session में यह जल्दी भर जाता है। सब-एजेंट इसीलिए होते हैं — discrete research या action tasks को offload करने के लिए, ताकि उनका बोझ main window पर न पड़े। > *"Each sub-agent runs in its own conversation contacts window with a custom system prompt that you define."* Tradeoff साफ है: main window को साफ context मिलता है, लेकिन सब-एजेंट ने निष्कर्ष तक पहुंचने में क्या किया — वह दिखाई नहीं देता। आपको जवाब मिलता है, reasoning trace नहीं। ## [01:13] एक ठोस उदाहरण: payment system मान लीजिए आप Claude Code से पता करना चाहते हैं कि किसी अनजान codebase में refunds कौन सी service संभालती है। बिना सब-एजेंट के Claude 15 files पढ़ सकता है, कई searches चला सकता है, और कई function calls trace कर सकता है — और यह सब main context window भर देता है, जबकि आपको सिर्फ एक जवाब चाहिए था। > *"With a sub-agent, you get the answer without the journey."* सब-एजेंट codebase explore करता है, जवाब ढूंढता है, और एक focused सारांश देता है — main context साफ रहता है। खोई हुई चीज़ है visibility: यह पता नहीं चलता कि उसने कौन सी files पढ़ीं या किन traces से जवाब निकाला। ## [02:00] Claude Code के built-in सब-एजेंट Claude Code तीन built-in सब-एजेंटों के साथ आता है जो तुरंत इस्तेमाल के लिए तैयार हैं: - **General-purpose सब-एजेंट** — multi-step tasks के लिए जिनमें exploration और action दोनों की ज़रूरत हो। - **Explore सब-एजेंट** — full task loop के बिना codebases को तेज़ी से खोजने के लिए। - **Plan सब-एजेंट** — plan mode के दौरान चलता है, codebase research और analysis करके plan पेश करता है। > *"And you can also create your own sub-agents with custom system prompts and tool access."* इन तीनों के अलावा, आप अपने workflows के अनुसार custom system prompts और tool access lists के साथ खुद के सब-एजेंट बना सकते हैं। ## [02:30] सब-एजेंट कब इस्तेमाल करें सब-एजेंट तब फायदेमंद होते हैं जब कोई अलग, self-contained सवाल या काम हो जो otherwise main window में बहुत सारा intermediate context डाल देता। > *"Sub-agents like Claude Code break work into focused pieces, keep your main context window clean, and bring back just what you need, whether you're using the built-in ones or creating your own."* लंबे Claude Code sessions में जहाँ context window pressure बढ़ती जाती है, वहाँ सब-एजेंट सबसे ज़्यादा काम के होते हैं — किसी sub-task को सब-एजेंट को सौंपकर session की उम्र सीधे बढ़ाई जा सकती है। ## एंटिटीज़ - **Anthropic Tutorial Narrator** (व्यक्ति): Anthropic द्वारा निर्मित "Claude Code subagents" tutorial series के narrator - **Claude Code** (सॉफ्टवेयर): Anthropic का agentic coding assistant; वह host environment जिसमें सब-एजेंट काम करते हैं - **Claude** (सॉफ्टवेयर): Claude Code और उसके सब-एजेंटों को चलाने वाला underlying AI model - **Sub-agent** (अवधारणा): एक विशेष सहायक जिसे Claude Code काम सौंपता है; अपने अलग context window में custom system prompt के साथ चलता है - **Context window** (अवधारणा): वह finite token buffer जिसमें conversation history, tool calls और results होते हैं; सब-एजेंट इसे अंतरिम काम से भरने से बचाते हैं - **General-purpose sub-agent** (सॉफ्टवेयर): Claude Code का built-in सब-एजेंट, multi-step exploration और action tasks के लिए - **Explore sub-agent** (सॉफ्टवेयर): Claude Code का built-in सब-एजेंट, codebase तेज़ी से खोजने के लिए - **Plan sub-agent** (सॉफ्टवेयर): Claude Code का built-in सब-एजेंट जो plan mode में codebase research करता है - **Anthropic** (संस्था): Claude और Claude Code के निर्माता; इस tutorial series के producers

#claude-code#subagents#context-window
टेरेंस ताओ – दुनिया के शीर्ष गणितज्ञ AI का उपयोग कैसे करते हैं
1:23:44
EN/ZH
Watch with Captions
Dwarkesh Patel२ महीने पहले

टेरेंस ताओ – दुनिया के शीर्ष गणितज्ञ AI का उपयोग कैसे करते हैं

ताओ और Dwarkesh, केप्लर की ग्रहीय गति की खोज को एक लेंस की तरह उपयोग करते हैं यह देखने के लिए कि AI विज्ञान में वास्तव में क्या बदल रहा है। ताओ का तर्क है कि परिकल्पना उत्पन्न करना अब लगभग मुफ्त हो गया है, इसलिए बाधा मूल्यांकन, सहकर्मी समीक्षा और समय की कसौटी पर आ गई है। आज AI चौड़ाई में जीतता है — हर समस्या पर हर मानक तकनीक आजमाना — जबकि मनुष्य गहराई में जीतते हैं — आंशिक प्रगति पर संचयी निर्माण। इसीलिए हाइब्रिड संरचनाएं कम से कम एक और दशक तक गणित पर हावी रहेंगी। ## [00:00] केप्लर एक हाई-टेम्परेचर LLM था ताओ बताते हैं कि केप्लर तीन नियमों तक कैसे पहुंचे। केप्लर ने एक गलत-किंतु-सुंदर सिद्धांत से शुरुआत की — ग्रहों की कक्षाओं के बीच प्लेटोनिक ठोस — और इसे तभी छोड़ा जब Tycho Brahe के चुराए गए नग्न-नेत्र अवलोकनों को वर्षों तक खंगाला। दीर्घवृत्त, समान-क्षेत्र और घन-वर्ग नियम दशकों के डेटा विश्लेषण से निकले, और Newton की व्याख्या एक सदी बाद आई। Dwarkesh का दृष्टिकोण: केप्लर एक हाई-टेम्परेचर LLM जैसा लगता है जो एक सत्यापन योग्य डेटासेट के विरुद्ध यादृच्छिक संबंधों से गुजरता है। ताओ तंत्र से सहमत हैं, लेकिन बाधा पर असहमत हैं। विचार उत्पन्न करना पहले भी सस्ता था — केप्लर के पास सिद्धांतों की कमी नहीं थी। उन्हें जो चाहिए था वह था Brahe का परिमाण के क्रम में बेहतर डेटा और उन विचारों को छोड़ने का धैर्य जिन्हें डेटा ने नकार दिया। > *लेकिन जैसा आप कहते हैं, इसके साथ समान मात्रा में सत्यापन होना चाहिए, अन्यथा यह स्लॉप बन जाता है।* ## [11:44] AI स्लॉप के ढेर में नई एकीकृत अवधारणा को हम कैसे पहचानेंगे? ताओ: यदि AI ने विचार उत्पादन की लागत शून्य के करीब कर दी है, तो सहकर्मी समीक्षा और समय की कसौटी नई बाधा बन गई हैं। पत्रिकाएं पहले से ही AI-जनित प्रस्तुतियों में डूब रही हैं। किसी विचार की स्थिति इस पर निर्भर करती है कि बाद का विज्ञान उसके साथ क्या करता है — Copernicus, Kepler के पूरा होने तक Ptolemy से कम सटीक था — इसलिए मूल्यांकन को क्षण के भीतर से स्वचालित करना कठिन है। Dwarkesh पूछते हैं कि विज्ञान लाखों औसत दर्जे के शोधपत्रों में दबी Bell-Labs जैसी एकीकृत अवधारणा — Shannon का बिट, ट्रांसफॉर्मर — को कैसे पहचानेगा। ताओ का उत्तर उस भाग की ओर इशारा करता है जो मानव रह सकता है: वैज्ञानिक केवल सिद्धांत नहीं बनाते, वे ऐसी कहानियां सुनाते हैं जो अन्य वैज्ञानिकों को वर्षों के अनुवर्ती कार्य में निवेश करने के लिए मना लेती हैं। Darwin के गद्य ने वह काम किया जो Newton के लैटिन समीकरण नहीं कर सके। > *AI ने विचार उत्पादन की लागत लगभग शून्य तक गिरा दी है, उसी तरह जैसे इंटरनेट ने संचार की लागत लगभग शून्य तक गिरा दी।* ## [26:10] निगमनात्मक ओवरहैंग ताओ, मौजूदा डेटा में अनदेखे संकेत पर। खगोल विज्ञान सदियों से न्यूनतम डेटा से अधिकतम जानकारी निकालने वाला अनुशासन रहा है — यही कारण है कि क्वांट हेज फंड खगोल विज्ञान के PhD को प्राथमिकता से नियुक्त करते हैं। एक पसंदीदा उदाहरण: शोधकर्ताओं ने यह मापा कि वैज्ञानिक वास्तव में कितनी बार वे शोधपत्र पढ़ते हैं जिन्हें वे उद्धृत करते हैं — उद्धरण श्रृंखलाओं में कौन सी गलत वर्तनियां फैलती हैं, यह देखकर। वे AI की प्रगति के लिए भी विज्ञान-समाजशास्त्र का वही उपचार सुझाते हैं — उद्धरण पैटर्न, सम्मेलन उल्लेखों और अन्य पदचिह्नों की खनन करके यह पता लगाना कि किसी परिणाम ने वास्तव में प्रगति का प्रतिनिधित्व किया या नहीं, बजाय इसके कि समय की कसौटी धीरे-धीरे यह काम करे। > *एक निष्कर्ष यह था कि कई क्षेत्रों में निगमनात्मक ओवरहैंग उससे कहीं बड़ा हो सकता है जितना लोग महसूस करते हैं।* ## [30:31] AI खोजों की रिपोर्टिंग में चयन पूर्वाग्रह AI ने लगभग 1,100 Erdős समस्याओं में से करीब 50 हल कीं, फिर ठहर गया। ताओ चयन प्रभाव समझाते हैं: उन 50 में लगभग शून्य साहित्य था — एक अस्पष्ट तकनीक और एक ज्ञात परिणाम काफी था, और AI उपकरण "हर मानक संयोजन आजमाने" में उत्कृष्ट हैं। जब किसी समस्या का 80% काम मौजूदा विधियों से हो जाता है, AI उसे साफ कर देता है। जब एक सचमुच नई तकनीक चाहिए, उपकरण रुक जाते हैं, और व्यवस्थित खोज में प्रति-समस्या सफलता दर 1-2% है। ताओ का रूपक: AI उपकरण ऐसे कूदने वाले रोबोट हैं जो अंधेरे में एक पहाड़ी श्रृंखला में उछल रहे हैं। वे उन छोटी दीवारों को पार कर सकते हैं जिन तक मनुष्य नहीं पहुंच सकते, लेकिन वे एक जगह पकड़कर, वहां टिककर और आंशिक प्रगति से आगे नहीं खींच सकते। आशावादी पाठ — एक बार AI किसी स्तर तक पहुंचे, तो दस लाख समस्याओं पर दस लाख समानांतर प्रतियां चलाई जा सकती हैं — भी वह संरचनात्मक कारण है जिसके लिए विज्ञान को ऐसे नए प्रतिमानों की जरूरत है जो वास्तव में चौड़ाई का उपयोग करें। > *वे चौड़ाई में उत्कृष्ट हैं, और मनुष्य, कम से कम विशेषज्ञ मनुष्य, गहराई में उत्कृष्ट हैं।* ## [46:43] AI ने शोधपत्र समृद्ध और व्यापक बनाए, पर गहरे नहीं ताओ अपने काम के तरीके पर: शोधपत्रों में अब अधिक कोड, अधिक आकृतियां, गहरे साहित्य सर्वेक्षण हैं, क्योंकि सहायक कार्य लगभग 5x सस्ते हो गए। वास्तविक मूल — किसी समस्या का सबसे कठिन भाग हल करना — अभी भी कागज और कलम पर होता है। वे खुद को "2x अधिक उत्पादक" कहने से हिचकिचाएंगे क्योंकि मापदंड एकआयामी नहीं है; जो बदला वह है शोधपत्र का प्रकार, न कि जिस प्रश्न से वे शुरू हुए उसके उत्तर की दर। चतुराई बनाम बुद्धिमत्ता का अंतर वही स्थान पर उतरता है। जब दो मनुष्य किसी गणित की समस्या पर सहयोग करते हैं, तो प्रत्येक विफल प्रोटोटाइप अगले के लिए आधार बनता है। वर्तमान AI के साथ, एक नया सत्र पिछले सत्र की सीख भूल जाता है। संचयी ऊपर-खिंचाव का कदम गायब है — केवल क्रूर परीक्षण-और-त्रुटि और, अंततः, अगले प्रशिक्षण में अवशोषण। > *इसने शोधपत्रों को समृद्ध और व्यापक बनाया है, लेकिन जरूरी नहीं कि गहरा।* ## [53:00] यदि AI कोई समस्या हल कर दे, तो क्या मनुष्य उससे समझ हासिल कर सकते हैं? क्या AI Lean में Riemann hypothesis साबित कर सकता है और हमें कुछ भी न बताए? ताओ चिंतित नहीं हैं। Lean में यह गुण है कि किसी भी प्रमाण को परमाण्विक रूप से विघटित किया जा सकता है — प्रत्येक लेम्मा को अलग से देखा, हटाया और परीक्षण किया जा सकता है। इसलिए 3,000 लाइनों का उत्पन्न प्रमाण भी कच्चा माल बन जाता है: अन्य AI सुंदरता के लिए पुनर्गठन कर सकते हैं, अन्य मनुष्य वैचारिक सामग्री निकाल सकते हैं, और कलाकृति उपयोगी रहती है भले ही मूल व्युत्पत्ति अपारदर्शी थी। वे ऐसे गणितज्ञों के पूरे पेशे की भविष्यवाणी करते हैं जिनका काम होगा विशाल Lean-जनित प्रमाणों को अलग करना और उनके भीतर के विचार खोजना — एक प्रकार की प्रमाण पुरातत्व, जिसमें मानव निर्णय और AI उच्छेदन उपकरण दोनों हों। > *आपको इन उपकरणों के साथ सहयोग करने वाले मनुष्यों की परस्पर क्रिया से बहुत अधिक लाभ मिलेगा।* ## [59:20] हमें एक अर्ध-औपचारिक भाषा चाहिए जैसी वैज्ञानिक आपस में बात करते हैं Dwarkesh पूछते हैं कि गणितीय रणनीतियों के लिए एक अर्ध-औपचारिक भाषा — गणितीय प्रमाणों के विपरीत — कैसी दिखेगी। ताओ प्रश्न को Gauss के अभाज्य संख्या प्रमेय से गुजारते हैं — गणित में पहली बड़ी सांख्यिकीय अटकलें, किसी प्रमाण से पहले कच्चे डेटा से निकाली गई — और twin prime conjecture से, जिस पर गणितज्ञ इसलिए विश्वास करते हैं क्योंकि अभाज्य संख्याओं का यादृच्छिक मॉडल इसकी भविष्यवाणी करता है। गणित में कठोर प्रमाण और कठोर अनुमान दोनों हैं; केवल प्रमाण पक्ष को Lean जैसी प्रणाली में औपचारिक बनाया गया है। अनुमान पक्ष औपचारिक क्यों नहीं हुआ: कोई भी RL-जांच योग्य ग्रेडर शोषण का लक्ष्य बन जाता है, और "यह तर्क प्रेरक है" के व्यक्तिपरक भाग के लिए अभी तक कोई हैक-प्रतिरोधी ढांचा नहीं है। ताओ चाहेंगे कि अनुमान-निर्माण और रणनीति-चयन को बड़े पैमाने पर बेंचमार्क करने का तरीका हो, संभवतः खिलौना गणितीय ब्रह्मांडों में छोटे AI चलाकर देखें कि कौन सी रणनीतियां उभरती हैं। > *विज्ञान का कुछ व्यक्तिपरक पहलू है जिसे हम ऐसे तरीके से कैद करना नहीं जानते कि AI को उसमें किसी उपयोगी तरीके से शामिल कर सकें।* ## [69:48] Terry अपना समय कैसे बिताते हैं ताओ नए उप-क्षेत्रों को कैसे आत्मसात करते हैं। वे खुद को Berlin के अर्थ में एक लोमड़ी के रूप में रखते हैं — थोड़ा-थोड़ा सब कुछ जानते हैं, कभी-कभी जरूरत पड़ने पर हेजहॉग बन जाते हैं। प्रेरणा एक पूर्णतावादी जुनून है: यदि कोई अन्य गणितज्ञ किसी तकनीक से कोई परिणाम साबित कर सके जो उन्हें नहीं पता, तो वे उनकी चाल खोजने निकल पड़ते हैं। (उन्हें वीडियो गेम छोड़ना पड़ा उसी कारण से।) अन्य गणितज्ञों के साथ सहयोग मुख्य माध्यम है, और अपने ब्लॉग पर लिखना वह स्मृति सहायक है जो उन्होंने उन तर्कों को बार-बार छह महीने बाद भूलने के बाद विकसित किया। अपने कैलेंडर पर, ताओ जानबूझकर संयोग के लिए जगह छोड़ते हैं। वे अपने समय को इतना कसकर अनुकूलित नहीं करना चाहते कि अपने आराम क्षेत्र के बाहर किसी बैठक में कभी न बैठें। Institute for Advanced Study में बिताए वर्ष ने जाल की पुष्टि की — दो सप्ताह का शुद्ध शोध बढ़िया था, फिर प्रेरणा समाप्त हो गई। अगली लाइब्रेरी शेल्फ पर आकस्मिक खोज, सहज गलियारे की बात, और वह बैठक जिसमें वे अनिच्छा से गए — वे देखने से अधिक काम कर रहे थे। > *वे संयोगी बातचीत इष्टतम नहीं लग सकतीं, लेकिन वे वास्तव में बहुत महत्वपूर्ण हैं।* ## [77:05] मानव-AI हाइब्रिड गणित में बहुत लंबे समय तक वर्चस्व बनाए रखेंगे AI गणित कब करेगा? ताओ पुनर्गठन करते हैं — AI पहले से ही ऐसा गणित करता है जो मनुष्य नहीं कर सकते, जब से कैलकुलेटर आए, बस एक अलग सीमा पर। लगभग एक दशक में वे उम्मीद करते हैं कि स्नातक छात्र अभी जो करते हैं — मानक तकनीक लागू करना, साहित्य खंगालना — उसका अधिकांश AI पर जाएगा, लेकिन क्षेत्र एक स्तर ऊपर बढ़ेगा जैसा तब हुआ जब कंप्यूटर बीजगणित प्रणालियों ने प्रतीकात्मक एकीकरण अवशोषित किया। आनुवंशिकी समाप्त नहीं हुई जब अनुक्रमण सस्ता हुआ; यह पारिस्थितिक तंत्र तक बढ़ी। गणित भी ऐसा ही करेगा। छात्रों को अभी गणित में प्रवेश करने की सलाह: परिवर्तन मानकर चलें, लेकिन पुराने तरीके से अपनी साख हासिल करें — अभी के लिए पारंपरिक मार्ग से गणित करने का कोई विकल्प नहीं है। साथ ही, इतने अनुकूलनीय रहें कि जैसे ही नए शोध के तरीके सामने आएं — जिनमें वे भी शामिल हैं जो अभी मौजूद नहीं — उन्हें अपना सकें। असाधारण तथ्य यह है कि AI उपकरणों और Lean से एक हाई स्कूल का छात्र आज वास्तविक गणित शोध में योगदान दे सकता है, जो पांच साल पहले संभव नहीं था। > *मुझे लगता है मैं वास्तव में मानता हूं कि हाइब्रिड मानव और AI गणित में बहुत लंबे समय तक वर्चस्व बनाए रखेंगे।* ## संस्थाएं - **Terence Tao** (व्यक्ति): Fields पदक विजेता (2006), UCLA के गणितज्ञ, गणित शोध में AI की भूमिका पर नियमित लेखन। - **Dwarkesh Patel** (व्यक्ति): Dwarkesh Podcast के होस्ट; AI, विज्ञान और प्रौद्योगिकी पर लंबे प्रारूप के साक्षात्कार। - **Johannes Kepler** (व्यक्ति): खगोलशास्त्री (1571-1630) जिन्होंने Tycho Brahe के अवलोकनों से ग्रहीय गति के तीन नियम निकाले। - **Tycho Brahe** (व्यक्ति): डेनिश नग्न-नेत्र खगोलशास्त्री जिनके दशकों के ग्रहीय अवलोकन वह डेटासेट था जिसकी केप्लर को जरूरत थी। - **Lean** (सॉफ्टवेयर): प्रमाण सहायक जिसमें गणितीय प्रमाणों को औपचारिक किया जाता है और परमाण्विक रूप से जांचा, विघटित और उच्छेदित किया जा सकता है। - **Erdős problems** (अवधारणा): Paul Erdős द्वारा प्रस्तावित लगभग 1,100 खुली समस्याएं; AI ने ~50 हल कीं, लगभग सभी में नगण्य पूर्व साहित्य था। - **निगमनात्मक ओवरहैंग** (अवधारणा): यह विचार कि मौजूदा डेटा में अभी तक निकाले गए से कहीं अधिक व्युत्पन्न ज्ञान है, खगोल विज्ञान इसका आदर्श उदाहरण। - **Riemann hypothesis** (अवधारणा): अभाज्य संख्या वितरण पर अनसुलझा अनुमान; यह परीक्षण मामला है कि AI प्रमाण मानव गणितीय समझ को आगे बढ़ाएगा या नहीं।

#ai-for-math#terence-tao#kepler
स्किल्स क्या होती हैं?
2:54
EN/ZH
Watch with Captions
ClaudeClaude Code skills३ महीने पहले

स्किल्स क्या होती हैं?

Claude Code skills पुन: उपयोगी markdown फ़ाइलें हैं जो विशेष ज्ञान एक बार एन्कोड करती हैं — इसके बाद Claude उन्हें अपने-आप उस समय सक्रिय करता है जब कोई अनुरोध मेल खाता है, बिना उपयोगकर्ता को निर्देश दोहराने या कोई slash command टाइप करने की जरूरत के। यह तीन मिनट का ट्यूटोरियल बताता है कि skills क्या होती हैं, कहाँ रहती हैं, CLAUDE.md फ़ाइलों से कैसे अलग हैं, और वह संकेत जो बताता है कि skill लिखने का समय आ गया है। ## [00:03] वह दोहराव की समस्या जो skills हल करती हैं जब भी आप अपनी टीम के coding standards समझाते हैं, PR feedback का ढाँचा फिर से बताते हैं, या Claude को अपना पसंदीदा commit message format याद दिलाते हैं — आप खुद को दोहरा रहे होते हैं। narrator तीन back-to-back उदाहरणों से शुरू करता है और उस ठीक उस बिंदु को नाम देता है जिसे skills हल करती हैं। > *"हर बार जब आप Claude को अपनी टीम के coding standards समझाते हैं, आप खुद को दोहरा रहे होते हैं।"* ## [00:20] skill क्या है और Claude उसे कैसे चुनता है Skill एक markdown फ़ाइल है जो Claude को कोई काम एक बार सिखा देती है। Claude उस निर्देश को स्टोर कर लेता है और जब भी जरूरत पड़े, उसे अपने-आप लागू करता है। Claude Code में वह फ़ाइल SKILL.md होती है। उस फ़ाइल का description फ़ील्ड ही मुख्य तंत्र है: जब आप Claude से PR review करने को कहते हैं, तो वह आपके अनुरोध की तुलना उपलब्ध सभी skill descriptions से करता है और मिलान करने वाली skill को सक्रिय करता है। > *"Claude आपका अनुरोध पढ़ता है, उसे सभी उपलब्ध skill descriptions से मिलाता है, और जो मेल खाती हैं उन्हें सक्रिय करता है।"* ## [01:05] Skills कहाँ रखें: व्यक्तिगत बनाम प्रोजेक्ट Skills दो जगहों पर रहती हैं — यह इस बात पर निर्भर करता है कि किसे उनकी जरूरत है। व्यक्तिगत skills ~/.claude/skills में जाती हैं और हर प्रोजेक्ट में आपके साथ रहती हैं: commit message style, documentation format, कोड समझाने का तरीका। प्रोजेक्ट skills .claude/skills में repository की root पर जाती हैं; जो भी repo clone करे, उसे वे अपने-आप मिल जाती हैं। यही दूसरी जगह टीम के standards के लिए है: brand guidelines, web design के लिए पसंदीदा fonts और colors। > *"जो भी repository clone करता है, उसे ये skills अपने-आप मिल जाती हैं।"* ## [01:42] Skills बनाम CLAUDE.md: स्वचालित और context-कुशल Claude Code में customization की कई परतें हैं, और skills की अपनी अलग जगह है। CLAUDE.md फ़ाइलें हर बातचीत में बिना शर्त लोड होती हैं — उन नियमों के लिए सही जैसे "हमेशा TypeScript strict mode उपयोग करें"। Skills on demand लोड होती हैं, केवल तब जब वे मौजूदा अनुरोध से मेल खाती हैं, और उस समय केवल नाम और description ही context में आते हैं। Skill का पूरा body तभी लोड होता है जब वह ट्रिगर हो। इससे debugging के दौरान PR review checklist context window से बाहर रहती है और केवल तब आती है जब आप सच में review माँगते हैं। Slash commands टाइप करने पड़ते हैं; skills नहीं। > *"Skills अनोखी हैं क्योंकि वे स्वचालित और task-specific हैं।"* ## [02:27] Skill कब लिखें Skills उस विशेष ज्ञान के लिए सबसे अच्छी तरह काम करती हैं जो किसी खास काम से जुड़ा हो: आपकी टीम के code review standards, commit message formats, brand guidelines। अंतिम नियम सीधा और व्यावहारिक है: अगर आप खुद को Claude को एक ही बात बार-बार समझाते हुए पाते हैं, तो वह एक skill है जो लिखी जाने का इंतजार कर रही है। > *"अगर आप खुद को Claude को एक ही बात बार-बार समझाते हुए पाते हैं, तो वह एक skill है जो लिखी जाने का इंतजार कर रही है।"* ## संस्थाएँ - **Anthropic Tutorial Narrator** (व्यक्ति): Claude Code skills tutorial series के narrator और host - **Claude Code** (Software): Anthropic का AI coding assistant; वह रनटाइम जहाँ skills खोजी और लागू की जाती हैं - **SKILL.md** (अवधारणा): वह markdown फ़ाइल जो एक skill को परिभाषित करती है — इसमें Claude के लिए नाम, description और निर्देश होते हैं - **CLAUDE.md** (अवधारणा): प्रोजेक्ट-स्तर या global instruction फ़ाइल जो हर Claude Code बातचीत में बिना शर्त लोड होती है; skills से इसकी तुलना की जाती है - **Anthropic** (संगठन): Claude और Claude Code की निर्माता

#claude-code#ai-tools#developer-productivity
Skills शेयर करना
3:53
EN/ZH
Watch with Captions
ClaudeClaude Code skills३ महीने पहले

Skills शेयर करना

एक engineer के लिए PR review skill उपयोगी है; वही skill पूरी team में deploy होने पर code review को standardize करती है और पूरे organization में एक consistent अनुभव बनाती है। यह tutorial चार ठोस distribution methods — repository commits, plugins, enterprise managed settings, और custom sub-agents — को कवर करता है और बताता है कि हर method कब लागू होता है। Sub-agent section में एक गैर-obvious बात है: sub-agents skills को automatically inherit नहीं करते, और built-in agents उन्हें बिल्कुल भी access नहीं कर सकते। ## [00:01] शेयरिंग से skill की value क्यों बढ़ती है किसी एक developer तक सीमित skill अपना काम करती है। वही skill पूरी team में पहुंचाने पर standards fix हो जाते हैं, हर व्यक्ति की अलग-अलग कार्यशैली खत्म होती है, और हर review एक जैसा दिखता और महसूस होता है। Narrator पहले individual और team-scale use के बीच सीधा contrast करता है, फिर चारों sharing mechanisms की सूची देता है। > *"A PR review skill that only you use is helpful. The same skill shared across your team standardizes code review and provides a consistent experience amongst your organization which is much better."* ## [00:18] Repository में skills commit करना सबसे कम झंझट वाला तरीका: project repo के अंदर `.claude/skills` में skills रखें। Repository clone करने वाला कोई भी व्यक्ति उन skills को तुरंत पाता है — कोई install step नहीं, कोई extra tooling नहीं। Updates सामान्य `git pull` cycle से आती हैं। यह तरीका team coding standards, project-specific workflows, और उन skills के लिए उपयुक्त है जो codebase की अपनी संरचना को reference करती हैं। > *"Anyone who clones the repository gets these skills automatically. No extra installation, it's just what you're doing already."* ## [00:45] Plugins के ज़रिए skills distribute करना Plugins Claude Code को custom functionality से extend करते हैं जो एक project से आगे जाने के लिए बनी होती है। Plugin project के अंदर एक `skills/` directory `.claude/` की संरचना को mirror करती है — skill का नाम, `SKILL.md`। Marketplace पर publish होने के बाद कोई भी Claude Code user plugin download और activate कर सकता है। यह channel उन skills के लिए सबसे अच्छा है जो किसी एक team की conventions से ज़्यादा, व्यापक community की ज़रूरतें पूरी कर सकती हैं। > *"Think of plugins as ways to extend Claude Code with custom functionality, but designed to be shared across teams and projects."* ## [01:26] Managed settings से enterprise-wide deployment Administrators managed settings के ज़रिए organization के हर developer तक skills पहुंचा सकते हैं। Enterprise skills को सबसे ऊंची priority मिलती है: वे उसी नाम वाली personal, project, और plugin skills को override करती हैं। इनका उद्देश्य mandatory standards हैं — security requirements, compliance workflows, coding practices जो uniform रहनी चाहिए। Narrator "must" शब्द पर explicitly ज़ोर देता है: ये suggestions नहीं हैं। > *"This is for mandatory standards, security requirements, compliance workflows, or coding practices that must be consistent across the organization."* ## [01:52] Custom sub-agents और explicit skill loading Sub-agents main conversation की skills inherit नहीं करते। Built-in agents (explorer, planner, verify) skills को बिल्कुल access नहीं कर सकते। केवल custom sub-agents — जो `.claude/agents` में `agent.md` file से define होते हैं — skills use कर सकते हैं, और केवल वे ही जो उस file के `skills:` field में explicitly listed हों। Skills sub-agent के start होने पर load होती हैं, demand पर नहीं, इसलिए list tight रखनी चाहिए: केवल वे skills जो agent के purpose के लिए हमेशा ज़रूरी हों। Tutorial Claude Code sub-agent creator से sub-agent बनाना और किसी existing `agent.md` में skills attach करना दिखाता है। > *"Built-in agents like the explorer, planner, and verify can't access skills at all. Only custom sub-agents you define can use them, and only when you explicitly list them."* ## [03:18] सारांश: सही distribution method चुनना समापन में हर method को उसके scenario से जोड़ा जाता है: team access के लिए project directories, cross-repository sharing के लिए plugins, org-wide mandatory standards के लिए enterprise deployment, और isolated task delegation के लिए explicit sub-agent skill lists। Sub-agent reminder फिर आता है — किसी दिए गए agent के काम के लिए हमेशा ज़रूरी skills ही list करें, क्योंकि वे startup पर load होती हैं, lazily नहीं। > *"Share skills through project directories for team access, plugins for cross-repository distribution, or enterprise deployment for organization-wide standards."* ## Entities - **Anthropic Tutorial Narrator** (व्यक्ति): Claude Code skills tutorial series के एकमात्र presenter - **Claude Code** (Software): Anthropic का AI coding assistant; वह runtime environment जहाँ skills बनाई और deploy की जाती हैं - **Skills** (अवधारणा): `.claude/skills` में रखे reusable instruction sets जो Claude Code के व्यवहार को extend करते हैं - **Plugins** (अवधारणा): distributable packages जो teams और marketplace users के बीच sharing के लिए skills को bundle करते हैं - **Managed settings** (अवधारणा): enterprise administrator mechanism जो skills को org-wide highest priority override के साथ deploy करता है - **Sub-agents** (अवधारणा): `.claude/agents` में `agent.md` से define किए गए custom Claude Code agents; एकमात्र agent type जो skills load कर सकता है, और केवल तब जब explicitly listed हो - **Anthropic** (संगठन): वह company जिसने Claude Code बनाया और Claude Code skills tutorial series produce करती है

#claude-code#skills#developer-tools
कॉन्फ़िगरेशन और मल्टी-फ़ाइल स्किल्स
4:04
EN/ZH
Watch with Captions
ClaudeClaude Code skills३ महीने पहले

कॉन्फ़िगरेशन और मल्टी-फ़ाइल स्किल्स

Claude Code skills सीरीज़ का यह चार मिनट का ट्यूटोरियल उन एडवांस्ड कॉन्फ़िगरेशन फ़ील्ड्स को कवर करता है जो एक बेसिक स्किल को एक भरोसेमंद, context-efficient टूल में बदल देते हैं। नैरेटर agentskills.io के पूरे फ़ील्ड सेट — `name`, `description`, `allowed_tools`, `model` — से गुज़रता है और बताता है कि बड़ी स्किल्स को progressive disclosure का उपयोग करके कैसे स्ट्रक्चर किया जाए, ताकि रेफरेंस मटेरियल और स्क्रिप्ट्स केवल ज़रूरत पड़ने पर लोड हों, हर बार नहीं। ## [00:02] एडवांस्ड स्किल फ़ील्ड्स का अवलोकन agentskills.io ओपन स्टैंडर्ड में अनिवार्य `name` और `description` के अलावा कई फ़ील्ड्स परिभाषित हैं। `name` lowercase और हाइफन के साथ होना चाहिए, 64 कैरेक्टर से अधिक नहीं, और डायरेक्टरी के नाम से मेल खाना चाहिए। `description` अधिकतम 1,024 कैरेक्टर का होता है और यही वह प्राथमिक संकेत है जिससे Claude स्किल मैचिंग करता है। दो वैकल्पिक फ़ील्ड्स कॉन्फ़िगरेशन को पूरा करते हैं: `allowed_tools`, जो यह नियंत्रित करता है कि स्किल कौन से टूल्स इनवोक कर सकती है, और `model`, जो स्किल को Claude के किसी खास वर्ज़न से जोड़ता है। > *"A basic skill works with just a name and description, but here are some other advanced tips that can make your skills really effective in Claude Code."* ## [00:39] प्रभावी description लिखना एक अस्पष्ट description — "कुत्तों की मदद करें" — Claude को स्कोप और ट्रिगर के बारे में अनुमान लगाने पर मजबूर करती है। एक अच्छी description ठीक दो सवालों का जवाब देती है: यह स्किल क्या करती है, और Claude को इसे कब इस्तेमाल करना चाहिए? यूज़र रिक्वेस्ट की स्वाभाविक भाषा से कीवर्ड मिलाना ही उन स्किल्स को ठीक करने का तरीका है जो ट्रिगर नहीं होतीं। > *"A good description answers two questions. What does this skill do? And when should Claude use it?"* ## [01:20] allowed_tools से टूल्स को सीमित करना `allowed_tools` स्किल को एक निश्चित सतह तक सीमित रखने का तंत्र है — जैसे security-sensitive वर्कफ़्लो के लिए केवल read-only एक्सेस। जब यह फ़ील्ड सेट होता है, Claude बिना permission मांगे केवल उन्हीं टूल्स को कॉल कर सकता है; कोई editing, writing, या Bash नहीं। फ़ील्ड छोड़ देने पर Claude का सामान्य permission मॉडल बना रहता है। > *"When this skill is active, Claude can only use those tools without asking permission. No editing, no writing, no bash commands."* ## [01:49] मल्टी-फ़ाइल स्किल्स के लिए progressive disclosure स्किल्स Claude की context window को चल रही बातचीत के साथ साझा करती हैं। सब कुछ एक 20,000-लाइन के `SKILL.md` में ठूंस देने से हर बार context फूल जाता है और फ़ाइल मेंटेन करना मुश्किल हो जाता है। समाधान: ज़रूरी निर्देश `SKILL.md` में रखें और रेफरेंस मटेरियल को अलग फ़ाइलों में ले जाएं जिन्हें Claude तभी पढ़े जब यूज़र की रिक्वेस्ट वाकई उनकी मांग करे। स्टैंडर्ड तीन सपोर्टिंग डायरेक्टरीज़ सुझाता है — executable कोड के लिए `scripts/`, डॉक्यूमेंटेशन के लिए `references/`, और इमेज व टेम्पलेट्स के लिए `assets/`। `SKILL.md` में एक लिंक टेबल ऑफ कंटेंट्स की एंट्री की तरह काम करता है; अगर विषय कभी नहीं आया, फ़ाइल कभी लोड नहीं होती। स्किल डायरेक्टरी में मौजूद स्क्रिप्ट्स बिना सोर्स context में लोड किए चलती हैं — केवल उनका आउटपुट टोकन खर्च करता है। नैरेटर `SKILL.md` को 500 लाइन से कम रखने की सलाह देता है; इससे ज़्यादा होने पर स्किल को विभाजित करने का संकेत मिलता है। > *"It's like having a table of contents in the context window rather than fitting the whole entire document in there."* ## [03:18] रिकैप: स्किल मेटाडेटा और बेस्ट प्रैक्टिस ट्यूटोरियल पूरी कॉन्फ़िगरेशन सरफेस को दोहराते हुए खत्म होता है: `name` और `description` अनिवार्य हैं; `allowed_tools` टूल सरफेस को सीमित करता है; `model` Claude का वर्ज़न पिन करता है। descriptions में ठोस action verbs और trigger phrases होने चाहिए ताकि मैचिंग भरोसेमंद रहे। बड़ी स्किल्स के लिए, progressive disclosure `SKILL.md` को 500 लाइन से कम रखती है और सपोर्टिंग फ़ाइलों को तब तक टालती है जब तक वे वाकई ज़रूरी न हों। स्क्रिप्ट्स सोर्स लोड किए बिना execute होती हैं, जिससे context दुबला-पतला रहता है। > *"Scripts can execute without loading their contents, keeping context efficient."* ## एंटिटीज़ - **Anthropic Tutorial Narrator** (व्यक्ति): इस ट्यूटोरियल सीरीज़ का एकल होस्ट, जो Claude Code स्किल कॉन्फ़िगरेशन प्रस्तुत करता है। - **Claude Code** (सॉफ़्टवेयर): Anthropic का CLI टूल जो agentskills.io स्टैंडर्ड से स्किल्स लोड और execute करता है। - **agentskills.io** (संगठन): ओपन स्टैंडर्ड जो स्किल मैनिफेस्ट स्कीमा परिभाषित करता है, जिसमें `name`, `description`, `allowed_tools`, `model` और डायरेक्टरी कन्वेंशन शामिल हैं। - **SKILL.md** (अवधारणा): Claude Code स्किल की प्राथमिक मैनिफेस्ट फ़ाइल; सपोर्टिंग फ़ाइलों के लिंक के साथ 500 लाइन से कम रहनी चाहिए। - **allowed_tools** (अवधारणा): वैकल्पिक स्किल फ़ील्ड जो Claude के खास टूल्स को whitelist करती है, read-only या sandboxed मोड सक्षम करती है। - **Progressive disclosure** (अवधारणा): मल्टी-फ़ाइल स्किल को इस तरह स्ट्रक्चर करना कि रेफरेंस फ़ाइलें और स्क्रिप्ट्स context में तभी लोड हों जब एक्टिव रिक्वेस्ट उनकी मांग करे। - **Context window** (अवधारणा): बातचीत और Claude द्वारा लोड की गई स्किल फ़ाइलों के बीच साझा टोकन बजट; वह मुख्य संसाधन जिसे progressive disclosure बचाने के लिए डिज़ाइन की गई है।

#claude-code#skills#configuration
अपनी पहली स्किल बनाएं
3:47
EN/ZH
Watch with Captions
ClaudeClaude Code skills३ महीने पहले

अपनी पहली स्किल बनाएं

यह 3 मिनट का ट्यूटोरियल Claude Code में एक पर्सनल स्किल बनाने की पूरी प्रक्रिया दिखाता है: SKILL.md फ़ाइल के साथ एक डायरेक्टरी बनाएं, स्टार्टअप पर स्किल लोड होने की पुष्टि करें और Claude को एक असली रिक्वेस्ट पर इसे उपयोग करते देखें। दूसरा हिस्सा बताता है कि Claude का स्किल-लोडिंग पाइपलाइन कैसे काम करता है — चार स्कैन लोकेशन और नाम-केवल स्टार्टअप पास से लेकर कन्फ़र्मेशन गेट और नामकरण विवाद सुलझाने वाले चार-स्तरीय प्राथमिकता क्रम तक। ## [00:03] यह ट्यूटोरियल क्या बनाता है नैरेटर एक ठोस लक्ष्य से शुरू करता है: एक स्किल जो Claude को विज़ुअल डायग्राम और उपमाओं के ज़रिए कोड समझाना सिखाती है। इसे बनाने के बाद, ट्यूटोरियल यह भी दिखाता है कि जब Claude एक स्किल पहचानता और चलाता है तो अंदर क्या होता है। > *"यह स्किल Claude को सिखाएगी कि हम चाहते हैं कि वह विज़ुअल डायग्राम और उपमाओं का उपयोग करके कोड कैसे समझाए।"* ## [00:18] स्किल फ़ाइल बनाना पर्सनल स्किल्स होम डायरेक्टरी में रहती हैं, किसी प्रोजेक्ट के अंदर नहीं — इसलिए पहला कदम है `~/.claude/skills/` के अंदर स्किल के नाम से एक नई डायरेक्टरी बनाना। उस डायरेक्टरी में सिर्फ एक `SKILL.md` फ़ाइल जाती है। तीन सेक्शन ज़रूरी हैं: `name` (वह पहचानकर्ता जिसे Claude स्टार्टअप पर स्टोर करता है), `description` (मिलान मानदंड जो Claude तय करने के लिए उपयोग करता है कि स्किल इनवोक करनी है या नहीं) और दूसरे `---` डेलिमिटर के बाद का सब कुछ (वे निर्देश जो Claude स्किल फ़ायर होने पर फ़ॉलो करता है)। > *"ध्यान रखें कि हम skills डायरेक्टरी के अंदर स्किल के नाम से एक डायरेक्टरी बना रहे हैं।"* ## [00:52] अपनी स्किल लोड और टेस्ट करना Claude Code स्टार्टअप पर स्किल्स स्कैन करता है, मांग पर नहीं — इसलिए फ़ाइल बनाने के बाद सेशन रिस्टार्ट करना ज़रूरी है। `/skills` चलाने पर "PR description" (या जो भी स्किल अभी बनाई गई हो) लिस्ट होनी चाहिए। टेस्ट करने के लिए कुछ बदलावों के साथ एक ब्रांच बनाएं और सरल अंग्रेज़ी में रिक्वेस्ट भेजें "Write a PR description for my changes." Claude बताएगा कि वह PR description स्किल इनवोक कर रहा है, फिर diff पढ़कर हर बार एक जैसे फ़ॉर्मेट में डिस्क्रिप्शन लिखेगा। > *"Claude फिर आपको दिखाएगा कि वह PR description स्किल उपयोग कर रहा है।"* ## [01:25] Claude स्किल्स को अंदर से कैसे लोड करता है स्टार्टअप पर, Claude Code चार जगह स्कैन करता है: एंटरप्राइज़ मैनेज्ड सेटिंग्स, पर्सनल `~/.claude/skills/`, प्रोजेक्ट की `.claude/` डायरेक्टरी और इंस्टॉल किए गए प्लगइन। वह केवल `name` और `description` लोड करता है — पूरी कॉन्टेंट नहीं। जब कोई रिक्वेस्ट आती है, Claude उसे स्टोर की गई डिस्क्रिप्शन से मिलाता है; "इस फ़ंक्शन को समझाओ" और "विज़ुअल डायग्राम से कोड समझाओ" ओवरलैप करते हैं तो स्किल मैच करती है। पूरा SKILL.md पढ़ने से पहले Claude कन्फ़र्मेशन मांगता है, जिससे यूज़र को पता रहता है कि कौन सा कॉन्टेक्स्ट इंजेक्ट हो रहा है। > *"वह प्रत्येक स्किल का केवल नाम और विवरण लोड करता है, पूरी कॉन्टेंट नहीं। यह बाद में महत्वपूर्ण है।"* ## [02:02] प्राथमिकता नियम और नामकरण विवाद किसी ऐसे रिपॉज़िटरी को क्लोन करने पर जिसमें पहले से स्किल्स हों, नाम टकराव हो सकता है। Claude एक निश्चित प्राथमिकता क्रम से इसे सुलझाता है: एंटरप्राइज़ (सबसे ऊंची) → पर्सनल → प्रोजेक्ट → प्लगइन (सबसे नीची)। एंटरप्राइज़ `code-review` स्किल हमेशा पर्सनल `code-review` स्किल से ऊपर रहेगी। व्यावहारिक हल है वर्णनात्मक नाम रखना: जेनेरिक `review` की बजाय `security-review` या `frontend-pr-review`, ताकि टकराव ही न हो। > *"अगर आपकी कंपनी के पास एंटरप्राइज़ code review स्किल है और आप एक पर्सनल code review स्किल बनाते हैं, तो एंटरप्राइज़ वर्ज़न को प्राथमिकता मिलती है।"* ## [02:52] स्किल्स अपडेट और हटाना स्किल अपडेट करना सीधे फ़ाइल एडिट है: SKILL.md खोलें, ज़रूरी बदलाव करें, सेव करें। स्किल हटाने का मतलब है उस डायरेक्टरी को डिलीट करना। दोनों ऑपरेशन के लिए Claude Code को रिस्टार्ट करना ज़रूरी है — स्किल लिस्ट सेशन स्टार्टअप पर एक बार बनती है, लाइव बदलावों के लिए वॉच नहीं करती। > *"स्किल अपडेट करने के लिए skill.md फ़ाइल एडिट करें और बदलाव लागू करने के लिए Claude Code रिस्टार्ट करें।"* ## इकाइयां - **Anthropic ट्यूटोरियल नैरेटर** (व्यक्ति): Claude Code skills सीरीज़ के लिए स्किल निर्माण ट्यूटोरियल में मार्गदर्शन करने वाला एकमात्र होस्ट - **Claude Code** (सॉफ़्टवेयर): Claude के लिए Anthropic का CLI; स्टार्टअप पर स्किल्स स्कैन करता है और यूज़र रिक्वेस्ट स्किल डिस्क्रिप्शन से मेल खाने पर उन्हें अप्लाई करता है - **SKILL.md** (अवधारणा): वह एकल फ़ाइल जो एक स्किल परिभाषित करती है — YAML frontmatter (name, description) और दूसरे `---` डेलिमिटर के बाद फ्रीफ़ॉर्म इंस्ट्रक्शन टेक्स्ट - **Skills** (अवधारणा): पुन: उपयोग योग्य, नामित निर्देश सेट जो Claude को एक सुसंगत व्यवहार पैटर्न सिखाते हैं; SKILL.md फ़ाइल वाली डायरेक्टरी के रूप में संग्रहीत - **Enterprise Skills** (अवधारणा): संगठन-प्रबंधित स्किल्स जो चार-स्तरीय प्राथमिकता क्रम के शीर्ष पर हैं, पर्सनल, प्रोजेक्ट और प्लगइन स्किल्स को ओवरराइड करती हैं - **Anthropic** (संगठन): Claude और Claude Code की निर्माता; claude.com/resources/courses पर यह ट्यूटोरियल सीरीज़ तैयार करती है

#claude-code#skills#developer-tools
Skills की तुलना Claude Code के अन्य फीचर्स से कैसे होती है
3:01
EN/ZH
Watch with Captions
ClaudeClaude Code skills३ महीने पहले

Skills की तुलना Claude Code के अन्य फीचर्स से कैसे होती है

Claude Code डेवलपर्स को पाँच अलग-अलग कस्टमाइज़ेशन विकल्प देता है — Skills, CLAUDE.md, subagents, hooks और MCP servers — जिनमें से हर एक अलग काम के लिए बना है। यह तीन मिनट का ट्यूटोरियल बताता है कि कौन-सा विकल्प किस काम के लिए सही है, ताकि आप Skills की जगह CLAUDE.md का इस्तेमाल करने से न चूकें और hook लगाएँ जब असल ज़रूरत subagent की हो। ## [00:02] पाँच कस्टमाइज़ेशन विकल्प, एक निर्णय की समस्या Claude Code में व्यवहार को आकार देने के पाँच तरीके हैं: Skills, CLAUDE.md, subagents, hooks और MCP servers। नैरेटर इन सभी को तेज़ी से गिनाता है और सवाल को "ये क्या हैं?" से बदलकर "इनमें से यहाँ कौन-सा सही है?" कर देता है। > *"ये अलग-अलग समस्याएँ हल करते हैं। यह जानना कि कब किसका इस्तेमाल करना है, आपको गलत चीज़ बनाने से बचाता है।"* ट्यूटोरियल का बाकी हिस्सा मूलतः इसी एक वाक्य का जवाब है। ## [00:18] CLAUDE.md बनाम Skills: हमेशा-चालू बनाम माँग पर CLAUDE.md एक ऐसी फ़ाइल है जिसे Claude हर बातचीत की शुरुआत में पढ़ता है, बिना किसी सक्रियण के। यह उन प्रोजेक्ट-व्यापी नियमों का सही ठिकाना है जो कभी नहीं भूलने चाहिए — framework का चुनाव, कोडिंग स्टाइल, डेटाबेस के नियम। Skills इसके उलट माँग पर लोड होती हैं: आपका PR रिव्यू चेकलिस्ट तभी संदर्भ में आता है जब आप वाकई रिव्यू माँगते हैं, नया कोड लिखते समय नहीं। > *"Claude MD का इस्तेमाल उन प्रोजेक्ट-व्यापी मानकों के लिए करें जो हमेशा लागू होते हैं — जैसे database schema कभी न बदलें, framework की प्राथमिकताएँ और कोडिंग स्टाइल।"* फ़र्क है स्थायित्व बनाम प्रासंगिकता का। अगर निर्देश प्रोजेक्ट के हर prompt में ज़रूरी है, तो वह CLAUDE.md में जाता है। अगर कभी-कभी ही काम आता है, तो वह एक Skill में जाता है। ## [01:03] Skills बनाम Subagents: साझा संदर्भ बनाम अलग-थलग निष्पादन Skills मौजूदा बातचीत में ज्ञान इंजेक्ट करती हैं — उनके निर्देश मौजूदा संदर्भ में शामिल हो जाते हैं। Subagents अलग तरह से काम करते हैं: वे एक काम लेते हैं, एक अलग निष्पादन संदर्भ बनाते हैं, स्वतंत्र रूप से काम करते हैं और मुख्य बातचीत को छुए बिना नतीजे लौटाते हैं। > *"Subagents का इस्तेमाल तब करें जब आप किसी काम को अलग निष्पादन संदर्भ में सौंपना चाहते हों। जब आपको मुख्य बातचीत से अलग टूल एक्सेस चाहिए। जब आप सौंपे गए काम और मुख्य संदर्भ के बीच अलगाव चाहते हों।"* Skills तब काम आती हैं जब किसी चल रही बातचीत में Claude की सोच को विशेषज्ञता से मार्गदर्शित करना हो। Subagents तब काम आते हैं जब मुख्य सत्र और किसी सौंपे गए काम के बीच साफ़ सीमा चाहिए — अलग टूल, कोई मिलावट नहीं। ## [01:42] Hooks बनाम Skills: इवेंट-ड्रिवन बनाम रिक्वेस्ट-ड्रिवन Hooks इवेंट्स पर अपने आप चलते हैं — Claude के फ़ाइल सेव करने पर linter चलाना, किसी खास टूल कॉल से पहले इनपुट को वेलिडेट करना। इन्हें आपकी माँग ट्रिगर नहीं करती; Claude की कार्रवाई ट्रिगर करती है। Skills इसके उलट हैं: रिक्वेस्ट-ड्रिवन, जो किसी क्वेरी से मेल खाने पर सक्रिय होती हैं। > *"एक hook हर बार Claude के फ़ाइल सेव करने पर linter चला सकता है या कुछ टूल कॉल से पहले इनपुट वेलिडेट कर सकता है। ये सब इवेंट-ड्रिवन हैं, जबकि skills रिक्वेस्ट-ड्रिवन हैं। ये इस बात के आधार पर सक्रिय होती हैं कि आप क्या माँग रहे हैं।"* अगर व्यवहार किसी सिस्टम इवेंट पर बिना शर्त होना ज़रूरी है, तो वह hook है। अगर उसे Claude की सोच को माँगने पर आकार देना है, तो वह Skill है। ## [02:15] व्यापक कस्टमाइज़ेशन के लिए पाँचों को मिलाना एक अच्छी तरह से कॉन्फ़िगर किया गया Claude Code setup हर टूल को उसके स्वाभाविक काम के लिए इस्तेमाल करता है: CLAUDE.md हमेशा-चालू प्रोजेक्ट मानकों के लिए, Skills उस टास्क-विशिष्ट विशेषज्ञता के लिए जो हर prompt को न भरे, hooks स्वचालित साइड इफ़ेक्ट्स के लिए, subagents अलग-थलग सौंपे गए काम के लिए और MCP servers बाहरी टूल एक्सेस के लिए। ये विकल्प नहीं हैं — ये मिलकर काम करते हैं। > *"हर चीज़ को skills में न ठूँसें जब कोई और विकल्प बेहतर बैठता हो। आप एक साथ कई का इस्तेमाल कर सकते हैं।"* Skills तब अपने आप सक्रिय होती हैं जब कोई विषय प्रासंगिक होता है; CLAUDE.md हमेशा मौजूद रहता है; subagents अलगाव में चलते हैं; hooks इवेंट्स पर चलते हैं; MCP बाहरी टूल देता है। हर ज़रूरत के लिए सही परत चुनें और उन्हें मिला-जुलाकर इस्तेमाल करें। ## एंटिटीज़ - **Anthropic Tutorial Narrator** (व्यक्ति): Anthropic की ओर से Claude Code skills tutorial series के प्रस्तोता। - **Claude Code** (सॉफ़्टवेयर): Anthropic का AI-संचालित कोडिंग असिस्टेंट; इस tutorial series का विषय। - **Skills** (अवधारणा): माँग पर चलने वाले ज्ञान पैकेज जो Claude द्वारा उपयोगकर्ता की माँग पहचानने पर सक्रिय होते हैं; मौजूदा बातचीत संदर्भ में निर्देश इंजेक्ट करते हैं। - **CLAUDE.md** (अवधारणा): एक कॉन्फ़िगरेशन फ़ाइल जो Claude Code की हर बातचीत में अपने आप लोड होती है; हमेशा-चालू प्रोजेक्ट-व्यापी मानकों और नियमों के लिए उपयोगी। - **Subagents** (अवधारणा): अलग निष्पादन संदर्भ जो मुख्य बातचीत से अलग-थलग होकर सौंपे गए कामों को संभालते हैं। - **Hooks** (अवधारणा): इवेंट-ड्रिवन ऑटोमेशन जो Claude की खास कार्रवाइयों — जैसे फ़ाइल सेव या टूल कॉल — पर चलती है, उपयोगकर्ता की माँग से स्वतंत्र। - **MCP Servers** (सॉफ़्टवेयर): Model Context Protocol servers जो Claude Code सत्रों को बाहरी टूल उपलब्ध कराते हैं। - **Anthropic** (संगठन): Claude Code के निर्माता और Claude Code skills tutorial series के प्रकाशक।

#claude-code#skills#claude-md