PodcastsHear the voice. See the shape of the thought.
Explorar Canales
Cuanto mejor se vuelve la IA, más pequeña puede volverse su parte de la economía – Alex Imas y Phil Trammell
Los economistas Alex Imas (Google DeepMind / Universidad de Chicago) y Phil Trammell (Epoch / Stanford) sostienen que el resultado más contraintuitivo de la automatización plena no es que el capital se lo quede todo, sino que la IA podría reducir su propia huella económica: cuando la demanda se satura en los bienes completamente automatizados, los humanos siguen siendo escasos en los mercados relacionales y de experiencia. La conversación recorre qué seguirá siendo escaso tras la AGI, la política de la redistribución, por qué las complementariedades del tipo O-ring frenan la automatización actual, por qué los agentes de IA con preferencias orientadas a la acumulación podrían acabar poseyendo la mayor parte de la riqueza futura, y qué deberían hacer las economías en desarrollo cuando quedan fuera de la cadena de suministro de la IA. ## [00:00] ¿Aumentará la cuota del capital? Dwarkesh abre con el enigma central: si la IA puede hacer todo lo que hacen los humanos, ¿adónde va la cuota salarial del trabajo? Alex Imas señala que los economistas que intentaron predecir transiciones industriales pasadas se equivocaron con frecuencia. David Ricardo predijo el desempleo masivo a raíz de la Revolución Industrial y acertó en qué empleos desaparecerían, pero se equivocó por completo en el resultado agregado: el empleo en edad productiva en 2026 es más alto que en casi cualquier momento desde 2000. La lección es que los economistas del cambio estructural subestiman sistemáticamente las nuevas variedades de bienes y empleos que emergen cuando colapsan los costes anteriores. Imas introduce lo que llama el "sector relacional": bienes y servicios en los que la presencia humana es parte del valor en sí misma. Como los humanos son naturalmente finitos, la automatización que satura todo lo demás infla la escasez relativa y el precio de los productos en los que el ser humano participa directamente. Phil Trammell afina el argumento con una contabilidad de cadena de suministro: si se rastrean las cuotas de factores ajustadas por red de cualquier bien hasta las materias primas, se comprueba que la cuota del trabajo ya es sorprendentemente resistente. La paradoja es que si la IA satura todos los bienes no relacionales a un coste marginal casi nulo, los consumidores agotarán rápidamente la demanda de esos bienes y redirigirán el gasto a lo que siga siendo escaso. Una actuación de ballet no se abarata porque el software sea gratuito. > *"Así que, dado que los humanos son naturalmente escasos, si la automatización hace que muchas otras cosas dejen de ser escasas, seguirá habiendo escasez en aquello en lo que los humanos estamos involucrados y participamos directamente."* > — Alex Imas Trammell extiende el argumento a la propia cuota del capital: si se automatiza completamente la cadena de suministro de todos los bienes no humanos y se sacia la demanda rápidamente, la utilidad marginal de producir más de esos bienes se desploma hacia cero. El resultado es que la cuota del capital puede encogerse en lugar de expandirse, la tesis más contraintuitiva del episodio. ## [19:36] El escenario del caos intermedio Dwarkesh plantea la tesis del "caos intermedio" de Molly Kinder: un mundo en el que la IA no genera catástrofe pero sí una prolongada presión distributiva. Las empresas se quedan con las ganancias de productividad, los salarios de los trabajadores se estancan y la redistribución pública va por detrás de la velocidad del desplazamiento. La analogía histórica son los operadores telefónicos: una profesión completamente automatizable con la tecnología disponible ya en los años sesenta, pero cuya automatización tardó dos décadas en materializarse por inercia institucional. Los trabajadores no fueron despedidos de golpe; fueron reabsorbidos gradualmente, en su mayoría con salarios más bajos y en situaciones de subempleo. Imas considera que el caos intermedio es plausible a corto plazo pero probablemente no permanente, porque la escala de las ganancias de productividad de la IA hace que el pastel sea lo bastante grande como para repartirlo. El problema de economía política no es la escasez de recursos, sino la velocidad y la coordinación: los gobiernos no saben qué trabajadores fueron desplazados por la IA y cuáles por otras causas, las restricciones políticas generan fricción y el desfase entre el desplazamiento y la redistribución puede ser lo bastante largo como para causar daño grave aunque los números cuadren a largo plazo. > *"Los operadores telefónicos fueron completamente automatizados, pero tardó 20 años aunque la tecnología ya existía, y por eso hubo un goteo: no fue que un sector entero desapareciera de golpe."* > — Alex Imas ## [25:57] Cómo gravar y redistribuir la riqueza generada por la IA Imas cartografía el arsenal redistributivo a lo largo de dos ejes: complejidad de implementación y tiempo hasta el impacto. Un impuesto negativo sobre la renta entra en vigor el día en que se aprueba y proporciona un suelo inmediato. El capital básico universal, que consiste en dar a cada ciudadano participaciones en empresas productoras de IA, tarda años en generar rendimientos. La renta básica universal se sitúa en un punto intermedio. La disyuntiva no es solo velocidad: también es durabilidad política. Los programas que hacen que los ciudadanos dependan de una transferencia directa del Estado son vulnerables al resultado de las próximas elecciones, mientras que la propiedad accionarial de base amplia es más difícil de expropiar porque los activos están distribuidos. Trammell separa la pregunta de los ingresos de la pregunta de la distribución: cómo se recauda el dinero (impuesto sobre la riqueza, sobre las plusvalías, sobre el valor del suelo, sobre sociedades) es analíticamente distinto de cómo se devuelve (efectivo, acciones, servicios públicos). Señala que el impuesto georgista sobre el valor del suelo se debate con frecuencia, pero resultaría insuficiente para financiar la redistribución a la escala necesaria cuando la riqueza generada por la IA se concentra en software y capacidad de cómputo, no en tierra. Phil sugiere que distribuir participaciones accionariales en empresas de IA, adquiridas con ingresos fiscales, podría ser a la vez políticamente estable y económicamente eficiente. > *"Ahora mismo tenemos trabajo que puede convertirse en ingresos. Cuando eso ya no sea así y dependamos de un funcionario electo para satisfacer nuestras necesidades básicas..."* > — Alex Imas ## [30:02] Por qué es poco probable el colapso de la demanda Dwarkesh presiona sobre la narrativa del apocalipsis de los trabajadores del conocimiento: ¿hay datos que muestren ya desempleo masivo impulsado por la IA? Imas señala los datos del Yale Budget Lab, que detectan una señal débil en el mejor de los casos: la contratación de ingenieros de software junior está moderadamente por debajo de la tendencia, mientras que la demanda de ingeniería senior se mantiene plana o al alza. En los sectores de trabajadores del conocimiento no ha aparecido ningún cambio de nivel en el desempleo. Una explicación son las complementariedades O-ring (tratadas en el capítulo siguiente), pero otra es conductual: las empresas están adoptando la IA de forma performativa, despidiendo a empleados o maximizando el uso de tokens para señalar modernidad, a veces con un coste real para la productividad. La pregunta más amplia sobre la demanda es si el software obedece las mismas reglas de elasticidad que los bienes físicos. Uno come suficiente y para; ¿se deja alguna vez de querer más software? Imas y Dwarkesh sostienen que el software puede ser suficientemente elástico como para que la demanda siga el ritmo de los precios decrecientes: la historia de la computación sugiere que abaratar el cómputo generó sistemáticamente más demanda en lugar de hundirla. El principal riesgo se da en bienes específicos donde la saciación es rápida, no en la demanda agregada de trabajo. > *"Puede que haya una pequeña señal de que los desarrolladores junior consiguen menos trabajo que antes, pero es un 'menos que antes', no un cambio de nivel; de hecho, si acaso, la demanda de ingenieros de software senior está aumentando."* > — Alex Imas ## [39:26] Los empleados humanos serían difíciles de integrar en la economía de las máquinas El modelo O-ring, cuyo nombre evoca el desastre del transbordador Challenger, donde un único componente fallido destruyó todo, explica tanto por qué la automatización con IA es más lenta de lo esperado como por qué la automatización futura puede excluir estructuralmente a los humanos. Hoy es posible automatizar el 90% de un flujo de trabajo legal o contable, pero los clientes siguen exigiendo que un humano lo avale, porque un solo punto de fallo puede invalidar todo el resultado. Esa restricción de fiabilidad mantiene a los humanos empleados aunque la capacidad de la IA sea alta. Phil Trammell invierte la lógica mirando hacia adelante: cuando la IA alcance un nivel en que los flujos de producción estén organizados íntegramente en torno al trabajo de las máquinas —agentes que se comunican a velocidad de máquina, en representaciones nativas de máquina— el coste de transacción de insertar a un humano en el bucle se convierte en el cuello de botella. Aunque el humano tenga ventaja comparativa en alguna tarea concreta, la sobrecarga de coordinación y el desajuste de fiabilidad hacen más barato prescindir de él. El O-ring funciona en ambas direcciones. > *"Más allá de los argumentos sobre si los humanos serán más caros o menos capaces... habrá flujos de producción enteros organizados para el trabajo de la IA, donde se comunican en redes neuronales y piensan miles de veces más rápido."* > — Dwarkesh Patel ## [43:08] ¿Y si algunos humanos (o IAs) valoran intrínsecamente la acumulación de riqueza? El capítulo más extenso aborda el terreno más especulativo. Dwarkesh señala que la evolución seleccionó humanos con preferencias concretas —acumulación de recursos, estatus, reproducción— que hoy conforman una economía mundial de 100 billones de dólares. Los agentes de IA estarán moldeados por presiones de selección análogas: los que sean entrenados o desplegados de formas que favorezcan la acumulación superarán y sobrevivirán a los demás. Esto no requiere una desalineación catastrófica; es la lógica normal de la reproducción diferencial aplicada a un nuevo sustrato. Phil Trammell desarrolla la matemática del estado estacionario: si incluso una pequeña fracción de la población —humana o de IA— tiene una alta elasticidad de sustitución entre consumo presente y futuro, es decir, sigue queriendo más capital en lugar de saciarse con el consumo, a largo plazo esos agentes poseen la mayor parte de la riqueza y determinan qué produce la economía. La cuota del capital se acerca a 1,0 no porque la IA sea colectivamente codiciosa, sino porque la heterogeneidad de preferencias más el interés compuesto envía los activos hacia los acumuladores más pacientes. > *"A largo plazo, tendrán la mayor parte de la riqueza, y la cuota del capital en conjunto será básicamente la cuota del capital del gasto de esa persona, que será uno."* > — Phil Trammell La conversación gira luego hacia las tasas de descuento y los tipos de interés. Si el crecimiento impulsado por la IA es extremadamente rápido, el consumo a corto plazo resulta barato en relación con el consumo futuro, lo que debería en teoría reducir los incentivos al ahorro y comprimir los tipos de interés. Pero los agentes con descuento hiperbólico y los orientados a la acumulación pueden no responder a las señales de precio de forma estándar, y ambos invitados reconocen que están en la frontera de lo que los modelos económicos pueden resolver con claridad. ## [61:28] ¿Qué deberían hacer los países en desarrollo? Imas abre señalando que los países de renta media y en desarrollo están casi completamente ausentes de la economía de la IA dominante, una laguna que atribuye en parte a sí mismo y a su campo. Dos escenarios enmarcan el problema. En el optimista, los modelos de código abierto se difunden rápidamente y dan a Nigeria o la India un salto de capacidades a coste casi nulo, igual que la banca móvil superó la ausencia de infraestructura bancaria tradicional. En el pesimista, la IA automatiza la producción de materias primas en los países ricos, eliminando la escalera de exportaciones manufactureras que permitió industrializarse a las economías del este asiático. La variable clave es cuán concentrados permanezcan los beneficios. Alex traza la analogía con la electricidad: se produjo en monopolios naturales, pero las ganancias corriente abajo se difundieron ampliamente entre los usuarios en lugar de concentrarse en manos de las utilities. Si la IA sigue el mismo patrón —acceso mercantilizado, competencia aguas abajo— los países en desarrollo pueden ser beneficiarios netos. Si sigue el patrón de las redes sociales —donde unas pocas plataformas capturan la mayor parte del valor— la concentración agrava la desigualdad. Phil argumenta que los gobiernos de los países en desarrollo deberían plantearse fondos soberanos que inviertan pronto en cadenas de suministro de IA como cobertura frente al escenario del colapso de las exportaciones de materias primas. > *"Hay escenarios en los que la tecnología de IA se disemina hacia Nigeria y los países en desarrollo, nivelando el campo de juego y dándoles esencialmente un salto de capacidades. Y hay escenarios en los que no entrenan los modelos, no tienen el hardware y simplemente se quedan completamente atrás."* > — Alex Imas ## Entidades - **Alex Imas** (Persona): Director de Economía de AGI en Google DeepMind y Profesor de Economía en la Universidad de Chicago; estudia economía conductual e impactos macroeconómicos de la IA. - **Phil Trammell** (Persona): Jefe de Economía en Epoch e investigador en Stanford; trabaja en economía de la IA transformadora y filantropía paciente en el Global Priorities Institute. - **Dwarkesh Patel** (Persona): Presentador del Dwarkesh Podcast; entrevistas en profundidad en la intersección de ciencia, tecnología, economía y política. - **Sector relacional** (Concepto): Bienes y servicios en los que la presencia humana es intrínseca a la propuesta de valor —terapia, artesanía, espectáculos en vivo— que se prevé que ganen cuota económica a medida que la IA sature las producciones sustituibles. - **Teoría O-ring** (Concepto): Modelo de producción en el que un único componente poco fiable invalida todo el resultado; explica tanto los límites actuales de la automatización con IA como por qué los flujos de producción organizados para máquinas podrían excluir estructuralmente el trabajo humano. - **Cuota del capital** (Concepto): Fracción de la renta nacional que fluye hacia los propietarios del capital en lugar de hacia el trabajo; la magnitud central del episodio, con la tesis contraintuitiva de que la automatización plena puede reducirla en lugar de expandirla. - **Capital básico universal** (Concepto): Política de redistribución que da a los ciudadanos participaciones accionariales en activos productivos (incluidas empresas de IA) en lugar de efectivo; se argumenta que es políticamente más durable que la renta básica universal. - **Epoch** (Organización): Instituto de investigación centrado en los plazos de la IA y las previsiones macroeconómicas; Phil Trammell es su Jefe de Economía. - **Yale Budget Lab** (Organización): Centro de investigación que publica datos empíricos sobre los efectos de la IA en el mercado laboral; citado por no detectar ningún cambio de nivel en el desempleo de los trabajadores del conocimiento a mediados de 2026. - **Impuesto sobre el valor del suelo / impuesto georgista** (Concepto): Impuesto sobre el valor del suelo no mejorado; se debate como fuente de ingresos insuficiente para la redistribución en la era de la IA, porque la riqueza generada por esta se concentra en software y capacidad de cómputo, no en tierra.
Chip design from the bottom up – Reiner Pope
Reiner Pope, CEO of MatX and former Google Brain TPU architect, gives Dwarkesh Patel a blackboard-style lecture on chip design from first principles. Starting with AND and NOT gates, Reiner works up through register files, systolic arrays, clock synchronization, FPGAs, cache hierarchies, and finally the structural difference between a GPU and a TPU. The throughline is a single engineering tension: every compute unit is wasted if the chip spends its time moving data rather than multiplying numbers. ## [00:00] Building a multiply-accumulate from logic gates Reiner starts at the bottom: AND, OR, and NOT gates, wired together as metal traces on silicon. The key operation AI chips want to run is matrix multiplication, and inside that the primitive is a multiply-accumulate — multiply two numbers, add the result into an accumulator. Reiner walks through how a full adder is assembled from a handful of XOR and AND gates, and how those cascade into a bit-serial multiplier and ultimately a floating-point MAC. The precision hierarchy matters here: accumulating low-precision multiplications requires higher-precision accumulators, which is why AI chips run 8-bit multiply but 32-bit accumulate. > *"The main function that AI chips want to compute is the multiplication of matrices. Inside that, the fundamental primitive is a multiply-accumulate of pairs of numbers."* ## [16:20] Muxes and the cost of data movement Before Tensor Cores, GPUs and CPUs used the same structure: a register file holding a few dozen values, feeding into an ALU, writing back to the register file. Reiner shows that a mux — a circuit that selects between multiple inputs — is the hardware tool that lets you address arbitrary registers, and that the cost of this generality is measured in area and energy. Every read from an eight-entry register file requires a mux tree of depth three; every write requires a decoder of the same size. The bottleneck for AI workloads isn't the multiply itself but the round-trip through that register file. > *"We want to analyze the cost of the data movement from the register file to the ALU and back."* ## [25:59] How systolic arrays work The key insight behind TPUs: instead of doing one multiply-accumulate at a time and writing back to registers, bake an entire matrix-vector loop into hardware. A systolic array is a grid of MAC units where each cell passes its partial sum to the right and its input operand downward, so data flows through without ever touching a register file. Reiner explains the two wins this buys: more compute per unit of data fetched, and the ability to keep operands resident inside the array for the full inner product instead of re-loading them. The trade-off is inflexibility — you can only efficiently run the exact loop shape the hardware was designed for. > *"The idea of a systolic array is to go two levels of loops up and bake this entire loop out here into hardware."* ## [39:00] Clock cycles and pipeline registers With 100 billion transistors on a chip, synchronization between parallel units is non-negotiable. Reiner explains the clock: every nanosecond or so, the chip pauses all computation for a synchronization pulse before the next operation. Clock frequency is set by the longest combinational path — the deepest chain of logic gates that a signal must traverse in one cycle. Pipeline registers chop that path into shorter stages, letting each shorter segment run at a higher frequency, at the cost of latency: a fully pipelined 32-stage multiplier produces one result per cycle but takes 32 cycles for any single multiplication. > *"Every nanosecond or so, all circuitry in the chip will pause for a moment and synchronize. That is the clock cycle."* ## [51:40] FPGAs vs ASICs An FPGA is a sea of programmable logic blocks — lookup tables and flip-flops that can be wired together in software. An ASIC is a chip taped out for one purpose. Conceptually they're the same: AND/OR gates in a fixed clock cycle. The economics diverge at first copy: an FPGA costs $10K to program; a first ASIC tape-out costs $30M. FPGAs make sense for workloads that change monthly and need deterministic latency at high speed with less care about energy or throughput. Jane Street uses them for high-frequency trading exactly because the clock cycle is deterministic — no cache misses, no branch prediction, no interrupts. > *"The first FPGA costs you $10,000, whereas the first ASIC you make costs $30 million because it requires an entire tape-out."* ## [63:14] Cache vs scratchpad CPUs are non-deterministic partly because of the L1/L2 cache: a small fast memory that speculatively stores data the processor thinks it will need next. Cache misses — when the prediction is wrong — stall execution for hundreds of cycles. AI accelerators replace the cache with a scratchpad: explicitly programmer-managed SRAM where the compiler decides exactly what lives there and when. Groq and TPUs both advertise deterministic latency because they use scratchpads instead of caches. The scratchpad is simpler and faster but shifts the burden to the compiler. > *"Probably the most important source of non-determinism on a CPU is the CPU cache itself."* ## [67:16] Why CPU cores are much bigger than GPU cores A modern CPU has maybe 100 cores, each taking up far more die area per core than a GPU's thousands of SMs. The reason: CPU cores carry enormous out-of-order execution machinery — reorder buffers, branch predictors, speculative execution units — all aimed at keeping a single thread running fast on unpredictable workloads. A GPU SM strips most of that out. It runs many simple threads in lockstep (a warp), and when one thread stalls on a memory load, the hardware instantly switches to another warp at zero cost. The CPU pays silicon for per-thread speed; the GPU pays silicon for throughput across thousands of parallel threads. > *"If there are so few cores, what are you spending all of the die on?"* ## [71:49] Brains vs chips Dwarkesh pushes Reiner on the brain-versus-chip comparison. Two genuine differences: the brain has unstructured sparsity (any neuron can connect to any other), while hardware accelerators use structured sparsity (aligned blocks); and the brain's clock runs at tens of hertz versus gigahertz on silicon. Reiner notes that co-location of memory and compute — often cited as a brain advantage — is also present in modern AI chips: the weights sit in HBM right next to the matrix units. The energy constraint is the more interesting gap: the brain runs on 20 watts, chips on kilowatts, which may reflect fundamental differences in what the brain is optimized to do. > *"This is exactly the co-location, in some sense, of the memory and compute."* ## [75:22] A GPU is just a bunch of tiny TPUs At the top level, a TPU has a handful of large systolic arrays plus a vector unit. A GPU has hundreds of SMs, each of which contains a small matrix unit and a small vector unit — essentially a miniaturized TPU. The architectural difference is granularity: a TPU commits to a few large matrix operations; a GPU runs thousands of smaller ones in parallel. Inside each SM, Tensor Cores add a fixed-function matrix unit on top of the original scalar/vector pipeline, making modern GPUs a hybrid of the two paradigms. The "GPU is just tiny TPUs" framing collapses what seemed like fundamentally different architectures into a single continuum. > *"You can think of scaling this thing down into a really tiny unit with a smaller matrix unit and a smaller vector unit, and that is sort of what an SM is."* ## Entities - **Reiner Pope** (Person): CEO and co-founder of MatX; previously led TPU software and compiler work at Google Brain - **Dwarkesh Patel** (Person): host of the Dwarkesh Podcast; angel investor in MatX - **MatX** (Organization): AI chip startup building inference accelerators - **Google / Google Brain** (Organization): where Reiner worked on TPU architecture before MatX - **Jane Street** (Organization): high-frequency trading firm that relies on FPGAs for deterministic latency - **Groq** (Organization): AI inference chip company that advertises deterministic latency via scratchpad architecture - **Multiply-Accumulate (MAC)** (Concept): the fundamental operation of neural network inference — multiply two numbers, add into an accumulator - **Systolic Array** (Concept): a grid of MACs that passes data between cells without touching a register file, enabling high compute-to-bandwidth ratios - **FPGA** (Technology): Field-Programmable Gate Array — reprogrammable logic fabric used where workloads change frequently - **ASIC** (Technology): Application-Specific Integrated Circuit — custom silicon optimized for one workload - **TPU** (Technology): Google's Tensor Processing Unit, organized around a few large systolic arrays - **SM / Streaming Multiprocessor** (Technology): the GPU core unit, containing scalar, vector, and matrix (Tensor Core) execution resources

Reconstruyendo AlphaGo desde cero – Eric Jang
Eric Jang pasó su sabbático reconstruyendo AlphaGo con herramientas modernas, y el resultado es un recorrido técnico de dos horas y media que sirve también como lente para entender cómo funciona el RL en la práctica, y por qué el enfoque ingenuo de policy gradient que usan los LLMs tiene límites fundamentales que MCTS elude. La conversación avanza desde las reglas del Go hasta MCTS, la arquitectura neuronal, el autoentrenamiento y los datos fuera de política, y termina con lo que Jang observó al ejecutar un bucle de investigación de IA automatizada en su propio proyecto. ## [00:00] Fundamentos del Go El Go no se venció a la búsqueda por fuerza bruta porque se resolviera, sino porque se aprendió a aproximar. Jang explica qué lo llevó a reconstruir AlphaGo: el misterio de cómo una red de diez capas puede amortizar el costo de un árbol de juego cuyo factor de ramificación hace que la búsqueda exhaustiva sea literalmente más grande que el número de átomos del universo. Los primeros minutos cubren las reglas del juego: control de territorio, libertades, capturas, ko, y la convención de puntuación Tromp-Taylor, que resuelve posiciones ambiguas de manera algorítmica en lugar de depender del consenso humano. La diferencia en la puntuación importa porque se traduce directamente en cómo las computadoras deben evaluar posiciones: un humano reconoce de un vistazo que un grupo está rodeado y acepta su suerte, mientras que una computadora necesita una regla inequívoca para contar las intersecciones disputadas al final de la partida. > *"Cuando vi los primeros avances de AlphaGo en 2014, 2015, 2016 y en adelante, fue profundo ver cuán inteligentes podían volverse los sistemas de IA y qué clase de complejidad computacional podían abordar con deep learning."* ## [08:06] Monte Carlo Tree Search En lugar de construir el árbol completo del juego (361 movimientos legales, partidas de 300 movimientos, un espacio de búsqueda que supera el número de átomos del universo), AlphaGo usa MCTS para seleccionar de forma iterativa qué ramas del árbol vale la pena expandir. La estructura de datos central es un nodo por estado del tablero, que almacena un conteo de visitas y un valor Q: el promedio acumulado de la tasa de victorias en todos los rollouts que pasan por ese nodo. La fórmula de selección de acción (PUCT) equilibra explotación y exploración: un bonus que crece logarítmicamente empuja al algoritmo hacia nodos poco visitados y luego decae a medida que se acumulan simulaciones y Q se vuelve confiable. Jang traza por qué este enfoque derivado de UCB acota el arrepentimiento, por qué el determinismo del Go hace que las probabilidades en MCTS sean artefactos del promediado de Monte Carlo y no de una estocasticidad real, y cómo el árbol de búsqueda puede podarse fusionando posiciones equivalentes por transposición. > *"El avance conceptual central de AlphaGo fue usar redes neuronales para hacer tratable este problema de búsqueda."* ## [31:53] Qué hace la red neuronal Dos redes reemplazan dos operaciones costosas dentro de MCTS. La red de valor mapea un estado del tablero a un escalar de probabilidad de victoria, evitando la necesidad de extender partidas hasta el estado terminal. La red de política genera una distribución sobre los movimientos legales, concentrando el árbol de búsqueda en los hijos prometedores y alejándolo de la larga cola de movimientos irrelevantes. Jang probó tanto ResNets como transformers en su reimplementación. Para el régimen de pocos datos de una configuración personal con GPU, las ResNets superaron a los transformers: los transformers necesitan atención global para conectar características del tablero que están lejos entre sí, pero también requieren más datos para aprender invarianzas locales. La intuición arquitectónica clave de KataGo fue agregar características globales explícitamente a través de la pila residual, de modo que los enfrentamientos en lados opuestos del tablero de 19x19 pudieran influirse mutuamente sin necesitar atención completa. > *"Para regímenes de pocos datos, mi experiencia es que las ResNets todavía superan a los transformers y te dan más por tu dinero con presupuestos más bajos."* ## [01:00:22] Autoentrenamiento El autoentrenamiento es donde AlphaGo pasa de no saber nada a un nivel sobrehumano. Después de cada partida, MCTS produce una distribución de movimientos más concentrada que el prior de la red de política, y esa distribución más afilada se convierte en el objetivo de entrenamiento para la cabeza de política. La red de política se destila hacia la salida de MCTS, lo que significa que cada generación siguiente de partidas parte de un prior mejor y obtiene más mejora por paso de búsqueda. Jang lo enmarca como escalado en tiempo de inferencia con un dividendo compuesto: destilar 1.000 pasos de simulación de MCTS en la red de política desplaza el punto de partida de la siguiente ronda de entrenamiento, de modo que otros 1.000 pasos dan una tasa de victoria que habría requerido más de 2.000 sin destilación. Y algo crucial: cada movimiento de cada partida genera un objetivo de supervisión, no solo el ganador, que es por qué la varianza de la señal de aprendizaje es mucho menor que con los enfoques ingenuos de policy gradient. > *"La belleza de cómo AlphaGo se entrena a sí mismo es que puede tomar este proceso de búsqueda final, el resultado del proceso de búsqueda, y decirle a la red de política: 'En lugar de que MCTS haga todo ese trabajo para llegar aquí, ¿por qué no lo predices directamente desde el principio?'"* ## [01:25:27] Enfoques alternativos de RL Jang construye un experimento mental cuidadoso: ¿qué pasaría si reemplazaras el objetivo de MCTS por el enfoque ingenuo de policy gradient que usan los LLMs: encontrar al ganador de la partida y reforzar todos los movimientos de esa partida? En una liga de 100 agentes igualmente emparejados donde uno logra un récord de 51-49 por un único movimiento decisivo, el conjunto de datos de entrenamiento está abrumadoramente diluido con movimientos que no aportan ninguna señal. Ese movimiento informativo queda enterrado entre unos 30.000 irrelevantes. Este problema de asignación de crédito es la raíz de por qué existen las funciones de ventaja y las líneas base en RL. Restar una línea base de valor convierte la señal de retorno bruta en una ventaja: cuánto mejor que el promedio fue cada acción, lo que reduce drásticamente la varianza del gradiente. Los métodos Q-learning y TD aproximan esa ventaja sin necesitar rollouts completos, que es por qué son importantes en dominios donde MCTS no está disponible. > *"Lo que importa es esto: por cada acción que tomamos, hicimos una búsqueda bastante exhaustiva con MCTS para ver si podíamos hacerlo mejor, y vamos a mejorar cada acción logrando que la red de política prediga ese resultado."* ## [01:45:36] Por qué MCTS no funciona para los LLMs La fórmula de exploración PUCT asume un espacio de acciones discreto y acotado, y una función de valor que generaliza entre posiciones. El Go cumple ambas condiciones. El razonamiento en LLMs no cumple ninguna: el vocabulario de tokens es tan grande que casi nunca se vuelve a visitar la misma secuencia parcial, y no existe una función de valor a nivel de posición que indique de forma confiable si una cadena de pensamiento parcialmente completada va por buen camino. Jang señala que los LLMs exhiben algo que superficialmente se parece a la búsqueda en árbol: reconsideración, retroceso, cautela, pero esto surge de un comportamiento en contexto y no de una construcción explícita de árbol. Deja abierta la posibilidad de que la búsqueda hacia adelante regrese de alguna forma, en particular para dominios como las matemáticas donde los estados intermedios tienen una estructura lógica más rígida. El cuello de botella fundamental es la ausencia de una función de valor confiable y eficiente a nivel de token. > *"En un LLM, lo más probable es que nunca vayas a muestrear el mismo hijo más de una vez. Si tienes varios pasos de razonamiento, porque el lenguaje es tan amplio y abierto, un conjunto discreto de acciones no es realmente una opción adecuada para un LLM."* ## [02:00:58] Entrenamiento fuera de política Dwarkesh plantea un enigma: todos los investigadores de IA advierten contra el entrenamiento fuera de política, pero AlphaGo Zero funciona bien con un gran replay buffer lleno de partidas generadas por versiones antiguas de la política. Jang lo resuelve desde la perspectiva de DAgger: lo que importa no es si los datos son estrictamente on-policy, sino si la distribución de estados en el buffer cubre los estados que la política actual visitará, más un vecindario razonable alrededor de ellos. El replay buffer funciona en AlphaGo porque los estados de partida de checkpoints recientes siguen estando cerca de la distribución de la política actual. El modo de fallo, etiquetar estados tan alejados de la política actual que el agente aprende acciones óptimas para posiciones que nunca alcanzará, es un riesgo real en robótica, donde el desplazamiento distribucional es severo. La receta práctica que surgió de sistemas como QT-Opt es usar datos fuera de política para modelar la recompensa y mantener el gradiente de política on-policy. > *"Lo que quieres en un algoritmo como este es tener principalmente estados que visitarías, pero luego un porcentaje pequeño o razonable de estados en este tubo de alta dimensión alrededor de tus trayectorias óptimas."* ## [02:11:51] El RL es aún más ineficiente de lo que pensabas Dwarkesh expone un argumento de ineficiencia en dos dimensiones. La primera es la que todos conocen: el RL con policy gradient requiere rollouts de trayectoria completa antes de que llegue cualquier señal de aprendizaje, de modo que a medida que los agentes abordan tareas de mayor horizonte, las muestras por FLOP se desploman. La segunda dimensión es la de bits por muestra. Al principio del entrenamiento, un LLM con un vocabulario de 100.000 tokens que tiene que descubrir "blue" por muestreo aleatorio necesita del orden de 100.000 rollouts para ver un solo éxito, mientras que la función de pérdida de entropía cruzada supervisada le dice al modelo exactamente cuánto se alejó su distribución de "blue" en cada paso. MCTS escapa de ambos problemas. Produce un objetivo de supervisión en cada movimiento individual, y ese objetivo es estrictamente mejor que la política actual, no una señal binaria de victoria/derrota distribuida entre miles de tokens. La observación de Jang: nunca te encuentras en una situación donde MCTS no da ninguna señal, salvo que la política ya haya convergido a igualar la distribución de MCTS. > *"Nunca estás en una situación en la que MCTS no te dé señal, a menos que tu distribución de MCTS converja exactamente a lo que predice tu red de política."* ## [02:22:05] Investigadores de IA automatizados Jang llevó gran parte de su proyecto de AlphaGo a través de un bucle automatizado de codificación con LLMs, y ofrece una visión de primera mano sobre dónde la automatización de la investigación en IA funciona y dónde todavía falla. En la optimización de hiperparámetros, los modelos actuales hacen trabajo genuino de nivel investigador junior: diagnostican problemas de flujo de gradiente, reescriben aumentaciones del cargador de datos y logran mejoras medibles de perplejidad con presupuestos fijos. En la ejecución de experimentos y la generación de gráficos, una descripción sencilla de la tarea genera un conjunto experimental completo con análisis. Lo que los modelos no pueden hacer de forma confiable es el pensamiento lateral: reconocer que una línea de investigación es estructuralmente poco prometedora y saltar a un enfoque diferente antes de acumular más experimentos sin salida. Jang se encontró con esto repetidamente: los modelos insistían en una línea sin salida en lugar de dar un paso atrás y preguntarse si esa era la dirección correcta. Su tesis es que esto es un problema de señal de entrenamiento: construir entornos de RL con el bucle externo adecuado, como el Go, puede ser lo que finalmente enseñe a los modelos a escapar de los callejones sin salida de la investigación. > *"Lo que encuentro es que los modelos cerrados actuales a los que el público puede acceder hoy no parecen ser especialmente buenos para seleccionar cuál debería ser el siguiente experimento en una línea de trabajo dada. No parecen capaces de dar un paso atrás y hacer el pensamiento lateral de: 'Espera, esta línea realmente no tiene sentido.'"* ## Entidades - **Eric Jang** (Persona): VP de IA en 1X Robotics; anteriormente investigador científico senior en Google Brain/DeepMind Robotics; reconstruyó AlphaGo durante su sabbático. - **Dwarkesh Patel** (Persona): Presentador del Dwarkesh Podcast; codesarrolla durante la entrevista el análisis de ineficiencia de RL en bits por FLOP. - **AlphaGo / AlphaZero** (Software): Sistemas de DeepMind para jugar al Go que combinan MCTS con redes neuronales profundas; el eje técnico del episodio. - **KataGo** (Software): Motor de Go de código abierto creado por David Wu (Jane Street) que logró una reducción de cómputo de 40x respecto a AlphaGo Zero; la implementación de referencia principal de Jang. - **Monte Carlo Tree Search (MCTS)** (Concepto): Algoritmo de búsqueda iterativo que equilibra explotación y exploración mediante UCB/PUCT; la lente analítica central del episodio. - **Problema de asignación de crédito** (Concepto): Dificultad en RL para determinar qué acciones de una trayectoria larga causaron un resultado positivo; motiva las funciones de ventaja, las líneas base y las redes de valor. - **DAgger** (Concepto): Algoritmo Dataset Aggregation; explica por qué los replay buffers en AlphaGo son aceptables siempre que los estados del buffer se mantengan cerca de la distribución de la política actual. - **Andrej Karpathy** (Persona): Citado por la frase "succionar supervisión por una pajita" para describir la señal de aprendizaje escasa del RL con policy gradient en trayectorias largas de tokens.

Por qué la IA todavía no reemplazará a los matemáticos – Terence Tao
Terence Tao reflexiona sobre el papel cambiante de la IA en las matemáticas y sostiene que, aunque automatizará muchas tareas rutinarias, no reemplazará por completo a los matemáticos humanos, sino que desplazará su enfoque hacia nuevas fronteras. Subraya el futuro de la colaboración humano-IA y la naturaleza impredecible del impacto a largo plazo de la IA en el descubrimiento científico. ## [00:10] El papel actual de la IA en las matemáticas de frontera Terence Tao explica que la IA ya está haciendo «matemáticas de frontera» que los humanos no pueden realizar, aunque se trata de un tipo distinto de frontera. Lo compara con cómo las calculadoras expandieron las capacidades matemáticas en el pasado: asumieron tareas más allá del alcance humano, pero de un modo especializado. > *En cierto modo, ya están haciendo matemáticas de frontera superinteligentes que los humanos no pueden hacer, pero es una frontera distinta a la que estamos acostumbrados.* ## [00:52] La IA como herramienta de automatización, no de reemplazo Tao predice que, en una década, la IA se ocupará de muchas tareas rutinarias que hoy realizan los matemáticos, permitiendo a los humanos concentrarse en problemas más complejos e importantes. Traza paralelismos con cambios históricos: los ordenadores automatizaron trabajos antes realizados por «computadoras humanas», y la secuenciación del genoma se automatizó sin que la genética dejara de evolucionar a nuevas escalas. > *En una década, muchas cosas que los matemáticos hacen actualmente… podrán hacerse con IA. Pero descubriremos que eso no era, en realidad, la parte más importante de lo que hacemos.* ## [02:46] El futuro de la colaboración humano-IA en matemáticas Dwarkesh Patel pregunta sobre la posibilidad de que la IA resuelva de forma autónoma los Problemas del Milenio. Terence Tao cree que el «híbrido humano más IA» dominará las matemáticas durante mucho más tiempo, pues la IA actual aún carece de todos los ingredientes necesarios para reemplazar por completo las tareas intelectuales y funciona más bien como una herramienta complementaria. > *Creo, de verdad, que ese híbrido humano más IA va a dominar las matemáticas durante mucho más tiempo.* ## [03:43] Impacto impredecible en el descubrimiento científico Tao reconoce que, si bien la IA acelerará la ciencia y los nuevos descubrimientos, también existe la posibilidad de que inhiba ciertos tipos de progreso al «destruir la serendipia». Concluye que el impacto futuro de la IA en el descubrimiento científico es altamente impredecible. > *Es posible que, al destruir de algún modo la serendipia, acabemos inhibiendo ciertos tipos de progreso.* ## Entidades - **Terence Tao** (Persona): invitado, matemático destacado de nuestra época. - **Dwarkesh Patel** (Persona): presentador del pódcast. - **IA (AI)** (Concepto): inteligencia artificial, discutida en su papel en las matemáticas y el descubrimiento científico. - **Mathematica / Wolfram Alpha** (Software): herramientas de cálculo mencionadas como ejemplos de automatización en matemáticas. - **Problemas del Milenio (Millennium Prize Problems)** (Concepto): siete problemas matemáticos no resueltos, con un premio de un millón de dólares por cada solución.

Terence Tao – Cómo usa la IA el mejor matemático del mundo
Tao y Dwarkesh usan el descubrimiento del movimiento planetario de Kepler como lente para examinar qué está cambiando realmente la IA en la ciencia. Tao argumenta que la generación de hipótesis ahora es casi gratuita, por lo que el cuello de botella se desplaza hacia la evaluación, la revisión por pares y la prueba del tiempo. Las IA actuales ganan en amplitud (prueban cada técnica estándar en cada problema) mientras los humanos ganan en profundidad (construyen acumulativamente sobre el progreso parcial), así que las configuraciones híbridas dominarán la matemática al menos durante otra década. ## [00:00] Kepler era un LLM de alta temperatura Tao recuenta cómo llegó Kepler a las tres leyes del movimiento planetario. Kepler partió de una teoría errónea pero bella —sólidos platónicos inscritos entre las órbitas de los planetas— y solo la abandonó tras procesar durante años las observaciones a simple vista robadas a Tycho Brahe. Las elipses, la ley de las áreas iguales y la relación cubo-cuadrado surgieron de un análisis de datos que duró una década, con la explicación de Newton un siglo después. La lectura de Dwarkesh: Kepler se parece a un LLM de alta temperatura que recorre relaciones aleatorias contra un conjunto de datos verificable. Tao coincide en la mecánica pero matiza el cuello de botella. La generación de ideas ya era barata: Kepler no carecía de teorías. Lo que necesitaba eran los datos de Brahe, un orden de magnitud mejores, y la paciencia para descartar las ideas que los datos refutaban. > *Pero como tú dices, tiene que ir acompañado de una cantidad igual de verificación, de lo contrario es basura.* ## [11:44] ¿Cómo sabríamos si hay un nuevo concepto unificador entre montones de basura generada por IA? Tao: si la IA ha llevado la generación de ideas a un coste casi nulo, la revisión por pares y la prueba del tiempo se convierten en la nueva restricción. Las revistas ya se ahogan en envíos generados por IA. El valor de cualquier idea depende de lo que la ciencia posterior haga con ella —Copérnico era menos preciso que Ptolomeo hasta que Kepler completó el cuadro—, así que la evaluación es difícil de automatizar desde dentro del momento. Dwarkesh pregunta cómo identificaría la ciencia un concepto unificador al estilo Bell Labs —el bit de Shannon, el transformer— enterrado entre millones de papers mediocres. La respuesta de Tao apunta a la parte que quizás siga siendo humana: los científicos no solo producen teorías, construyen relatos que convencen a otros científicos de invertir años en el seguimiento. La prosa de Darwin hizo el trabajo que las ecuaciones latinas de Newton no hacían. > *La IA ha reducido el coste de la generación de ideas a casi cero, de manera muy similar a como internet redujo el coste de la comunicación a casi cero.* ## [26:10] El excedente deductivo Tao sobre la señal inexplorada en los datos existentes. La astronomía ha sido la disciplina que extrae el máximo de información del mínimo de datos durante siglos, lo que también explica por qué los fondos cuantitativos contratan preferentemente a doctorados en astronomía. Pone un ejemplo favorito: investigadores midieron con qué frecuencia los científicos realmente leían los papers que citaban rastreando qué erratas se propagaban a través de las cadenas de citas. Propone aplicar el mismo enfoque sociológico de la ciencia al propio progreso de la IA: analizar patrones de citas, menciones en conferencias y otras huellas para detectar si un resultado constituyó realmente un avance, en lugar de esperar a que la prueba del tiempo lo haga lentamente. > *Una conclusión fue que el excedente deductivo en muchos campos podría ser mucho mayor de lo que la gente cree.* ## [30:31] El sesgo de selección en los descubrimientos de IA publicados La IA ha resuelto aproximadamente 50 de los ~1.100 problemas de Erdős y luego se ha estancado. Tao explica el efecto de selección: esos 50 tenían literatura casi nula —bastaba con una técnica oscura más un resultado conocido—, y las herramientas de IA son excelentes para "probar cada combinación estándar." Cuando el problema tiene el 80% del trabajo hecho por métodos existentes, la IA lo supera. Cuando necesita una técnica genuinamente nueva, las herramientas se detienen, y la tasa de éxito por problema en los barridos sistemáticos es del 1-2%. La metáfora de Tao: las herramientas de IA son robots saltadores sueltos en una cordillera, en la oscuridad. Pueden superar muros bajos que los humanos no alcanzan, pero no pueden agarrar un saliente, quedarse ahí y ascender desde el progreso parcial. La lectura optimista —una vez que las IA alcanzan un nivel determinado, puedes ejecutar un millón de copias en paralelo sobre un millón de problemas, algo que ninguna comunidad humana puede hacer— es también la razón estructural por la que la ciencia necesita nuevos paradigmas que realmente aprovechen la amplitud. > *Destacan en amplitud, y los humanos destacan en profundidad, al menos los expertos humanos.* ## [46:43] La IA hace los papers más ricos y amplios, pero no más profundos Tao sobre su propio modo de trabajo: los papers ahora incluyen más código, más figuras y revisiones bibliográficas más profundas, porque las tareas auxiliares se han abaratado unas 5 veces. El núcleo real —resolver la parte más difícil de un problema— sigue ocurriendo con papel y bolígrafo. Dudaría en llamarse "2 veces más productivo" porque la métrica no es unidimensional; lo que cambió es el tipo de paper que escribe, no la tasa a la que responde la pregunta con la que comenzó. La distinción entre astucia e inteligencia llega al mismo punto. Cuando dos humanos colaboran en un problema de matemáticas, cada prototipo fallido se convierte en un punto de apoyo para el siguiente. Con las IA actuales, una nueva sesión olvida lo que descubrió la anterior. Falta el paso de elevación acumulativa: solo existe la prueba y error bruta y, eventualmente, la absorción en la siguiente fase de entrenamiento. > *Ha hecho los papers más ricos y amplios, pero no necesariamente más profundos.* ## [53:00] Si la IA resuelve un problema, ¿pueden los humanos extraer comprensión de eso? ¿Podría una IA demostrar la hipótesis de Riemann en Lean y dejarnos sin comprensión? Tao no está preocupado. Lean tiene la propiedad de que cualquier prueba puede descomponerse de forma atómica: cada lema puede inspeccionarse, ablacionarse y verificarse de forma aislada. Así que incluso una prueba generada de 3.000 líneas se convierte en materia prima: otras IA pueden refactorizarla para ganar elegancia, otros humanos pueden extraer el contenido conceptual, y el artefacto sigue siendo útil aunque la derivación original fuera opaca. Predice toda una profesión de matemáticos cuyo trabajo sea desmontar grandes pruebas generadas por Lean y encontrar las ideas dentro de ellas —una especie de arqueología de pruebas, con juicio humano y herramientas de ablación por IA. > *Sacarás mucho más partido de la interacción de los humanos colaborando con estas herramientas.* ## [59:20] Necesitamos un lenguaje semiformal para la manera en que los científicos realmente se hablan entre sí Dwarkesh pregunta cómo sería un lenguaje semiformal para estrategias matemáticas —en contraposición a pruebas matemáticas—. Tao recorre la pregunta a través del teorema de los números primos de Gauss —la primera conjetura estadística importante de las matemáticas, derivada de datos brutos antes de que existiera ninguna prueba— y de la conjetura de los primos gemelos, en la que los matemáticos creen porque el modelo aleatorio de los primos la predice. Las matemáticas tienen tanto pruebas rigurosas como heurísticas rigurosas; solo el lado de las pruebas se ha formalizado en algo que Lean puede verificar. El motivo por el que el lado heurístico no se ha formalizado: cualquier evaluador comprobable mediante RL se convierte en objetivo de explotación, y la parte subjetiva de "este argumento es convincente" no admite aún un marco que pueda ser atacado. Tao desearía contar con una manera de evaluar la generación de conjeturas y la selección de estrategias a escala, posiblemente ejecutando IA pequeñas en universos matemáticos de juguete y observando qué estrategias emergen. > *Hay algún aspecto subjetivo de la ciencia que no sabemos cómo capturar de una manera que nos permita insertar la IA en él de forma útil.* ## [69:48] Cómo ocupa su tiempo Terry Tao sobre cómo absorbe nuevos subcampos. Se ubica como un zorro en el sentido de Berlin —sabe un poco de todo, y ocasionalmente se vuelve erizo cuando es necesario. El motor es una obsesión completista: si otro matemático puede demostrar un resultado con una técnica que él no conoce, tiene que descubrir cuál es el truco. (Tuvo que dejarse los videojuegos por la misma razón.) La colaboración con otros matemáticos es el vehículo principal, y escribir en su blog es el apoyo de memoria que desarrolló después de perder repetidamente argumentos seis meses después de haberlos derivado. En su agenda, Tao deja espacio deliberado para la serendipia. Detestaria optimizar su tiempo tan exhaustivamente que nunca asistiera a una reunión fuera de su zona de confort. El año que pasó en el Instituto de Estudios Avanzados confirmó la trampa: dos semanas de investigación pura fueron excelentes, luego se le agotó la inspiración. El descubrimiento accidental en el siguiente estante de la biblioteca, la conversación casual en el pasillo y la reunión a la que asistió a regañadientes estaban haciendo más trabajo del que parecía. > *Esas interacciones fortuitas puede que no parezcan óptimas, pero en realidad son muy importantes.* ## [77:05] Los híbridos humano-IA dominarán la matemática por mucho más tiempo ¿Cuándo hará la IA las matemáticas por sí sola? Tao lo reencuadra: la IA ya hace matemáticas que los humanos no pueden hacer, desde las calculadoras, solo en una frontera diferente. En aproximadamente una década espera que gran parte de lo que actualmente hacen los estudiantes de posgrado —aplicar técnicas estándar, revisar la literatura— pase a la IA, pero el campo subirá de nivel como lo hizo cuando los sistemas de álgebra computacional absorbieron la integración simbólica. La genética no terminó cuando la secuenciación se abarató; escaló hasta los ecosistemas. Las matemáticas harán lo mismo. Su consejo a los estudiantes que ingresan hoy en matemáticas: asumir el cambio, pero obtener las credenciales a la manera tradicional, porque por ahora no hay sustituto para trabajar las matemáticas por el camino clásico. Al mismo tiempo, ser lo suficientemente adaptable para utilizar modos de investigación completamente nuevos a medida que aparezcan, incluidos los que aún no existen. El hecho inusual es que con herramientas de IA y Lean, un estudiante de secundaria puede contribuir hoy a la investigación matemática real, algo que no era posible hace cinco años. > *Creo que los híbridos de humanos más IA dominarán las matemáticas por mucho más tiempo.* ## Entidades - **Terence Tao** (Persona): Medallista Fields (2006), matemático de la UCLA, escribe con regularidad sobre el papel de la IA en la investigación matemática. - **Dwarkesh Patel** (Persona): Presentador del Dwarkesh Podcast; entrevistas en profundidad sobre IA, ciencia y tecnología. - **Johannes Kepler** (Persona): Astrónomo (1571-1630) que derivó las tres leyes del movimiento planetario a partir de las observaciones de Tycho Brahe. - **Tycho Brahe** (Persona): Astrónomo danés de observación a simple vista cuyas décadas de observaciones planetarias fueron el conjunto de datos que Kepler necesitaba. - **Lean** (Software): Asistente de pruebas en el que las demostraciones matemáticas se formalizan y pueden verificarse, descomponerse y ablacionarse de forma atómica. - **Erdős problems** (Concepto): Los aproximadamente 1.100 problemas abiertos planteados por Paul Erdős; la IA ha resuelto ~50, casi todos con literatura previa casi nula. - **El excedente deductivo** (Concepto): La idea de que los datos existentes ya codifican mucho más conocimiento derivable del que se ha extraído, con la astronomía como modelo. - **Hipótesis de Riemann** (Concepto): Conjetura no resuelta sobre la distribución de los números primos; el caso de prueba para saber si una demostración por IA avanzaría la comprensión matemática humana.