Volver a PodcastsDwarkesh Patel
Terence Tao – Cómo usa la IA el mejor matemático del mundo
Today, I'm chatting with Terence Tao, who needs no introduction.
Hoy estoy charlando con Terence Tao, quien no necesita presentación.
Terence, I want to begin by having you retell the story of how Kepler discovered the laws of planetary motion because I think this will be a great jumping off point to talk about AI for math.
Terence, quiero empezar pidiéndote que cuentes de nuevo la historia de cómo Kepler descubrió las leyes del movimiento planetario, porque creo que será un excelente punto de partida para hablar de la IA en matemáticas.
I've always had an amateur interest in astronomy.
Siempre he tenido un interés amateur por la astronomía.
I've loved stories of how the early astronomers worked out the nature of the universe.
Me han encantado las historias de cómo los primeros astrónomos descubrieron la naturaleza del universo.
Kepler was building on the work of Copernicus, who was himself building on the work of Aristarchus.
Kepler partía del trabajo de Copérnico, quien a su vez partía del trabajo de Aristarco.
Copernicus very famously proposed the heliocentric model, that instead of the planets and the Sun going around the Earth, the Sun was at the center of the solar system and the other planets were going around the Sun.
Copérnico propuso, muy célebremente, el modelo heliocéntrico: en lugar de que los planetas y el Sol giraran alrededor de la Tierra, el Sol estaba en el centro del sistema solar y los demás planetas giraban a su alrededor.
Copernicus proposed that the orbits of the planets were perfect circles.
Copérnico propuso que las órbitas de los planetas eran círculos perfectos.
His theory fit the observations that the Greeks, the Arabs, and the Indians had worked out over centuries.
Su teoría encajaba con las observaciones que griegos, árabes e indios habían elaborado durante siglos.
Kepler learned about these theories in his studies, and he made this observation that the ratios of the size of the orbits that Copernicus predicted seemed to have some geometric meaning.
Kepler conoció estas teorías en sus estudios y observó que las proporciones de los tamaños de las órbitas que Copérnico predijo parecían tener algún significado geométrico.
He started proposing that if you take the orbit of the Earth and you enclose it in a cube, the outer sphere that encloses the cube almost perfectly matched the orbit of Mars, and so forth.
Empezó a proponer que si tomas la órbita de la Tierra y la encierras en un cubo, la esfera exterior que rodea al cubo coincide casi perfectamente con la órbita de Marte, y así sucesivamente.
There were six planets known at the time and five gaps between them, and there were five perfect Platonic solids: the cube, the tetrahedron, icosahedron, octahedron, and dodecahedron.
Había seis planetas conocidos en esa época y cinco huecos entre ellos, y existían cinco sólidos platónicos perfectos: el cubo, el tetraedro, el icosaedro, el octaedro y el dodecaedro.
So he had this theory, which he thought was absolutely beautiful, that you could inscribe these Platonic solids between the spheres of the planets.
Así que tenía esta teoría, que le parecía absolutamente hermosa, de que se podían inscribir esos sólidos platónicos entre las esferas de los planetas.
It seemed to fit, and it seemed to him that God's design of the planets was matching this mathematical perfection of the Platonic solids.
Parecía encajar, y le daba la impresión de que el diseño divino de los planetas coincidía con esa perfección matemática de los sólidos platónicos.
He needed data to confirm this theory.
Necesitaba datos para confirmar su teoría.
At the time, there was only one really high-quality dataset in existence.
En ese momento solo existía un conjunto de datos realmente de alta calidad.
Tycho Brahe, this very wealthy, eccentric Danish astronomer, had managed to convince the Danish government to fund this extremely expensive observatory.
Tycho Brahe, un astrónomo danés muy adinerado y excéntrico, había logrado convencer al gobierno danés de financiar un observatorio extremadamente costoso.
In fact, it was an entire island where he had taken decades of observations of all the planets, like Mars and Jupiter, at least every night for which the weather was clear, with the naked eye.
De hecho, era una isla entera donde había tomado décadas de observaciones de todos los planetas, como Marte y Júpiter, al menos cada noche en que el cielo estaba despejado, a simple vista.
He was the last of the naked-eye astronomers.
Fue el último de los astrónomos que observaron a ojo desnudo.
He had all this data which Kepler could use to confirm his theory.
Tenía todos esos datos que Kepler podía usar para confirmar su teoría.
Kepler started working with Tycho, but Tycho was very jealous of the data.
Kepler empezó a trabajar con Tycho, pero Tycho era muy celoso de los datos.
He only gave him little bits of it at a time.
Solo le daba pequeños fragmentos de vez en cuando.
Kepler eventually just stole the data.
Kepler al final simplemente robó los datos.
He copied it and had to have a fight with Brahe's descendants.
Los copió y tuvo que enfrentarse a los descendientes de Brahe.
He did get the data, and then he worked out, to his disappointment, that his beautiful theory didn't quite work.
Consiguió los datos y entonces comprobó, para su decepción, que su hermosa teoría no funcionaba del todo.
The data was off from his Platonic solid theory by 10% or something.
Los datos diferían de su teoría de los sólidos platónicos en un 10% o algo así.
He tried all kinds of fudges, moving the circles around, and it didn't quite work.
Probó todo tipo de ajustes, moviendo los círculos de aquí para allá, y no terminaba de funcionar.
But he worked on this problem for years and years, and eventually, he figured out how to use the data to work out the actual orbits of the planets.
Pero trabajó en este problema durante años y años, y finalmente descubrió cómo usar los datos para determinar las órbitas reales de los planetas.
That was an incredibly clever, genius amount of data analysis.
Fue un análisis de datos de una inteligencia y un genio increíbles.
And then he worked out that the orbits were actually ellipses, not circles, which was shocking for him.
Y luego descubrió que las órbitas eran en realidad elipses, no círculos, lo cual fue un shock para él.
So he worked out the two laws of planetary motion: the ellipses, and also that equal areas sweep out equal times.
Así estableció las dos primeras leyes del movimiento planetario: las elipses, y también que las áreas iguales se barren en tiempos iguales.
Then ten years later, after collecting a lot of data—the furthest planets like Saturn and Jupiter were the hardest for him to work out—he finally worked out this third law, that the time it takes for a planet to complete its orbit was proportional to some power of the distance to the Sun.
Luego, diez años después, tras recopilar muchos más datos, los planetas más lejanos como Saturno y Júpiter fueron los más difíciles de determinar, y finalmente estableció esta tercera ley: el tiempo que tarda un planeta en completar su órbita es proporcional a alguna potencia de la distancia al Sol.
These are the three famous Kepler's laws of motion.
Esas son las tres famosas leyes del movimiento de Kepler.
He had no explanation for them.
No tenía ninguna explicación para ellas.
It was all driven by experiment, and it took Newton a century later to give a theory that explained all three laws at once.
Todo estaba impulsado por el experimento, y tuvo que llegar Newton un siglo después para dar una teoría que explicara las tres leyes a la vez.
The take I want to try on you is that Kepler was a high-temperature LLM.
La lectura que quiero proponerte es que Kepler era un LLM de alta temperatura.
Newton comes up with this explanation of why the three laws of planetary motion must be true.
Newton llega con esta explicación de por qué las tres leyes del movimiento planetario tienen que ser ciertas.
Of course, the way that Kepler discovers the laws of planetary motion, or figures out the relative orbits of the different planets, is as you say a work of genius.
Por supuesto, la manera en que Kepler descubre las leyes del movimiento planetario, o determina las órbitas relativas de los diferentes planetas, es como dices una obra de genio.
But through his career, he's just trying random relationships.
Pero a lo largo de su carrera, simplemente iba probando relaciones al azar.
In fact, in the book in which he writes down the third law of planetary motion, it's an aside on The Harmonics of the World, which is just a book about how all these different planets have these different harmonies.
De hecho, en el libro donde escribe la tercera ley del movimiento planetario, aparece como una nota al margen en La Armonía del Mundo, que es simplemente un libro sobre cómo todos esos planetas tienen distintas armonías.
And the reason there's so much famine and misery on Earth is because the Earth is mi-fa-mi, that's the note of Earth.
Y la razón de que haya tanta hambre y miseria en la Tierra es que la Tierra es mi-fa-mi, esa es la nota de la Tierra.
It's all this random astrology, but in there is the cube-square law, which tells you what relationship the period has to a planet's distance from the Sun.
Es pura astrología aleatoria, pero en medio de todo eso está la ley del cubo del cuadrado, que dice qué relación tiene el período con la distancia de un planeta al Sol.
As you were detailing, if you add that to Newton's F=ma and the equation for centripetal acceleration, you get the inverse-square law.
Como ibas detallando, si sumas eso a F=ma de Newton y la ecuación de la aceleración centrípeta, obtienes la ley del cuadrado inverso.
And so Newton works that out.
Y así Newton lo dedujo.
But the reason I think this is an interesting story is that I feel LLMs can do the kind of thing of trying random relationships for twenty years, some of which make no sense, as long as there's a verifiable data bank like Brahe's dataset.
Pero la razón por la que creo que esta historia es interesante es que siento que los LLMs pueden hacer el tipo de cosas que consisten en probar relaciones aleatorias durante veinte años, algunas de las cuales no tienen ningún sentido, siempre que haya un banco de datos verificable como el conjunto de datos de Brahe.
"Ok, I'm going to try out random things about musical notes, Platonic objects, or different geometries, I have this bias that there's some important thing about the geometry of these orbits."
"De acuerdo, voy a probar cosas aleatorias sobre notas musicales, objetos platónicos o diferentes geometrías; tengo este sesgo de que hay algo importante en la geometría de estas órbitas."
Then one thing works.
Y luego una cosa funciona.
As long as you can verify it, these empirical regularities can then drive actual deep scientific progress.
Siempre que puedas verificarlo, estas regularidades empíricas pueden impulsar un auténtico progreso científico profundo.
Traditionally, when we talk about the history of science, idea generation has always been the prestige part of science.
Tradicionalmente, cuando hablamos de la historia de la ciencia, la generación de ideas siempre ha sido la parte más prestigiosa de la ciencia.
A scientific problem comes with many steps.
Un problema científico consta de muchos pasos.
You have to identify a problem, and then you have to identify a good, fruitful problem to work on.
Hay que identificar un problema, y luego identificar un problema bueno y fructífero en el que trabajar.
Then you need to collect data, figure out a strategy to analyze the data, and make a hypothesis.
Luego hay que recopilar datos, diseñar una estrategia para analizarlos y formular una hipótesis.
At this point, you need to propose a good hypothesis, and then you need to validate.
En este punto hay que proponer una buena hipótesis, y después hay que validarla.
Then you need to write things up and explain.
Después hay que redactarlo todo y explicarlo.
There are a dozen different components.
Son una docena de componentes diferentes.
The ones we celebrate are these eureka genius moments of idea generation.
Los que celebramos son esos momentos eureka de genialidad en la generación de ideas.
Kepler certainly had to cycle through many ideas, several of which didn't work.
Kepler sin duda tuvo que pasar por muchas ideas, varias de las cuales no funcionaron.
I bet there were many that he didn't even publish at all because they just didn't fit.
Apuesto a que hubo muchas que ni siquiera publicó porque simplemente no encajaban.
That's an important part of the process, trying all kinds of random things and seeing if they worked.
Esa es una parte importante del proceso: probar todo tipo de cosas al azar y ver si funcionan.
But as you say, it has to be matched by an equal amount of verification, otherwise it's slop.
Pero como dices, tiene que ir acompañada de una cantidad igual de verificación, de lo contrario es ruido.
We celebrate Kepler, but we should also celebrate Brahe for his assiduous data collection, which was ten times more precise than any previous observation.
Celebramos a Kepler, pero también deberíamos celebrar a Brahe por su meticulosa recopilación de datos, que era diez veces más precisa que cualquier observación anterior.
That extra decimal point of accuracy was essential for Kepler to get his results.
Ese decimal extra de precisión fue esencial para que Kepler obtuviera sus resultados.
He was using Euclidean geometry and the most advanced mathematics he could use at the time to match his models with the data.
Usaba geometría euclidiana y las matemáticas más avanzadas disponibles en su época para hacer coincidir sus modelos con los datos.
All aspects had to be in play: the data, the theory, and the hypothesis generation.
Todos los aspectos tenían que estar en juego: los datos, la teoría y la generación de hipótesis.
I'm not sure nowadays that hypothesis generation is the bottleneck anymore.
No estoy seguro de que hoy en día la generación de hipótesis sea ya el cuello de botella.
Science has changed in the century since.
La ciencia ha cambiado desde el siglo pasado.
Classically, the two big paradigms for science were theory and experiment.
Clásicamente, los dos grandes paradigmas de la ciencia eran la teoría y el experimento.
Then in the 20th century, numerical simulation came along, so you can do computer simulations to test theories.
Luego, en el siglo XX, llegó la simulación numérica, con la que puedes hacer simulaciones por computadora para poner a prueba teorías.
Finally, in the late 20th century, we had big data.
Por último, a finales del siglo XX, llegaron los grandes datos.
We had the era of data analysis.
Llegó la era del análisis de datos.
A lot of new progress is actually driven now by analyzing massive datasets first.
Mucho del progreso nuevo en realidad ahora viene impulsado por el análisis de conjuntos de datos masivos.
You collect large datasets and then draw patterns from them to deduce thoughts.
Recopilas grandes conjuntos de datos y luego extraes patrones para deducir conclusiones.
This is a little bit different from how science used to work, where you make a few observations or have one out-of-the-blue idea, and then collect data to test your idea.
Esto es algo diferente de cómo funcionaba la ciencia antes, donde se hacen unas pocas observaciones o se tiene una idea de repente, y luego se recopilan datos para ponerla a prueba.
That's the classic scientific method.
Ese es el método científico clásico.
Now it's almost reversed.
Ahora está casi invertido.
You collect big data first, and then you try to get hypotheses from it.
Primero recopilas grandes datos, y luego intentas extraer hipótesis.
Kepler was maybe one of the first early data scientists, but even he didn't start with Tycho's dataset and then analyze it.
Kepler fue quizás uno de los primeros científicos de datos, pero ni siquiera él empezó con el conjunto de datos de Tycho para analizarlo.
He had some preconceived theories first.
Primero tenía algunas teorías preconcebidas.
It seems like this is less and less the way we make progress, just because the data is so much more massive and useful.
Parece que cada vez menos progresamos así, simplemente porque los datos son mucho más masivos y útiles.
Oh, interesting.
Ah, interesante.
I feel like the 20th-century science that you're describing actually very well describes what happened with Kepler.
Siento que la ciencia del siglo XX que describes describe muy bien lo que le pasó a Kepler.
He did have these ideas—1595 and '96 is where he comes up with the polygons and then the Platonic objects theory—but they were wrong.
Él sí tenía esas ideas, en 1595 y 96 es cuando llega a la teoría de los polígonos y luego de los sólidos platónicos, pero estaban equivocadas.
Then a few years later, he gets Brahe's data, and it's only after twenty years of trying random things that he gets this empirical regularity.
Luego, unos años después, obtiene los datos de Brahe, y solo después de veinte años probando cosas aleatorias llega a esta regularidad empírica.
It actually feels a bit closer to Brahe's data being analogous to some massive data bank of simulations, and now that you've got the data, you can keep trying random things.
En realidad se parece un poco más a que los datos de Brahe son análogos a algún banco masivo de datos de simulaciones, y ahora que tienes los datos, puedes seguir probando cosas al azar.
If it wasn't for that, Kepler would be out there just writing books about harmonics and Platonic objects, and there would be nothing to actually verify against.
Si no fuera por eso, Kepler seguiría ahí escribiendo libros sobre armonías y sólidos platónicos, sin nada contra qué verificar realmente.
The data was extremely important.
Los datos eran extremadamente importantes.
The distinction I was trying to make was that traditionally, you make a hypothesis and then you test it against data.
La distinción que intentaba hacer era que, tradicionalmente, formulas una hipótesis y luego la pones a prueba con datos.
But now with machine learning, data analysis, and statistics, you can start with data and through statistics work out laws that were not present before.
Pero ahora, con el aprendizaje automático, el análisis de datos y la estadística, puedes empezar con datos y a través de la estadística descubrir leyes que antes no existían.
Kepler's third law is a little bit like this, except that instead of having the thousand data points that Brahe had, Kepler had six data points.
La tercera ley de Kepler se parece un poco a esto, salvo que en lugar de tener los mil puntos de datos que tenía Brahe, Kepler tenía seis puntos.
For every planet, he knew the length of the orbit and the distance to the Sun.
Para cada planeta, conocía la longitud de la órbita y la distancia al Sol.
There were five or six data points, and he did what we would now call regression.
Había cinco o seis puntos de datos, y hizo lo que ahora llamaríamos regresión.
He fit a curve to these six data points and got a square-cube law, which was amazing.
Ajustó una curva a esos seis puntos de datos y obtuvo la ley del cubo del cuadrado, lo cual fue asombroso.
But he was quite lucky that these six data points gave him the right conclusion.
Pero tuvo bastante suerte de que esos seis puntos de datos le dieran la conclusión correcta.
That's not enough data to be really reliable.
No son suficientes datos para ser realmente fiables.
There was a later astronomer, Johann Bode, who took the same data—the distances to the planets—and inspired by Kepler, he had a prediction that the distances to the planets formed a shifted geometric progression.
Hubo un astrónomo posterior, Johann Bode, que tomó los mismos datos, las distancias a los planetas, e inspirado por Kepler, predijo que esas distancias formaban una progresión geométrica desplazada.
He also fit a curve, except there was one point missing.
También ajustó una curva, pero faltaba un punto.
There was a big gap between Mars and Jupiter.
Había un gran hueco entre Marte y Júpiter.
His law predicted that there was a missing planet.
Su ley predecía que faltaba un planeta.
It was kind of a crank theory, except when Uranus was discovered by Herschel, the distance to Uranus fit exactly this pattern.
Era una teoría un poco extravagante, salvo que cuando Herschel descubrió Urano, la distancia a Urano encajaba exactamente con ese patrón.
Then Ceres was discovered in the asteroid belt, and it also fit the pattern.
Luego se descubrió Ceres en el cinturón de asteroides, y también encajaba.
People got really excited that Bode had discovered this amazing new law of nature.
La gente se entusiasmó mucho con que Bode había descubierto una nueva e impresionante ley de la naturaleza.