SpaceX alquila capacidad de su centro de datos tras problemas para desarrollar su IA

SpaceX alquila capacidad de su centro de datos tras problemas para desarrollar su IA

Bloomberg — SpaceX (SPCX) decidió alquilar toda la capacidad de su centro de datos Colossus 1 en Memphis a Anthropic PBC después de encontrarse con problemas técnicos al utilizar las instalaciones para desarrollar y ejecutar sus modelos de inteligencia artificial Grok, según personas familiarizadas con el asunto. La empresa de Elon Musk había planeado entrenar sus modelos de IA más vanguardistas en una cantidad masiva de potencia informática utilizando un clúster de tres campus de centros de datos. Sin embargo, la firma se encontró con problemas de latencia al conectar Colossus 1 con otros dos emplazamientos situados a más de 16 kilómetros de distancia, dijeron las personas, agravados por el envejecimiento de la infraestructura de red. Entrenar modelos de IA más grandes y mejores requiere conexiones ultrarrápidas.

Si los enlaces entre las instalaciones son antiguos o de menor ancho de banda, pueden crearse retrasos que ralenticen todo el clúster del centro de datos. En lugar de seguir intentando trabajar con estas limitaciones, SpaceX determinó que las instalaciones serían más valiosas para servir a otras empresas y crear una nueva fuente de ingresos, dijeron las personas, que hablaron bajo condición de anonimato ya que la información no es pública. SpaceX, que adquirió xAI de Musk a principios de este año, ha hecho de la construcción de su centro de datos una parte clave del discurso a los inversores durante el roadshow para su exitosa oferta pública inicial. Tanto Anthropic como Google, de Alphabet Inc. (GOOGL), han cerrado acuerdos informáticos con SpaceX por un valor potencial de decenas de miles de millones de dólares a lo largo de varios años, lo que refuerza la apuesta del fabricante de cohetes por convertirse en un proveedor de infraestructuras de IA.

Sin embargo, los planes cambiantes para Colossus 1 también insinúan las dificultades en los ambiciosos y costosos esfuerzos de Musk para construir rápidamente un grupo en expansión de centros de datos, abastecidos con chips avanzados, para apoyar la IA. La empresa de Musk había destacado durante mucho tiempo que su primera instalación Colossus se construyó en sólo 122 días, superando sus propias estimaciones y las medias del sector. Los representantes de SpaceX, conocida formalmente como Space Exploration Technologies Corp, no respondieron a una solicitud de comentarios. Además de los problemas de latencia, el intento de integrar Colossus 1 con las demás instalaciones se complicó por las variaciones de hardware, dijeron las personas.

La instalación contiene una mezcla de generaciones de chips de Nvidia Corp., incluidos los sistemas Hopper y Blackwell, así como algunos aceleradores más antiguos, que son los procesadores utilizados para el trabajo de IA, dijeron las personas. Colossus 2 y 3 se construyeron de forma más uniforme en torno a los chips Blackwell de Nvidia, dijeron las personas. Ver más: Elon Musk se convierte en el primer billonario del mundo tras la OPI de SpaceX En los clusters de los centros de datos, la carga de trabajo se reparte entre muchas máquinas que necesitan permanecer sincronizadas. Si una instalación tiene chips más antiguos, puede crear cuellos de botella para las otras ubicaciones al obligar a los aceleradores más rápidos a esperar.

El resultado es que el cluster acaba rindiendo más cerca del hardware más lento que del más rápido. Al arrendar la capacidad de las instalaciones, la empresa pudo monetizar la infraestructura que no se estaba utilizando plenamente a nivel interno y, al mismo tiempo, preservar las instalaciones más nuevas para el desarrollo de la IA. El director financiero de SpaceX, Bret Johnsen, afirmó recientemente que la empresa no ha renunciado a sus propios servicios internos de IA, como Grok. Musk también ha dicho que SpaceX se reserva el derecho de acortar su acuerdo informático con Anthropic, tras avisarles con antelación. “Si la computación se vuelve muy escasa, puede que la necesitemos en algún momento”, dijo.

Lea más en Bloomberg.com