• Google debe duplicar su capacidad de servicio cada seis meses para la IA.
  • La compañía busca un aumento de 1000x en la capacidad en 4-5 años.
  • Se prioriza la eficiencia en coste, energía y potencia para esta expansión.

A pesar de las conversaciones sobre una posible burbuja en el sector de la inteligencia artificial, empresas como Google y OpenAI se enfrentan a la urgencia de construir infraestructura a un ritmo sin precedentes para satisfacer la demanda. Amin Vahdat, jefe de infraestructura de IA de Google Cloud, comunicó a los empleados la necesidad de duplicar la capacidad de servicio cada seis meses. Esta meta implica escalar la infraestructura mil veces en los próximos cuatro a cinco años, un objetivo ambicioso que debe lograrse manteniendo los costes, el consumo energético y la potencia dentro de límites manejables.

La carrera por la infraestructura de IA

La demanda de servicios de inteligencia artificial está impulsando una competencia feroz en la construcción de centros de datos. OpenAI, por ejemplo, planea invertir más de 400.000 millones de dólares en los próximos tres años para construir seis grandes centros de datos en Estados Unidos, buscando alcanzar casi 7 gigavatios de capacidad. Esta necesidad de expansión se ve reflejada en la dificultad para atender a sus 800 millones de usuarios semanales de ChatGPT, quienes a menudo se encuentran con límites de uso. Vahdat destacó que la competencia en infraestructura de IA es el aspecto más crítico y costoso de la carrera actual, y que el objetivo de Google va más allá de simplemente superar a sus rivales en gasto, buscando una infraestructura más fiable, eficiente y escalable.

Desafíos y estrategias de escalado

Uno de los principales cuellos de botella para satisfacer la demanda de IA ha sido la limitada capacidad de producción de GPUs por parte de Nvidia, cuyos chips de IA están agotados. Esta escasez afecta directamente la capacidad de Google para desplegar nuevas funciones de IA, como se evidenció con la herramienta de generación de vídeo Veo, cuyo lanzamiento se vio limitado por restricciones de cómputo. Para abordar este desafío, Google se apoya en tres estrategias principales: la construcción de infraestructura física, el desarrollo de modelos de IA más eficientes y el diseño de chips de silicio personalizados. El desarrollo de sus propias unidades de procesamiento tensorial (TPU), como la séptima generación Ironwood, busca reducir la dependencia del hardware de terceros y mejorar la eficiencia energética, siendo casi 30 veces más eficientes que las primeras TPU Cloud de 2018.

Google apuesta por la inversión a pesar del riesgo de burbuja

Sundar Pichai, CEO de Google, ha reconocido las preocupaciones sobre una posible burbuja en la industria de la IA, pero la agresiva estrategia de expansión de centros de datos sugiere que la compañía considera que el riesgo de quedarse corto en inversión es mayor que el de la sobrecapacidad. Pichai anticipa que 2026 será un año "intenso" debido a la competencia en IA y la presión por satisfacer la demanda de servicios en la nube y cómputo. La empresa está realizando una apuesta significativa, confiando en que la demanda continuará creciendo al ritmo esperado, a pesar de las advertencias sobre la sostenibilidad a largo plazo de este crecimiento exponencial.