- Microsoft lanza Rho-alpha, un modelo de IA robótica basado en su serie Phi.
- El sistema integra lenguaje, percepción y acción para operar fuera de líneas de producción.
- Utiliza simulación y datos sintéticos para superar la escasez de datos del mundo real.
Los robots han demostrado ser fiables en entornos industriales controlados, pero fuera de ellos, su rendimiento suele ser deficiente. Para abordar esta limitación, Microsoft ha anunciado Rho-alpha, su primer modelo robótico derivado de la serie Phi de visión y lenguaje, con el objetivo de dotar a los robots de una mejor capacidad para ver y comprender instrucciones. La compañía aspira a que estos sistemas operen más allá de las líneas de montaje, adaptándose a condiciones cambiantes en lugar de seguir guiones rígidos.
IA Física: Liberando a los robots de la línea de producción
Rho-alpha se enmarca dentro de lo que se denomina IA física, donde los modelos de software guían a las máquinas en situaciones menos estructuradas. Este modelo integra lenguaje, percepción y acción, reduciendo la dependencia de líneas de producción fijas o instrucciones predefinidas. Rho-alpha traduce comandos de lenguaje natural en señales de control robótico, centrándose en tareas de manipulación bimanual que requieren coordinación entre dos brazos robóticos y un control preciso. Microsoft describe el sistema como una extensión de los enfoques VLA (visión-lenguaje-acción) al ampliar tanto la percepción como los inputs de aprendizaje.
Integración de la percepción y el control
Ashley Llorens, Vicepresidente Corporativo y Director General de Microsoft Research Accelerator, señala que la aparición de modelos VLA para sistemas físicos permite a estos percibir, razonar y actuar con mayor autonomía junto a los humanos en entornos menos estructurados. Rho-alpha incorpora sensores táctiles además de visión, junto con otras modalidades de detección como la fuerza, que está en desarrollo continuo. Estas decisiones de diseño buscan reducir la brecha entre la inteligencia simulada y la interacción física, aunque su efectividad aún está bajo evaluación.
Superando la escasez de datos con simulación y aprendizaje
Una parte fundamental del enfoque de Microsoft reside en la simulación para paliar la escasez de datos robóticos a gran escala, especialmente en lo referente al tacto. Las trayectorias sintéticas se generan mediante aprendizaje por refuerzo en Nvidia Isaac Sim y se combinan con demostraciones físicas de conjuntos de datos comerciales y abiertos. Deepu Talla, Vicepresidente de Robótica y Edge AI de Nvidia, destaca que entrenar modelos fundacionales que puedan razonar y actuar requiere superar la escasez de datos diversos del mundo real. El uso de Nvidia Isaac Sim en Azure para generar conjuntos de datos sintéticos físicamente precisos está acelerando el desarrollo de modelos versátiles como Rho-alpha.
El papel de la corrección humana y los datos sintéticos
Microsoft también pone énfasis en la corrección humana durante el despliegue, permitiendo a los operadores intervenir mediante dispositivos de teleoperación y proporcionar retroalimentación para que el sistema aprenda con el tiempo. Este bucle de entrenamiento combina simulación, datos del mundo real y corrección humana, reflejando una creciente dependencia de herramientas de IA para compensar la escasez de conjuntos de datos corporales. El profesor Abhishek Gupta de la Universidad de Washington comenta que, si bien la generación de datos de entrenamiento mediante teleoperación robótica es una práctica estándar, existen muchos entornos donde la teleoperación es impracticable o imposible. Se está trabajando con Microsoft Research para enriquecer los conjuntos de datos de preentrenamiento recopilados de robots físicos con diversas demostraciones sintéticas. Si la IA te interesa, te sugiero leer sobre el lanzamiento de una placa de IA de Raspberry Pi aquí.
También es crucial la eficiencia energética en el desarrollo de la IA. Por ello, te recomiendo leer acerca de los centros de datos escoceses de IA y su consumo de agua.
Para profundizar en los modelos de IA y su impacto en la industria, te podría interesar revisar cómo la IA está influyendo en los precios de las GPUs.