En los años 80, el investigador Hans Moravec formuló una observación que sigue vigente: lo fácil para los humanos es difícil para las máquinas y viceversa. Mientras que una computadora puede resolver cálculos complejos o vencer a un campeón mundial de ajedrez como hizo Deep Blue en 1997 contra Garry Kasparov, tareas que para un niño son triviales —como caminar sobre terrenos irregulares o manipular objetos con precisión— siguen siendo un desafío para los robots.
Esta contradicción, conocida como la paradoja de Moravec, ha sido una barrera para la robótica durante décadas. Sin embargo, los avances en inteligencia artificial, hardware y aprendizaje automático están cerrando esta brecha más rápido de lo previsto. Modelos avanzados como Helix, desarrollado por la startup Figure, y GR00T N1, presentado por Nvidia en marzo de 2025, están revolucionando la forma en que los robots entienden e interactúan con el mundo.
Helix y la revolución de la visión, lenguaje y acción
Figure, una startup con sede en California, diseñó a Helix, un modelo de inteligencia artificial que permite a los robots humanoides percibir el entorno mediante cámaras y sensores (visión), interpretar instrucciones en lenguaje natural (lenguaje) y ejecutar acciones basadas en esos datos (acción). Este enfoque multimodal permite a un robot recibir órdenes como “toma la taza azul y colócala sobre la mesa”, reconocer el objeto correcto y completar la tarea sin necesidad de programación explícita.
Helix se entrena con grandes volúmenes de texto, lo que le permite entender conceptos abstractos y referencias culturales, similar a cómo los modelos generativos como ChatGPT comprenden el lenguaje. Pero lo verdaderamente innovador es su capacidad para conectar el lenguaje con la acción en el mundo físico. Si se le dice “recoge el objeto del desierto”, puede identificar un cactus de juguete y seleccionar la mejor mano para agarrarlo con precisión.
En 2024, Figure colaboró con BMW en una prueba en una planta de Carolina del Sur. Los robots trabajaron en la línea de ensamblaje manipulando piezas de chapa con precisión milimétrica. Los resultados fueron impresionantes: un aumento del 400% en la velocidad y una mejora de siete veces en la tasa de éxito de las operaciones de ensamblaje.
Nvidia y GR00T N1: la IA de código abierto que acelera el avance de la robótica
El 18 de marzo de 2025, Nvidia presentó GR00T N1, un modelo de inteligencia artificial de código abierto diseñado para robots humanoides. Al igual que Helix, combina visión, lenguaje y acción, pero con un enfoque más versátil. GR00T permite a los robots aprender nuevas tareas observando a los humanos o entrenándose en entornos virtuales como Nvidia Omniverse.
Este modelo no está limitado a un solo tipo de tarea. Su capacidad de adaptación le permite realizar funciones tan diversas como manipular objetos en fábricas o doblar ropa en un hogar. Al ser de código abierto, facilita su adopción en múltiples industrias, reduciendo la necesidad de diseñar cada sistema desde cero.
Sin embargo, la integración de robots en entornos reales no siempre es sencilla. En junio de 2024, GXO Logistics implementó una flota de robots humanoides Digit para automatizar tareas en sus centros de distribución. Aunque en un entorno controlado funcionaban correctamente, en la práctica enfrentaron problemas de adaptación: dificultades para reconocer obstáculos imprevistos, pallets desalineados y superficies resbaladizas que afectaban su estabilidad.
¿Un punto de inflexión en la robótica?
A pesar de estos desafíos, la evolución de los robots humanoides se está acercando a un punto de inflexión comparable al impacto que tuvo ChatGPT en la inteligencia artificial conversacional. En un futuro cercano, podríamos ver robots colaborando con humanos en fábricas, hogares y hasta en hospitales.
Pero esta revolución también plantea interrogantes fundamentales: ¿Estamos listos para convivir con máquinas que imitan nuestro comportamiento de manera tan precisa? ¿Cómo cambiará el mercado laboral cuando los robots sean capaces de realizar tareas complejas de manera eficiente y autónoma?
Si algo nos enseñó la inteligencia artificial generativa, es que los cambios pueden llegar más rápido de lo esperado. Y la robótica está a punto de demostrarlo.