Gill Pratt dice que el Momento de los Robots Humanoide es finalmente aquí

En 2012, la Agencia de Proyectos de Investigación Avanzada de Defensa de EE.UU. anunció la DARPA Robotics Challenge (DRC). La competencia multianual y multimillonaria para la robótica en casos de desastre resultó en Atlas de Boston Dynamics, algunos momentos absolutamente increíbles de una de las primeras generaciones de robots humanoides útiles, y un video hinchable que vivirá para siempre.

Gill Pratt, el arquitecto de la competencia, tenía una comprensión muy clara de lo que el RDC iba a hacer por la robótica. “La razón [para el reto robótico de DARPA] es en realidad empujar el campo hacia adelante y hacer de esta capacidad una realidad,” Pratt dijo IEEE Spectrum en 2012. En ese momento, señaló que antes de la DARPA Grand Challenge en 2004 y el DARPA Urban Challenge en 2007, vehículos sin conductor para entornos complejos esencialmente no existían. Vio al RDC haciendo lo mismo por la robótica.

Ha pasado una década desde la conclusión del Desafío Robot de DARPA, y muchos en la industria creen que los robots humanoides están a punto de tener el momento transformador que Pratt predijo. Pero como es común en la robótica, las cosas tienden a ser mucho más difíciles de lo que parece que deberían ser. Spectrum se registró con Pratt, ahora el CEO del Toyota Research Institute (TRI), para saber qué está reteniendo la robótica humanoides, lo que él cree que estos robots deben estar haciendo (o no hacer), y cómo navegar la burbuja de la hippie humanoides.

¿Qué piensas de este momento robótico en el que estamos?

Gill Pratt: Lo que ha cambiado no es sobre los humanoides. Muchas personas han estado construyendo robots de investigación en la forma humanoides durante mucho tiempo. Lo que es diferente ahora no es el cuerpo, sino el cerebro. Siempre hemos tenido esta disparidad en el campo robótico donde los mecanismos que estábamos construyendo eran increíblemente capaces, pero realmente no teníamos los medios para hacer que la utilidad del robot coincida con ese potencial. Ahora realmente lo hacemos, y eso es debido a la revolución de la AI que ha sucedido en los últimos años.

Es muy tentador mirar atrás 10 años y acreditar directamente al RDC con mucho de lo que está sucediendo ahora con humanoides comerciales. ¿Hay alguna razón? no ¿para hacer eso?

Gill Pratt posa con una versión temprana del robot Valkyrie DRC de la NASA.Gill Pratt

Pratt: No, pero quiero ser humilde al respecto. El Centro se centró en la mitad de la autonomía y la mitad de la teleoperación en tiempo real. Había supervisión remota, y luego semiautonomía para amplificar esa supervisión para manejar tareas en tiempo real mientras la persona remota le estaba diciendo al robot qué hacer. Eso fue todo antes de los avances que han ocurrido recientemente en AI.

Lo que ha cambiado ahora es que tenemos una manera de enseñar esencialmente a los robots qué hacer, y hacerlos competentes de una manera que no requiere código de escritura; usted puede simplemente demostrar la tarea al robot en su lugar. Con una cantidad suficiente de esos datos y nuevos métodos de IA, los robots pueden ser mucho más performant que nunca antes.

Pero esos datos son un cuello de botella, ¿verdad? ¿Cómo sabemos de qué debe consistir, y qué cantidad suficiente es conseguir que un robot haga algo fiable?

Pratt: Esto refleja exactamente el debate que pasa en los modelos de lenguaje grande [LLMs]. Usted tiene ciertas personas que creen que si usted toma LLMs —que son predictores autoregresivos que adivinan lo que la próxima palabra debe estar basado en palabras pasadas— y los parche con una variedad de métodos para resolver sus alucinaciones, eventualmente llegaremos a un punto en el que podemos confiar en el sistema AI. Y luego hay otras personas, y creo que Yann LeCun es el más conocido de ellos, que dicen que eso es absurdo, y necesitamos algo más. Su punto de vista, y estoy de acuerdo, es que necesitamos modelos mundiales. Necesitamos alguna manera para que el sistema de inteligencia artificial pueda imaginar, probar las cosas y realmente razonar.

Y sé que estamos aplicando palabras como ‘razón’ a lo que son esencialmente sistemas de fijación de patrones. Decir que hay ‘razonamiento’ es sólo una pegatina que ponemos en lo que hemos construido; no es un razonamiento verdadero.

Botellas de datos en Robot Learning

Este es un ejemplo de “sistema uno” contra “sistema dos” pensando, ¿verdad?

Pratt: Sí. El sistema uno es el pensamiento rápido y reflexivo que tenemos, que es el tipo de patrón que coincide con los LLM actuales. El sistema dos es el lento razonamiento que implica imaginación y modelos mundiales. Eso es lo que aún no hemos hecho. El progreso en el sistema uno ha sido extraordinario, pero todavía no tenemos el sistema dos. Estos intentos de parche el sistema uno para hacer que el sistema dos es como tratar de apretar un globo lleno de agua; lo exprime en un lado y el agua se bulta en el otro lado. Sigues sorprendida de que arreglas una cosa y otra cosa rompe, y el rendimiento en general no consigue mucho mejor.

¿Cómo has estado abordando este problema en el TRI?

Pratt: Hace dos años, hemos surgido con la política de difusión, y luego se nos ocurrió lo que yo llamo grandes modelos de comportamiento (LBMs). Esto implica tener un modelo entrenado en muchas tareas, y mostrar que a medida que agregas cada tarea, realmente ayuda con las otras tareas y reduce la cantidad de datos de entrenamiento necesarios para alcanzar un nivel de rendimiento determinado. Estos han sido increíbles avances del sistema.

El avance ocurrió cuando nos dimos cuenta de que la difusión podría ser aplicada a la conducta robótica. Descubrimos que operar en el espacio de comportamiento, desde la visión, hasta la acción, funcionó increíblemente bien. Eso arrojó todo el campo, y desde entonces, creo que cada demostración robótica que hemos visto está usando alguna forma de política de difusión para hacer lo que está haciendo. Pero de nuevo, este es el patrón del sistema uno que coincide: Si veo el mundo así, actúo en el mundo así. El robot no está imaginando, pensando y planeando la forma en que la robótica tradicional con la codificación de manos solía hacer. Sólo reacciona.

Sin embargo, el patrón del sistema uno se descompone a menudo en el mundo real, como hemos visto con luchas de conducción autónoma.

Pratt: Hace diez años, cuando comenzó TRI, casi todos decía que la conducción automatizada estaba a la vuelta de la esquina.

Diez años más tarde, creo que ahora estamos allí, y las preguntas restantes son de negocios: ¿Cuánto cuesta el hardware, el seguro, el apoyo, tiene sentido económicamente? No tenemos necesariamente resuelto conducción automatizada, pero nuestras soluciones son lo suficientemente buenas, porque utilizamos humanos para hacer copias de seguridad. Cuando un vehículo automatizado se atasca en un coche de doble parque, llama a casa y pide a una persona una decisión sistema-dos. Creo que otros robots también podrían hacerlo. La mayor parte del tiempo hacen su trabajo por su cuenta, y de vez en cuando, levantan su mano para ayudar.

Si apenas hemos logrado conseguir autos autónomos correctos, ¿por qué estamos dedicando tanta atención al factor de forma humanoide legged?

Pratt: Hemos construido el mundo con donaciones físicas para nuestros cuerpos. Si el robot va a hacer bien en ese mundo, debe tener algo que se aprovecha de esos beneficios. También es más fácil para el aprendizaje de imitación trabajar porque tenemos la misma forma. Y las piernas son buenas para ciertos ambientes; puedes superar obstáculos para equilibrar más rápido de lo que puedes rodar a un nuevo punto de apoyo con ruedas. Habiendo dicho todo eso, las piernas no son siempre lo más práctico. Es muy raro ver tanto enfoque en robots legged en fábricas, que son ambientes planos perfectamente adecuados para ruedas.

Gestión de la Hipa de Robot Humanoid

¿Crees que la cantidad de dinero que se derrama en humanoides legged es algo bueno para la robótica?

Pratt: Tiene ventajas y peligros. Es maravilloso ver tantos recursos en el campo robótico, y creo que algo especial ha ocurrido. Las cosas no son la forma en que eran antes, y hay muchas posibilidades cuando piensas en las personas que enseñan robots cómo hacer las cosas.

Gill Pratt admira un robot en el techo del Museo Ghibli en Tokio.Gill Pratt

¿Qué tipo de cosas deben hacer los humanos enseñando robots?

Pratt: Durante 10 años en el TRI, hemos estado pensando en la sociedad y el envejecimiento. No se trata sólo de la discapacidad física; se trata de la soledad y la pérdida de propósito, que son mucho más frecuentes (y mucho peor) problemas. Y así la pregunta es, ¿qué podemos hacer tecnológicamente para ayudar a la gente a sentir que son más jóvenes?

En TRI, estamos explorando “Robots que reciben atención” – robots que reciben enseñanza de un humano. Hemos evolucionado para ser criaturas que aman dar y amar ayudar. Cuando programas una máquina por demostración, y esa máquina continúa para ayudar a alguien más, sientes un sentido de propósito. Creemos que los robots pueden ser cosas bidireccionales para mejorar la calidad de vida psicológicamente, no sólo físicamente.

Cuando empezaste TRI hace 10 años, te pregunté en qué te enfocarías, tu respuesta realmente se atascó conmigo: dijiste cuidado de ancianos, porque “no tenemos opción. ”

Pratt: Sí. Las estadísticas en Japón y Estados Unidos están empeorando, y nosotros no Ten una opción. Es importante recordar que una sociedad envejecida tiene un enorme impacto en los jóvenes. Esto se debe a la proporción de dependencia, que es cuántos jóvenes en la fuerza de trabajo están apoyando a las personas que son demasiado jóvenes para trabajar, y también a las personas que son demasiado viejas para trabajar. Esos números siguen empeorando y empeorando.

¿Cómo resolvemos esto?

Pratt: Hemos tenido algunos avances increíbles con el sistema uno, pero no significa que los robots van a hacer tanto, a menos que alguien haga un sistema-dos avance también. O, donde tenemos un sistema en el que los humanos proporcionan algún nivel de control de supervisión del sistema-dos.

Ese tipo de control de supervisión humana nos lleva de vuelta a la RDC, ¿no?

Pratt: [Risas] ¡Eso es exactamente correcto! Mira, no te voy a decir que no alabas al RDC… Había alguien que lo llamó «Woodstock of Robots,” que acaba de calentar mi corazón, que era tan genial!

Entonces, 10 años más tarde, ¿cómo te sientes acerca de la cantidad de hipe en la robótica humanoides ahora mismo?

Pratt: Nos acercamos a lo que (¡Espero!) es un pico de expectativas infladas para los humanoides. Y eso es porque nadie está pensando lo suficientemente profundamente en el sistema-uno contra el sistema-dos cosa.

En este momento, nuestros sistemas físicos de inteligencia artificial son sólo modelos que coinciden. Son increíblemente capaces, y es asombroso lo bueno que son estas cosas – estamos tan orgullosos de ello. Y creemos que la agregación del aprendizaje de muchas tareas a través de modelos de comportamiento grandes será increíblemente eficaz. Pero todavía no es el sistema dos. Hay mucho sobrepromiso pasando, y es muy triste porque nos está preparando para una caída. Lo que me preocupa es el tropiezo de desilusión que seguirá.

¿Cómo evitamos ese accidente en la robótica cuando estalla la burbuja de hipódromo humanoide?

Pratt: Por ahora, necesitamos humectar. En sistemas de control, estabiliza un sistema inestable añadiendo amortiguación. La prensa y el mundo académico pueden agregar una compensación principal recordando a todos que lo que estamos viendo en humanoides ahora no es realmente razonar.

También debemos recordar que el campo de conducción automatizado pasó por un estallido de burbujas, y sólo algunas compañías sobrevivieron a eso, manteniendo la hippie y siendo persistente. Creo que deberíamos hacerlo aquí también.

Fuente: Leer completo

Seguí las últimas noticias de robótica en español.

What's Hot

Voyager Technologies acquires Astrobotic to advance lunar initiatives

Autonomous defense manufacturer Mach Industries raises $300M

Consistency, not complexity, is the key to teaching robots dexterity, new research suggests