Una nueva tecnología, desarrollada por el MIT, permite a un robot manipular objetos blandos como la masa de la pizza o materiales suaves como la ropa. DiffSkill puede realizar tareas de manipulación complejas en simulaciones, como cortar y extender la masa, o recoger trozos de masa alrededor de una tabla de cortar, superando a otros métodos de aprendizaje automático.

FUENTE: businessinsider.es

AUTOR: Ana Ávila

Cada vez es más difícil que alguien se sorprenda cuando a un robot se le atribuyen habilidades humanas. Tanto las cualidades motoras como físicas cada vez son más frecuentes en las máquinas. De hecho, recientemente pudimos ver al primer robot humanoide jubilarse.

Sin embargo, a pesar de los avances, hasta ahora no había sido posible ver a un robot trabajando con objetos moldeables.

Recientemente, el MIT ha creado el primer robot pizzero capaz de trabajar con un objeto deformable como la masa. La complejidad del asunto se encuentra en la mutabilidad de la forma, lo cual es difícil representar con una ecuación comprensible para el robot.

Además, crear una nueva forma a partir de esa masa requiere múltiples pasos y el uso de diferentes herramientas. Para un robot es especialmente difícil aprender una tarea de manipulación con una larga secuencia de pasos, ya que el aprendizaje suele producirse por ensayo y error.

Investigadores del MIT, la Universidad Carnegie Mellon y la Universidad de California en San Diego han ideado una forma mejor. Han creado un marco para un sistema de manipulación robótica que utiliza un proceso de aprendizaje en dos fases, lo que podría permitir a un robot realizar complejas tareas de manipulación de la masa durante un largo periodo de tiempo.

Primero, un algoritmo «maestro» resuelve cada paso que debe dar el robot para completar la tarea. A continuación, entrena a un modelo de aprendizaje automático «alumno» que consolida ideas abstractas sobre cuándo y cómo ejecutar cada habilidad que necesita, como el uso de un rodillo. Con este conocimiento, el sistema razona sobre cómo ejecutar las habilidades para completar la tarea.

Los investigadores demuestran que este método, al que llaman DiffSkill, puede realizar tareas de manipulación complejas en simulaciones, como cortar y extender la masa, o recoger trozos de masa alrededor de una tabla de cortar, superando a otros métodos de aprendizaje automático.

 

Los robots aprenden del cambio para realizar nuevas tareas y trabajos

 

Más allá de la elaboración de pizzas, este método podría aplicarse en otros entornos en los que un robot necesite manipular objetos deformables, como un robot cuidador que alimente, bañe o vista a una persona mayor o con problemas motrices.

«Este método se acerca más a la forma en que los humanos planificamos nuestras acciones. Cuando un ser humano realiza una tarea de largo alcance, no anotamos todos los detalles. Tenemos un planificador de alto nivel que nos dice a grandes rasgos cuáles son las etapas y algunos de los objetivos intermedios que tenemos que alcanzar por el camino, y luego los ejecutamos», dice Yunzhu Li.

Entre los coautores de Li se encuentran el autor principal, Xingyu Lin, estudiante de posgrado de la Universidad Carnegie Mellon (CMU); Zhiao Huang, estudiante de posgrado de la Universidad de California en San Diego.

Además, también han participado Joshua B. Tenenbaum, profesor de desarrollo profesional Paul E. Newton, catedrático de Ciencias Cognitivas y Computación del Departamento de Ciencias Cognitivas y del Cerebro del MIT y miembro del CSAIL; David Held, profesor adjunto de la CMU; y el autor principal, Chuang Gan, investigador científico del Laboratorio de Inteligencia Artificial MIT-IBM Watson.

La investigación se presentará próximamente en la Conferencia Internacional sobre el Aprendizaje de Representaciones.

 

DiffSkill: capaz de ser alumno y profesor

 

El «profesor» en el marco de DiffSkill es un algoritmo de optimización de trayectorias que puede resolver tareas de horizonte corto, en las que el estado inicial de un objeto y la ubicación del objetivo están cerca.

El optimizador de trayectorias trabaja en un simulador que modela la física del mundo real (conocido como simulador de física diferenciable).

El algoritmo del «profesor» utiliza la información del simulador para aprender cómo debe moverse la masa en cada etapa, de una en una, y luego emite esas trayectorias.

A continuación, la red neuronal del «alumno» aprende a imitar las acciones del profesor. Como entradas, utiliza dos imágenes de cámara, una que muestra la masa en su estado actual y otra que muestra la masa al final de la tarea. La red neuronal genera un plan de alto nivel para determinar cómo enlazar las diferentes habilidades para alcanzar el objetivo.

A continuación, genera trayectorias específicas de corto horizonte para cada habilidad y envía órdenes directamente a las herramientas.

 

Manejo de más herramientas para poder desarrollar tareas más diversas

 

DiffSkill fue capaz de superar las técnicas populares que se basan en el aprendizaje por refuerzo, en las que un robot aprende una tarea mediante ensayo y error.

De hecho, DiffSkill fue el único capaz de completar con éxito las tres tareas de manipulación de la masa. Curiosamente, los investigadores descubrieron que la red neuronal «estudiante» era capaz incluso de superar al algoritmo “maestro”.

«Nuestro marco proporciona una forma novedosa de que los robots adquieran nuevas habilidades. Estas habilidades pueden encadenarse para resolver tareas más complejas que superan la capacidad de los sistemas robóticos anteriores», afirma Lin.

Como su método se centra en el control de las herramientas (espátula, cuchillo, rodillo, etc.), podría aplicarse a diferentes robots, pero solo si utilizan las herramientas específicas que los investigadores definieron.

Los investigadores pretenden mejorar el rendimiento de DiffSkill utilizando datos en 3D como entradas, en lugar de imágenes que pueden ser difíciles de transferir de la simulación al mundo real.

También quieren hacer más eficiente el proceso de planificación de la red neuronal y recoger datos de entrenamiento más diversos para mejorar la capacidad de DiffSkill de generalizarse a nuevas situaciones. A largo plazo, esperan que DiffSkill pueda realizar tareas más diversas, como la manipulación de telas.


Esta web usa cookies analíticas y publicitarias (propias y de terceros) para analizar el tráfico y personalizar el contenido y los anuncios que le mostremos de acuerdo con su navegación e intereses, buscando así mejorar su experiencia. Si presiona "Aceptar" o continúa navegando, acepta su utilización. Puede configurar o rechazar su uso presionando "Configuración". Más información en nuestra Política de Cookies.


ACEPTAR
Aviso de cookies

¡Comparte en tus redes!

¡Comparte esta noticia con tus amigos!