El Imparcial / Tecnología / Robot

Facebook entrena robots para pensar

La compañía está desarrollando una IA que permita a los robots generar intuición.

Facebook está liderando un esfuerzo para enseñar a los robots cómo pensar por sí mismos y desarrollar una intuición similar a la humana que les permita navegar en circunstancias desconocidas.

El enfoque se denomina IA incorporada, lo que significa dar al software un cuerpo físico para explorar, y es una forma más flexible de aprendizaje que con la IA preprogramada, que está limitada por algoritmos deterministas y conjuntos de datos enlatados.

Muchas personas se sorprenderían al escuchar que Facebook tiene un laboratorio de robótica, ya que la mayoría lo considera principalmente como una plataforma de comunicaciones. ¿Cuál es el interés de Facebook en los robots?

Roberto Calandra: FAIR tiene como objetivo avanzar la IA haciendo una investigación abierta. Nos preocupamos por publicar artículos, abrir código de fuente y crear conjuntos de datos para el beneficio general de la comunidad científica. El principal desafío que estamos tratando de resolver es comprender las formas algorítmicas que los humanos aprenden y cómo podemos reproducir el mismo nivel de inteligencia en las máquinas para mejorar la sociedad.

Facebook está entrenando robots en entornos simulados y del mundo real. ¿Por qué?

Dhruv Batra: La construcción de sistemas de inteligencia artificial incorporados para robots es el próximo gran desafío para la inteligencia artificial. Una vez que puede entrenar sistemas para navegar en estos espacios e interactuar con ellos, es innovador porque los robots están utilizando su propia inteligencia, no un conjunto de reglas. Se está introduciendo todo lo nuevo y está calculando cada decisión, cometiendo errores, exactamente como lo haría un humano. 

Pero si intenta aprender exclusivamente con robots en una plataforma de hardware, habrá percances. Si le pide al robot que recoja algo y navegue a otra habitación, es probable que intente actuar y romperse o colisionar con otras personas, y ese robot es costoso. Puede causar daños y los robots más pesados pueden causar daños graves. 

El aprendizaje automático tiende a requerir grandes cantidades de experiencia y datos para aprender. Recopilar esa experiencia en plataformas robóticas reales tiende a ser lento, costoso y difícil. Algunos agentes han sido entrenados para dos mil millones de marcos de experiencia en simulación, que corresponde aproximadamente a 18 años de tiempo humano. No es práctico hacerlo en un robot real. Es por eso que creemos que el camino a seguir es aprender primero en la simulación como campo de prueba.

Puede tener 10,000 simuladores ejecutándose realmente rápido, lo que significa que puede probar todo tipo de acciones en esas simulaciones y saber cuáles funcionan y cuáles no. Una vez que sus agentes estén seguros y efectivos en la simulación, puede implementar robots. 

Dos mil millones de cuadros de experiencia también son 10,000 cuadros por segundo. Si fuera de 30 a 60 cuadros por segundo, la velocidad a la que funcionan los motores Unity y Unreal, nuestros experimentos serían mucho más lentos. Esos motores no fueron creados para el aprendizaje automático, por lo que nosotros mismos creamos el simulador Habitat.

El entorno virtual de Hábitat está reconstruido en 3D y es fotorrealista, por lo que cuando entrenemos agentes en este espacio, esperamos generalizar a lo real.

¿Cómo funciona el sistema de recompensas basado en puntos?

Batra: El agente encarnado se inicializa en una ubicación y se le dice que vaya a su marca. Descubre cómo llegar por prueba y error. La única forma en que sabe que completó una tarea es si obtiene una recompensa. Si lo logra, recibe puntos como recompensa positiva. Si no lo logra, se penaliza al deducir puntos. Si lo hace de alguna manera, obtiene crédito parcial.

¿Los robots tienen memoria?

Batra: en cierto modo. El producto final del aprendizaje es un modelo que se puede probar en nuevos entornos. Todo lo que has visto antes se comprime en números que entran en los parámetros de ese modelo. Entonces, en cierto sentido, eso es memoria, pero no en el sentido de que puedas hablar con ese parámetro: “¿Has visto esta casa antes? ¿Has estado aquí antes? Por favor, no cometas el mismo error ”. No tiene esos aspectos.

¿Pueden los robots realizar múltiples tareas?

Batra: Muchos modelos son buenos para rastrear incidentes únicos, pero no son buenos para rastrear la combinación. La parte más importante de la inteligencia es la abstracción, que encuentra elementos comunes sobre la experiencia, lo que importa y lo que es irrelevante para la tarea. Estamos trabajando en esto en Hábitat.

¿Cómo navegan los agentes encarnados en sus mundos?

La visión por computadora ayuda con el control de la percepción y la percepción. Los sensores de la cámara capturan la altura por bit mediante RGB. A partir de esto, sabemos qué objetos existen en el frente, dónde están, cuál es su profundidad y distancia de la cámara. Qué objetos podrían usarse para futuras predicciones. Si hay una persona, qué podrían hacer dos segundos, 10 segundos o 20 segundos más adelante. Con información de Forbes.

Temas relacionados