Google anuncia dos modelos de IA para nueva generación de robots humanoides
Google DeepMind ha revelado dos modelos de inteligencia artificial: Gemini Robotics y Gemini Robotics-ER.

Google DeepMind ha revelado dos innovadores modelos de inteligencia artificial (IA) que, según la compañía, marcan el comienzo de una nueva era en robótica avanzada: Gemini Robotics y Gemini Robotics-ER.
Ambos modelos, desarrollados a partir de la IA Gemini 2.0, amplían significativamente las capacidades de los robots, permitiéndoles realizar tareas más variadas y complejas en entornos del mundo real.
El primero de ellos, Gemini Robotics, es un sofisticado sistema de visión-lenguaje-acción (VLA) que introduce el control físico como una nueva dimensión, permitiendo a los robots ejecutar tareas con precisión milimétrica. Gracias a esta innovación, los robots pueden realizar acciones detalladas como doblar una figura de origami o colocar cuidadosamente un bocadillo dentro de una bolsa con cierre hermético, explica la empresa en su blog oficial.

Mundo
Estados Unidos y China adoptaron estrategias opuestas en Inteligencia Artificial: mientras el primero invierte miles de millones para acelerar hacia la AGI con infraestructura de cómputo avanzada, el segundo prioriza automatización industrial, robótica y desarrollo de chips nacionales para asegurar autonomía tecnológica
Para lograr una verdadera utilidad en entornos humanos, la IA aplicada a la robótica debe cumplir con tres principios clave:
- Versatilidad: la capacidad de adaptarse a múltiples escenarios y requerimientos.
- Interacción intuitiva: una comprensión ágil de instrucciones y respuestas rápidas a cambios en el entorno.
- Destreza física: la habilidad de ejecutar tareas que normalmente requieren el uso preciso de las manos y los dedos, como manipular objetos frágiles.
Google DeepMind asegura que, si bien sus desarrollos anteriores ya habían avanzado en estas áreas, Gemini Robotics representa un salto cualitativo en las tres dimensiones, acercando a la industria a la creación de robots verdaderamente versátiles.
Una IA adaptable a diferentes tipos de robots
Dado que los robots pueden tener diversas formas y tamaños, Gemini Robotics ha sido diseñado para integrarse fácilmente en distintas plataformas robóticas sin necesidad de ajustes extensivos.
Por otro lado, Gemini Robotics-ER es un modelo especializado en visión-lenguaje (VLM) con una capacidad avanzada de razonamiento espacial. Su propósito es permitir a los expertos en robótica desarrollar y personalizar programas mediante el aprovechamiento de la inteligencia corporal de Gemini.
Este modelo destaca por mejorar considerablemente la percepción tridimensional y la capacidad de identificación de objetos. Por ejemplo, al detectar una taza de café, el sistema no solo reconoce su forma, sino que también infiere el mejor punto de agarre en el asa y calcula una trayectoria óptima para alcanzarla sin derramar el contenido.
Gracias a la incorporación de Gemini en estos modelos, los robots pueden desempeñar una gama más extensa de funciones en entornos reales. Para llevar estos avances al siguiente nivel, Google DeepMind se ha asociado con la empresa Apptronik para desarrollar una nueva generación de robots humanoides.
Además, están colaborando con grupos de evaluación especializados que ayudarán a perfeccionar el potencial de Gemini Robotics-ER en aplicaciones prácticas.
El futuro de la IA en el mundo físico
Desde Google DeepMind destacan que los modelos Gemini han avanzado en el uso de razonamiento multimodal, integrando texto, imágenes, audio y video para resolver problemas complejos. Sin embargo, hasta ahora estas capacidades se habían limitado en gran medida a escenarios digitales.
Para que la IA tenga un impacto significativo en el mundo físico, es fundamental que desarrolle un “razonamiento corporal”, es decir, la capacidad de interpretar y responder de manera similar a los humanos a los estímulos del entorno. Además, debe actuar con seguridad y eficiencia al realizar tareas prácticas, indica EFE.
Por ello, la compañía afirma que estos nuevos modelos, construidos sobre la base de Gemini 2.0, establecen un punto de inflexión en el camino hacia robots más autónomos, inteligentes y funcionales en la vida cotidiana.
Sigue nuestro canal de WhatsApp
Recibe las noticias más importantes del día. Da click aquí
Te recomendamos

Mientras EE.UU. y China dominan la inteligencia artificial global, América Latina lanza Latam-GPT, el primer modelo regional impulsado por 15 países con una apuesta por soberanía tecnológica y gobernanza propia

Google presenta AlphaGenome: la IA que descifra el “ADN oscuro” y acelera la explicación del genoma humano

Google presenta Nano Banana 2: la versión más rápida e inteligente hasta ahora

Cables submarinos, centros de datos e inversión millonaria: la estrategia de Google para impulsar la inteligencia artificial y convertir a India en un eje tecnológico global
Grupo Healy © Copyright Impresora y Editorial S.A. de C.V. Todos los derechos reservados