Hardware & Software

El ilusionante Proyect Astra de Google esta lleno de potencial. Pero tardará años en hacerse realidad

El adelanto de Google I/O 2024 sobre el Proyecto Astra muestra un futuro prometedor para los asistentes de IA multimodal. Sin embargo, la implementación completa de esta tecnología aún enfrenta varios desafíos antes de llegar a los dispositivos cotidianos.

En el reciente Google I/O 2024, la presentación del Proyecto Astra ofreció una visión emocionante del futuro de los asistentes de inteligencia artificial (IA). Astra es una IA multimodal que combina la inteligencia del modelo Gemini con capacidades avanzadas de reconocimiento de imágenes, similares a las que se encuentran en Google Lens, y potentes respuestas en lenguaje natural. No obstante, aunque la demostración en vídeo fue ingeniosa, la experiencia práctica revela que queda un largo camino por recorrer antes de que Astra esté disponible para su uso generalizado.

Una nueva forma de interacción.

Actualmente, la mayoría de las interacciones con asistentes digitales se realizan a través de comandos de voz. Astra introduce la multimodalidad, utilizando vista, sonido y texto para comunicarse, lo que en teoría permite que los asistentes digitales se porten más como agentes reales. En una demostración, se pidió a Astra que contara una historia basada en objetos colocados frente a la cámara. La IA creó una narrativa encantadora sobre un dinosaurio y su baguette, mostrando su capacidad creativa. Sin embargo, esta demostración destacó tanto el potencial como las limitaciones actuales de Astra.

En otra prueba, Astra identificó correctamente una flor y un sol dibujados en una pantalla táctil. La capacidad más impresionante se mostró cuando se usó Astra en un Pixel 8 Pro, permitiendo que la IA rastreara y recordara la ubicación de diversos objetos, incluso reconociendo prendas de ropa y gafas de sol. Esta funcionalidad podría ahorrar tiempo en tareas cotidianas, como encontrar objetos perdidos.

Desafíos y limitaciones actuales.

A pesar del potencial, Astra se enfrenta a varios desafíos. Actualmente, la IA necesita ayuda de la nube para funcionar y solo puede mantener recuerdos de objetos durante sesiones cortas de unos minutos. Esta limitación en la memoria, junto con problemas de almacenamiento y latencia, ralentiza la IA y afecta la experiencia del usuario. Aunque Astra tiene un gran potencial, su implementación completa aún está a años de distancia.

De todos los avances en IA generativa, la IA multimodal es especialmente intrigante. La capacidad de una IA para reconocer y responder a su entorno en tiempo real ofrece una visión futurista de cómo esta tecnología podría integrarse en dispositivos como gafas inteligentes. Google sugirió esta posibilidad con Astra, aunque actualmente sigue siendo experimental. La capacidad de Astra para «recordar» la ubicación de objetos es una característica que podría diferenciarlo de otros asistentes, como los desarrollados por Meta.

La experiencia con Astra subraya tanto las posibilidades como los desafíos de la IA multimodal. La capacidad de un asistente digital para recordar y gestionar información visual en tiempo real podría transformar la manera en que interactuamos con la tecnología. Sin embargo, la implementación de estas capacidades aún requiere superar obstáculos técnicos significativos.

En resumen, aunque el Proyecto Astra de Google está lleno de potencial, su desarrollo y perfeccionamiento llevará varios años. Google I/O 2024 nos ha dado una mirada prometedora al futuro de los asistentes de IA, pero queda claro que la plena realización de esta tecnología aún está en camino.


Descubre más desde TecnoAp21

Suscríbete y recibe las últimas entradas en tu correo electrónico.

2 respuestas »

Deja un comentario