
AWS lanza Nova, una gama de modelos de IA generativa diseñados para texto, imágenes y vídeo, con capacidades avanzadas y un enfoque en eficiencia y accesibilidad.
En el marco de su conferencia re:Invent, Amazon Web Services (AWS), la división de computación en la nube de Amazon, ha anunciado una nueva familia de modelos de inteligencia artificial generativa multimodal denominada Nova. Este lanzamiento incluye modelos especializados en texto, imágenes y vídeo, marcando un importante avance en la oferta de IA de Amazon.
El CEO de Amazon, Andy Jassy, presentó los detalles en el escenario, destacando la versatilidad y la accesibilidad de los modelos Nova, que ya están disponibles en AWS Bedrock, la plataforma de desarrollo de IA de la compañía.
Modelos de texto: Micro, Lite, Pro y Premier.
La línea de modelos de texto de Nova incluye cuatro opciones: Micro, Lite, Pro y Premier. Estos modelos están optimizados para diferentes necesidades:
- Micro: diseñado para procesar texto con la mayor velocidad y menor latencia, aunque limitado a entradas y salidas exclusivamente textuales.
- Lite: capaz de analizar texto, imágenes y vídeo con rapidez razonable, adecuado para tareas multimodales.
- Pro: una combinación equilibrada de precisión, velocidad y costo, ideal para aplicaciones más diversas.
- Premier: el modelo más avanzado, pensado para cargas de trabajo complejas y para servir como «profesor» en la creación de modelos personalizados ajustados.
Todos los modelos, excepto Premier, ya están disponibles. Este último llegará a principios de 2025, junto con ventanas de contexto ampliadas que permitirán procesar más de 2 millones de tokens, lo que equivale a 1,5 millones de palabras.
Modelos de imágenes y vídeo: Canvas y Reel.
Nova también incluye modelos generativos para medios visuales:
- Canvas: permite generar y editar imágenes con comandos de texto, ofreciendo herramientas avanzadas como eliminación de fondos y ajuste de colores.
- Reel: diseñado para crear vídeos de hasta seis segundos a partir de texto o imágenes de referencia, con funciones como paneos, rotaciones de 360 grados y zoom. Se espera una versión ampliada para producir vídeos de hasta dos minutos.
Ambos modelos incorporan medidas de seguridad, como marcas de agua y moderación de contenido, para fomentar un uso responsable.
Avances futuros: modelos de voz y multimodales.
AWS planea lanzar en 2025 un modelo de voz a voz que transformará discursos y captará señales verbales y no verbales, como tono y cadencia. Además, prepara un modelo “cualquiera a cualquiera” que permitirá entradas y salidas de texto, voz, imágenes y vídeo, abriendo nuevas posibilidades en traducción, edición y asistentes de IA.
Jassy subrayó que los modelos Nova están diseñados para ser rápidos y rentables, optimizados para integrarse con sistemas y API personalizadas. Además, AWS ha implementado salvaguardas para evitar la generación de contenido dañino y proteger a los clientes frente a posibles problemas de derechos de autor.
Con Nova, Amazon busca posicionarse como líder en el ámbito de la inteligencia artificial multimodal, ofreciendo soluciones que abarcan desde el análisis de texto hasta la creación de medios generativos. Este lanzamiento refuerza su compromiso con la innovación tecnológica y su competencia frente a gigantes como Google y Microsoft.
Descubre más desde TecnoAp21
Suscríbete y recibe las últimas entradas en tu correo electrónico.
Categorías:Hardware & Software, Inteligencia artificial, Noticias



2 respuestas »