Inteligencia artificial

Stability AI presenta el vanguardista Stable Diffusion XL 1.0, su más reciente modelo de generación de imágenes


Una imagen generada por Stable Diffusion XL 1.0. Créditos de la imagen: Stability AI

La startup de inteligencia artificial, Stability AI, sigue perfeccionando sus modelos de IA generativa para destacar en un mercado cada vez más competitivo y enfrentar desafíos éticos. Hoy, anunciaron con entusiasmo el lanzamiento de su último avance, Stable Diffusion XL 1.0, un potente modelo de texto a imagen.

El nuevo modelo, con 3.500 millones de parámetros, se presenta como una mejora significativa respecto a su versión anterior, Stable Diffusion XL 0.9. No solo permite obtener imágenes de alta resolución en segundos para diversas relaciones de aspecto, sino que también exhibe colores más vibrantes, precisos y un sorprendente contraste, sombras e iluminación, según afirmaciones de Stability.

Joe Penna, jefe de aprendizaje automático aplicado de la compañía, compartió en una entrevista con TechCrunch que Stable Diffusion XL 1.0 es altamente personalizable y fácil de usar, permitiendo diseños complejos con simples indicaciones de procesamiento de lenguaje natural.

Una de las características más notables del modelo es su capacidad para generar texto avanzado con alta legibilidad, superando los desafíos que muchos otros modelos enfrentan al lidiar con logotipos, caligrafía y fuentes.

Stable Diffusion XL 1.0 también incorpora funciones de inpainting y outpainting, que permiten reconstruir partes faltantes de una imagen y extender imágenes existentes, respectivamente. Además, presenta una interesante capacidad de «imagen a imagen», que permite a los usuarios agregar texto a una imagen para crear variantes más detalladas, interpretando instrucciones complejas de manera eficiente, incluso cuando son expresadas en indicaciones cortas.

Para facilitar el acceso a su avanzada tecnología, Stability AI ha puesto Stable Diffusion XL 1.0 a disposición del público en GitHub bajo código abierto, además de ofrecerlo a través de su API y aplicaciones como ClipDrop y DreamStudio.

Con este nuevo lanzamiento, Stability AI sigue consolidando su posición como líder en la vanguardia de la inteligencia artificial generativa, brindando soluciones innovadoras y altamente funcionales para una amplia variedad de aplicaciones en el mundo actual.

«Esperamos que al lanzar este modelo de código abierto mucho más potente, la resolución de las imágenes no sea lo único que se cuadruplique, sino también avances que beneficiarán en gran medida a todos los usuarios», agregó el CEO de Stability AI, Emad Mostaque.

Pero al igual que con las versiones anteriores de Stable Diffusion, el modelo plantea problemas morales difíciles.

El modelo de código abierto, Stable Diffusion XL 1.0, puede, en teoría, ser utilizado por malos actores para generar contenido tóxico o dañino, como deepfakes no consensuados. Esto se debe, en parte, a los datos utilizados para entrenar el modelo: millones de imágenes obtenidas de toda la web.

A través de innumerables tutoriales, se ha demostrado cómo los usuarios pueden utilizar las herramientas de Stability AI, incluyendo DreamStudio, un front-end de código abierto para Stable Diffusion, para crear deepfakes. Asimismo, se han compartido guías para afinar los modelos básicos de difusión estable con el fin de generar contenido inapropiado.

Joe Penna, jefe de aprendizaje automático aplicado en Stability AI, reconoce que el abuso es una posibilidad y admite la presencia de ciertos sesgos en el modelo. No obstante, la compañía ha tomado «medidas adicionales» para mitigar la generación de contenido dañino, como filtrar datos de entrenamiento que contengan imágenes «inseguras», implementar nuevas advertencias relacionadas con avisos problemáticos y bloquear tantos términos problemáticos como sea posible en la herramienta.

Es importante destacar que el conjunto de capacitación de Stable Diffusion XL 1.0 incluye obras de arte de artistas que han protestado contra el uso de su trabajo como datos de entrenamiento para modelos de IA generativa, incluida la propia Stability AI. Aunque la compañía argumenta estar protegida legalmente por la doctrina del uso justo en los EE. UU., varios artistas y la empresa de fotografía de archivo Getty Images han presentado demandas para detener esta práctica. En respuesta, Stability AI ha colaborado con la startup Spawning para respetar las solicitudes de «exclusión voluntaria» de estos artistas y continúa incorporando sus peticiones en sus conjuntos de datos de entrenamiento.

Con el lanzamiento de Stable Diffusion XL 1.0, Stability AI también está introduciendo una función de ajuste fino en fase beta para su API. Esta característica permitirá a los usuarios especializarse en la generación de imágenes relacionadas con personas específicas, productos y más, utilizando solo cinco imágenes para entrenar el modelo. Además, la compañía está expandiendo su colaboración con AWS (Amazon Web Services) al llevar Stable Diffusion XL 1.0 a Bedrock, la plataforma en la nube de Amazon para alojar modelos de IA generativa.

Mientras la competencia se intensifica, Stability AI enfrenta desafíos comerciales y busca impulsar nuevas capacidades y asociaciones. Aunque la compañía ha recaudado más de 100 millones de dólares en capital de riesgo hasta la fecha, recientemente tuvo que cerrar un billete convertible de 25 millones de dólares en junio y ha estado buscando ejecutivos para impulsar sus ventas.

El CEO de Stability AI, Emad Mostaque, expresó su entusiasmo por el lanzamiento de Stable Diffusion XL 1.0, destacando el compromiso de la empresa de trabajar junto con AWS para brindar soluciones innovadoras a la comunidad de IA y a sus clientes. Con esta última versión, Stability AI busca continuar su legado de innovación y proporcionar a la comunidad de desarrolladores modelos de acceso abierto líderes en el mercado.


Descubre más desde TecnoAp21

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario