La generación de imágenes impulsada por IA es una tecnología en auge que tiene el potencial de transformar una amplia gama de industrias, desde el comercio electrónico hasta la publicidad y el entretenimiento. En los últimos años, los gigantes tecnológicos y nuevas empresas han lanzado sus propios generadores de imágenes, incluidos, DALL-E 2 y DALL-E 3 de OpenAI. Ahora, Amazon se ha unido a la lista con el lanzamiento de Titan Image Generator.

Recientemente, Amazon presentó un chatbot basado en IA que rivaliza con ChatGPT. Pero, con el nuevo generador de imágenes por IA, la empresa quiere revolucionar la forma en que las personas crean y usan las imágenes. Amazon Titan está basado en un conjunto masivo de datos, lo que le permite generar representaciones realistas y de alta calidad. Actualmente, la aplicación está disponible en versión preliminar para los clientes de AWS en Bedrock.

Amazon Titan: el nuevo generador de imágenes por IA estilo DALL-E

En un discurso de apertura en su conferencia AWS re:Invent 2023, Amazon presentó Titan, un nuevo modelo de IA que puede transformar imágenes con un solo clic. “Titan Image Generator es una herramienta poderosa que puede utilizarse para cambiar el fondo de una imagen, crear imágenes de estilo de vida o incluso generar imágenes completamente nuevas”, dijo Swami Sivasubramanian, vicepresidente de servicios de datos y aprendizaje automático de AWS.

“Por ejemplo, podrías tomar una foto de tu perro en tu patio trasero y usar Titan Image Generator para cambiar el fondo por una playa tropical. O podrías usar el modelo para crear una imagen de una persona caminando por una ciudad que no existe”, explicó Sivasubramanian. Además, demostró el poder de la app con un ejemplo de una imagen de una persona sentada en un café. Con solo unos pocos clics, cambió el fondo de la imagen a una playa, una montaña o una ciudad.

Las imágenes creadas con Amazon Titan también vendrán con una marca de agua invisible. Esta es una medida de seguridad diseñada para ayudar a mitigar la difusión de información errónea e imágenes de abuso generadas por IA. Estas marcas de agua son “resistentes a manipulaciones”, lo que significa que es difícil o imposible eliminarlas o modificarlas sin dañar la imagen.

Amazon Titan, una herramienta más precisa

Una de las principales características de Titan es su capacidad para reducir las distorsiones en las imágenes. Estas distorsiones, a menudo conocidas como “imágenes Frankenstein”, pueden incluir miradas distorsionadas, manos adicionales o dedos que no tienen sentido en el contexto de la imagen. Para evitar estas distorsiones, la app usa un nuevo algoritmo de aprendizaje automático que es capaz de comprender mejor las relaciones entre los objetos en una imagen.

Además de reducir las distorsiones, Amazon Titan también es capaz de procesar prompts complejos que detallan múltiples objetos. Esto significa que puede generar una serie de variaciones de una imagen, lo que puede ser útil para creadores de contenido, publicidad y otros profesionales que necesitan imágenes para sus proyectos. Además, la capacidad de procesar prompts complejos, la hace más precisa, ofreciendo grandes volúmenes de imágenes a bajo coste.

Amazon Titan: ¿una herramienta para el bien o para el mal?

Amazon Titan aún está en desarrollo, pero tiene el potencial de revolucionar la forma en que se crean y usan las imágenes. Esta herramienta está entrenada usando un conjunto diverso de datos. Sin embargo, la empresa no ha explicado exactamente de dónde provienen esos datos. Esto ha generado preocupaciones sobre la posibilidad de que el modelo esté sesgado.

Por ejemplo, si el modelo está entrenado en un conjunto de datos que contiene principalmente imágenes de personas blancas, es más probable que genere imágenes de personas blancas. Esto podría tener un impacto negativo en las personas de color. Además, si el modelo está entrenado en un conjunto de datos que contiene contenido tóxico, es más probable que genere imágenes tóxicas. Esto podría incluir imágenes que son racistas, sexistas u ofensivas.

La empresa ha dicho que el modelo incluye mitigaciones integradas de toxicidad y sesgo. Sin embargo, no está claro cuán efectivas son. Algunas compañías que desarrollan generadores de imágenes, como Stability AI, permiten a los creadores optar por no participar en conjuntos de datos de entrenamiento si así lo desean. Otros, incluidos Adobe y Getty Images, están estableciendo esquemas de compensación para los creadores, aunque no siempre bien pagados o transparentes.

Amazon, por su parte, no ofrece ninguna de estas opciones. El modelo podría incluir contenido creado por artistas y fotógrafos. Esto significa que es posible que algunas de las imágenes generadas infrinjan los derechos de autor. Sin embargo, Amazon ha dicho que protegerá a los clientes acusados ​​de violar los derechos de autor con imágenes generadas por Titan de acuerdo con su política de indemnización por IA.

Amazon Titan es una herramienta poderosa que puede ayudar a crear imágenes de alta calidad. Aun así, depende de los creadores de contenido utilizarla de forma ética y responsable.