Aplicaciones

OpenAI presenta DALL-E 3, su nueva IA generativa que integra ChatGPT

Por

Sep 21, 2023

DALL-E 3 es oficial y viene con ChatGPT integrado

OpenAI anunció DALL-E 3, la última iteración de su modelo de IA para crear imágenes desde texto, que ahora se integra con ChatGPT. DALL-E 3 es capaz de generar imágenes detalladas a partir de descripciones complejas, incluyendo elementos de texto como etiquetas y letreros, superando los desafíos previos. Aunque en fase de investigación preliminar, estará disponible para los usuarios de ChatGPT Plus y Enterprise a partir de octubre.

Al igual que su predecesor, DALL-E 3 transforma descripciones en imágenes únicas. Aunque no se han revelado detalles técnicos, se presume que sigue entrenándose con millones de imágenes de artistas y fotógrafos, potencialmente con nuevas técnicas y más tiempo de entrenamiento computacional.

DALL-E 3 con integración nativa ChatGPT

DALL-E 3 viene con una novedad: la integración total con ChatGPT. Ahora, no necesitas esforzarte en crear una descripción detallada para guiar a DALL-E 3. Simplemente, podrás pedir a ChatGPT que te ayude a formular un mensaje, y el chatbot generará un párrafo que DALL-E 3 seguirá al pie de la letra. Sin embargo, también podrás usar tus propias indicaciones, si tienes ideas específicas en mente.

OpenAI ha puesto un gran énfasis en la seguridad de DALL-E 3 para prevenir la generación de contenido inapropiado. Han trabajado con equipos de seguridad externos y han implementado medidas como los clasificadores de entrada para evitar indicaciones explícitas o violentas. Además, DALL-E 3 no podrá recrear imágenes de figuras públicas.

¿Cuándo llegará DALL-E 3? Esta actualización estará disponible primero para los usuarios de ChatGPT Plus y ChatGPT Enterprise en octubre. Luego, llegará a los laboratorios de investigación y su servicio API en otoño. Aunque OpenAI planea un lanzamiento gradual, aún no ha anunciado una fecha para la disponibilidad gratuita de la herramienta al público en general.

Lo nuevo de DALL-E 3

1 de 11

Según los ejemplos presentados en el blog promocional de OpenAI, DALL-E 3 se destaca como un modelo de síntesis de imágenes notablemente superior en términos de seguir indicaciones. Aunque los ejemplos de OpenAI fueron elegidos cuidadosamente por su eficacia, se observa que este modelo sigue las instrucciones de manera precisa y representa objetos de manera convincente con mínimas deformaciones.

Comparado con su predecesor, DALL-E 2, OpenAI afirma que DALL-E 3 perfecciona detalles más pequeños, como las manos, creando imágenes atractivas de manera natural, sin necesidad de trucos o ajustes rápidos.

En contraste, otros modelos de IA que también permiten crear imágenes a partir de texto, como Midjourney, logran detalles fotorrealistas, pero requieren ajustes no intuitivos mediante indicaciones para controlar la salida de la imagen.

Además, DALL-E 3 puede incluir texto dentro de las imágenes, algo que su predecesor no podía hacer, aunque algunos competidores como Stable Diffusion y DeepFloyd están mejorando en ese aspecto. Este avance sugiere un mayor potencial en la generación de imágenes enriquecidas con texto.

Por ejemplo, la primera imagen de la galería que te mostramos arriba fue creada con un mensaje que incluía las palabras: «una ilustración de un aguacate sentado en la silla de un terapeuta, diciendo ‘I just feel so empty inside’ con un agujero del tamaño de un hoyo en el centro». Se puede ver que DALL-E 3 creó perfectamente un aguacate de dibujos animados con la cita del personaje encapsulado en un globo de diálogo.

OpenAI libera las imágenes de DALL-E 3 de los derechos de autor

Actualmente, tanto en la política de derechos de autor de los Estados Unidos como de la Unión Europea, se establece que las obras de arte generadas exclusivamente por inteligencia artificial no pueden recibir protección de derechos de autor. Esto significa que cualquier imagen creada mediante DALL-E 3 se considera de dominio público.

Aunque OpenAI no lo declara explícitamente, afirma que “las imágenes generadas con DALL-E 3 son tuyas para usarlas, y no necesitas nuestro permiso para reimprimirlas, venderlas o comercializarlas”. Esto marca un cambio significativo con respecto al año pasado, cuando OpenAI restringía el uso de las imágenes de DALL-E 2 bajo una licencia que les otorgaba la propiedad de todas las generaciones.

OpenAI ha colaborado con expertos, conocidos como “red teamers”, para identificar y mitigar posibles riesgos, como sesgos perjudiciales o la generación de propaganda y desinformación. Aunque OpenAI no ha abordado la posibilidad de que su herramienta pueda alterar el registro histórico con creaciones convincentes, menciona que están experimentando con un “clasificador de procedencia” que podría ayudar a determinar si una imagen fue generada por DALL-E 3 o no.

Definitivamente, DALL-E 3 es una herramienta poderosa que tiene el potencial de generar imágenes detalladas, incluyendo elementos de texto como etiquetas y letreros. Seguramente abrirá nuevas posibilidades para la creatividad y la expresión.