Meta lanza un modelo de IA que puede generar melodías y piezas musicales a partir de texto. AudioCraft es el nombre de la nueva herramienta que se destaca por su capacidad para abarcar música, sonido, compresión y generación de contenido. Esta herramienta incluye tres modelos únicos: AudioGen, EnCodec y MusicGen que fueron creados con fines de investigación y para ayudar a profesionales a avanzar en el campo del audio y la música generados por IA.
Audiocraft, la nueva IA de Meta que hace música a partir de texto, opera mediante el reconocimiento y replicación de patrones de datos extraídos de la web. Según la empresa, la familia de modelos de esta herramienta puede producir audio de alta calidad, consistente y más largo, utilizando solo la interacción del lenguaje natural. El objetivo de esta IA es permitir a los músicos crear nuevas composiciones sin tener que tocar una sola nota en un instrumento.
AudioCraft: la nueva IA de Meta que hace música a partir de texto
Meta ha presentado en su blog su más reciente herramienta de Inteligencia Artificial. Esta funciona igual que las plataformas capaces de generar imágenes. Simplemente, se debe ingresar un prompt de texto y la herramienta se encarga del resto.
Según la compañía, AudioCraft facilita tareas como agregar una banda sonora a un anuncio de vídeo en Instagram para pequeñas empresas, ahorrando tiempo y esfuerzo en la búsqueda de la música adecuada.
Con AudioCraft, ya no sería necesario buscar durante horas diferentes canciones antes de cargar un Reel en Instagram. Basta con escribir una descripción del tipo de música que se necesita y la Inteligencia Artificial se encargará de generarla.
Las posibilidades de creación con esta IA parecen ser infinitas. Con ella se espera poder disfrutar de nostálgica música disco de los años 80 hasta cautivadores instrumentos de jazz, e incluso efectos y sonidos de animales, bocinas de autos o pisadas.
AudioCraft y sus Modelos IA
Esta herramienta consiste en tres modelos, los cuales fueron diseñados para que los músicos de sonido brinden inspiración. Además, fueron diseñados para ayudar a las personas a intercambiar ideas rápidamente e iterar sus composiciones de nuevas maneras.
- MusicGen se entrenó en un gran conjunto de datos de alrededor de 400.000 grabaciones de música, incluidas 20.000 horas de música propiedad de Meta y con licencia específica. Este entrenamiento se hizo usando 10.000 pistas para generar música a partir de indicaciones de texto.
- AudioGen fue entrenado con efectos de sonido públicos para generar audio basado en indicaciones de texto. El modelo puede producir sonidos ambientales realistas al proporcionar una descripción escrita de una escena acústica.
- EnCodec es un modelo que permite generar música de mayor calidad con menos artefactos.
Audiocraft al ser de código abierto, brinda a otros la oportunidad de experimentar con enfoques innovadores. No obstante, a pesar de las emocionantes posibilidades que esta herramienta ofrece, algunos artistas y expertos de la industria han expresado su inquietud. Esto por la posibilidad de que ocurran violaciones de derechos de autor, lo que podría generar problemas en términos de propiedad intelectual.
Se espera que AudioCraft de Meta compita con MusicLM de Google, una herramienta que también puede generar música de alta fidelidad a partir de indicaciones de texto y tarareos, que se puso a disposición del público en mayo.