ENCODEC, la IA de hipercompresión de audio de Meta que podría sepultar al MP3

Meta presenta alternativa codec mp3 mas eficiente

En la historia de los ordenadores, Internet, móviles y demás, han existido numerosos códecs de audio, pero el rey indiscutible sigue siendo el MP3. Con más de 30 años a cuestas, este códec de compresión se ha enfrentado a distintos rivales, pero siguen sin poder desplazarlo. ¿Hay mejores opciones? Definitivamente sí, AAC y OGG son prueba de ello y han ganado mucho terreno, pero la popularidad del MP3 sigue siendo abrumadora.

Hoy, un nuevo rival se asoma por el horizonte y cabalga sobre la Inteligencia Artificial. Se llama ENCODEC, está desarrollado por Meta, quiere sustituir al MP3 y promete una compresión de audio 10 veces mayor. ¿Estamos ante el códec de audio que revolucionará el mercado y reclamará para sí la corona?

Meta crea un modelo de IA que podría jubilar de una vez por todas al MP3, ¿revolucionará al mercado?

encodec codec audio 10 veces más potente que mp3

Meta acaba de presentar los primeros detalles de ENCODEC (nombre provisional), su códec hipercompresor de audio impulsado por IA. Fue desarrollado por su equipo de investigación fundamental de IA (FAIR) y, aunque pudiese utilizarse para cualquier cosa, está pensado para mejorar las comunicaciones en situaciones de mínima conectividad. ¿Un ejemplo de esto? Cuando estás en una llamada por WhatsApp y tienes mala conexión. Actualmente, la llamada se escucharía entrecortada o directamente se cancelaría por problemas de conectividad, pero con ENCODEC eso no pasará.

Lee también:  Los prototipos inéditos de Xiaomi se filtran en el sitio web oficial

ENCODEC es capaz de lograr una tasa de compresión 10 veces mejor que la del MP3 a 64 kbps, sin pérdida de calidad perceptible. MP3 es un códec de compresión con pérdida de calidad y obtener un archivo 10 veces más pequeño sin perder nada es toda una hazaña. Además, ya se probó comprimiendo un archivo de audio estéreo de 48 KHz (calidad de CD, el estándar de la industria musical) y los resultados fueron alucinantes.

¿Cómo funciona ENCODEC? A través de una red neural de extremo a extremo que se encarga de deconstruir y reconstruir señales auditivas en tres etapas:

  • Un codificador: que toma los datos sin comprimir y los transforma en una representación de mayor dimensión, pero menor velocidad de fotogramas.
  • Un cuantificador: que se encarga de comprimir la representación anterior en el tamaño deseado, mientras mantiene la información más importante para reconstruir la señal original. El archivo comprimido resultante de este paso es el que se almacena en disco o envía a través de Internet.
  • Un decodificador: que convierte la señal comprimida en un formato de onda lo más similar posible a la onda original.

¿No es así como funcionan los códecs de audio de toda la vida? Un poco sí, pero no son exactamente iguales.

Los discriminadores, la clave detrás de la excelente compresión de ENCODEC

como funciona encodec el codec de hipercompresion de audio de meta

La mayoría de los códecs (incluidos MP3, AAC y demás) descomponen las señales de audio en frecuencias que luego se codifican de forma más eficiente. Se utiliza un algoritmo, y su base para que los cambios no sean perceptibles es el conocimiento de la psicoacústica humana. Sin embargo, los algoritmos de los códecs clásicos son rígidos, no cambian en nada más allá de un par de configuraciones.

Lee también:  El Xiaomi 14 Ultra tendrá una variante con cámara oculta bajo la pantalla (rumor)

Por el contrario, los modelos de Inteligencia Artificial aprenden y mejorar constantemente, adaptándose a las necesidades del momento y logrando resultados mucho más eficientes. En el caso de ENCODEC, lo que se emplea para optimizar la compresión de una señal de audio son los discriminadores.

Los discriminadores comparan constantemente muestras reconstruidas de audio con muestras reales, como si fuese un juego del gato y el ratón. ¿Su objetivo? Comprimir cualquier señal de la manera más eficiente posible, de forma personalizada para cada frecuencia, sin seguir una misma receta para todo. ¿El resultado? Que las muestras reconstruidas sean perceptivamente muy similares a las originales, pero con un tamaño muchísimo menor.

Un gran paso hacia adelante y un futuro prometedor, pero queda camino por recorrer

el futuro del audio en internet pasa por la IA

No hay duda de que ENCODEC es genial y tiene suficientes papeletas a su favor como para sustituir al MP3 en un futuro. De hecho, Meta asegura que todavía puede mejorarse y que podría ser una solución para múltiples aplicaciones más allá de las llamadas, por ejemplo: en el metaverso, las videoconferencias, el streaming de películas y juegos, etc.

No obstante, es la misma compañía quien asegura que todavía falta mucho por hacer. Siendo un modelo experimental de IA, ENCODEC todavía requiere mucha potencia para utilizarse y comprimir archivos a los niveles mostrados.

Lee también:  Estados Unidos prohibió la venta del Apple Watch: ¿cuál fue el motivo?

El modelo todavía tiene que pulirse y también será necesario que los chips neurales (NPU) de móviles y ordenadores sean más potentes y eficientes. Solo después de esto, ENCODEC podría competir contra el MP3 en el mercado de consumo.