¿Imaginas poder escucharte a ti mismo en un montón de idiomas diferentes aun cuando no sepas absolutamente nada de ellos? Gracias a la inteligencia artificial esto está muy cerca de ser posible. ¿De qué estamos hablando? Pues de ElevenLabs AI, una IA capaz de clonar tu voz en 30 idiomas diferentes e incluso reproducir tus maneras al hablar casi a la perfección. Sus aplicaciones serían fantásticas, aunque reconocemos que mete un poco de miedo.
ElevenLabs AI v2 llega para revolucionar el mundo de las voces humanas generadas por inteligencia artificial
Por si no lo sabías, el equipo de ElevenLabs tiene tiempo trabajando en un modelo de IA multilingüe que podría revolucionar el mundo. La primera versión se estuvo desarrollando en privado y era accesible a muy pocas personas. Sin embargo, ElevenLabs AI v2 es mucho más poderosa, desde hace algunos meses estuvo en fase de prueba y tras superarla de forma contundente ahora es accesible para todos (los que paguen).
¿Qué tiene de especial? Es capaz de imitar voces en nada menos que 30 idiomas diferentes y de forma muy convincente. Además, es tan completa que puede mimetizar tus matices al hablar, incluso aquellos que están impulsados por tus emociones. Vamos, que serás capaz de oírte a ti mismo en diferentes idiomas, aunque no los manejes, porque esta IA será capaz de clonar tu voz casi a la perfección.
Al momento de escribir este artículo, ElevenLabs AI v2 era capaz de detectar automáticamente el coreano, holandés, inglés y vietnamita. ¿Y el resto? También es capaz de reconocerlos y hace su trabajo, pero deberás indicarle manualmente en qué idioma estás hablando.
De momento, el laboratorio ofrece dos servicios de clonación de voz con su modelo multilingüe, ambos de pago: el primero es un clásico sistema de texto a voz (text-to-speech), que transformará contenido escrito en palabras; mientras que el segundo es ‘Voice Lab’, que es el servicio desarrollado para clonar voces específicas y el que nos trae aquí hoy.
Según el CEO y cofundador de ElevenLabs, Mati Staniszewski: “con este lanzamiento estamos un paso más cerca de hacer realidad el sueño de que las voces creadas por IA con calidad humana estén disponibles en todos los dialectos. Nuestra herramienta ayuda a nivelar el campo de juego a muchas personas y brinda capacidades de audio hablado en alta calidad a todos los creadores”.
Definitivamente, es una genialidad, aunque lo cierto es que también pueden existir algunas complicaciones éticas y morales a su alrededor. ¿Hablamos un poco al respecto?
Los modelos de IA multilingüe y basados en voz pueden ser una bendición, pero también una maldición
Tal como mencionamos en los artículos dedicados al nuevo Traductor Universal de Google y el de la alternativa que está desarrollando Meta, los modelos de IA multilingüe capaces de recrear voces humanas son fantásticos, pero también pueden ser poco éticos y hasta peligrosos.
Si los desarrolladores no son estrictos sobre su uso, su software podría ser utilizado para clonar voces de personas famosas y así difundir información falsa sobre ellas u otros. Eso, o suplantar identidades para estafar a otros. De la mano con eso último, también podría usarse para recrear canciones de artistas sin su consentimiento, algo que ya fue noticia hace algunos meses. En fin, puede llegar a ser una herramienta riesgosa.
En el caso de ElevenLabs parece que lo saben bien y por ello el servicio de clonación únicamente está disponible para los usuarios que paguen. Aparte, el laboratorio se ha asegurado de agregar una capa de seguridad adicional al incluir una herramienta de detección que también está basada en IA y permite identificar si una voz es real o creada por su modelo.
Ahora bien, ¿y lo ético? Lo anterior evidentemente tiene algo de esto, pero también cae en lo delictivo. Sin embargo, hay situaciones en la que emplear una IA como esta no es ilegal, pero afecta a muchas personas.
Ejemplos de ello sería a los gremios de locutores e intérpretes, pues muchas empresas podrían reemplazar a estos trabajadores por un software basado en IA que les es mucho más rentable. De hecho, es algo que está sucediendo ya de alguna manera: editoriales como Lukeman Literary ya se valen de la IA para traducir sus audiolibros y cada vez se suman empresas a la tendencia. No solo les sale más económico al no necesitar estudios, equipos ni a un profesional en la materia, también se hace infinitamente más rápido.