Noticias

¿Cómo subir audios a Gemini y para qué sirve?

Por

Sep 9, 2025

Ya puedes subir audios a Gemini cómo y para qué sirve

Google continúa ampliando las funciones de Gemini, su inteligencia artificial más avanzada, y ahora permite subir archivos de audio para que la IA los analices. Esta es una opción muy interesante tanto para estudiantes como para profesionales que trabajan con entrevistas, reuniones o conferencias grabadas.

La nueva función está disponible en Android, iOS y la versión web de Gemini. Si te interesa utilizarla, pero no sabes cómo, ¡no te preocupes! En este artículo te mostraremos paso a paso cómo subir audios a Gemini, como así también para qué sirve esta nueva herramienta.

Así puedes subir audios a Gemini

Para que puedas utilizarla, será necesario que actualices la app de Gemini a la última versión. Por otro lado, si quieres subir audios desde la versión web, no tendrás que hacer absolutamente nada, pues el despliegue de la función se realizó a nivel de servidor (deberías poder acceder a la misma sin complicaciones).

Abre la app Gemini desde tu dispositivo móvil.
Pulsa sobre el signo “+” que se ubica en la esquina inferior izquierda.
Presiona en “Archivos”.

Selecciona el audio que deseas subir a Gemini.
Indícale a Gemini que es lo que quieres que haga con el audio.
Por último, pincha en el botón “Enviar”.

Como bien te mencionamos anteriormente, esta función está disponible para dispositivos móviles y ordenador (a través de la versión web). En ambas plataformas podrás cargar formatos comunes como MP3, M4A o WAV, y en poco segundos la IA comenzará a procesarlos.

¿Qué puedes hacer con los audios en Gemini?

El potencial de esta función va más allá de la simple transcripción. Una vez que subes el archivo, puedes pedirle a Gemini distintas tareas para ahorrar tiempo y organizar mejor la información:

Transcribir: convierte el audio en texto, perfecto para conferencias o entrevistas.
Resumir: extrae los puntos clave de una charla larga.
Identificar oradores: diferencia entre las voces de distintos participantes.
Traducir: pasa el contenido a otro idioma en segundos.
Extraer datos concretos: puedes pedirle frases literales, citas o tareas pendientes mencionadas en la grabación.

En pocas palabras, esta función de Gemini permite convertir cualquier nota de voz o archivo de audio en un documento estructurado, fácil de leer y de buscar.

Límites de la función

Al igual que la herramienta que permite generar vídeos en Gemini, la función en cuestión tiene ciertas restricciones que conviene tener en cuenta:

Usuarios gratis: pueden subir hasta 10 minutos de audio por archivo.
Usuarios de pago (Google AI Pro o Ultra): el límite sube hasta 3 horas de audio.
Número máximo de archivos: se pueden subir hasta 10 archivos a la vez, combinando audios con otros tipos de documentos compatibles.

Es necesario recordar que, aunque Gemini es muy precisa, puede cometer errores de interpretación en transcripciones largas. Por eso desde aquí recomendamos revisar los resultados antes de usarlos en un trabajo o documento importante