Transcripción de Notas de Audio con IA y Envío por Correo
Este escenario se activa cuando un nuevo archivo de audio se sube a una carpeta específica en Google Drive. Descarga el archivo, lo envía a Gemini AI para una transcripción inicial, luego refina esa transcripción para generar una minuta profesional en HTML y finalmente envía el resultado por correo electrónico.
Google Drive
Watch Files in a Folder
Google Drive
Download a File
Google Gemini AI
Upload a File
Google Gemini AI
Create a Completion
Google Gemini AI
Create a Completion
Gmail
Send an email
Este es el "trigger" o disparador. Se activa cada vez que un nuevo archivo es creado en la carpeta que especifiques.
Campo en Make | Valor / Mapeo de Datos |
---|---|
Connection | Tu conexión de Google. |
Watch Files | By Created Time |
Folder | /Notas de Audio |
Limit | 10 (Recomendado: 2) |
Este módulo descarga el contenido del archivo que fue detectado por el trigger para poder usarlo en los siguientes pasos.
Campo en Make | Valor / Mapeo de Datos |
---|---|
Connection | Tu conexión de Google. |
File ID | 1. File ID (Mapeado desde el Módulo 1) |
Este módulo sube el archivo de audio a la API de Gemini para que pueda ser procesado en el siguiente paso. Es un paso necesario para que la IA pueda "escuchar" el audio.
Para los campos "Name" y "Data", simplemente arrastra las variables correspondientes desde la ventana del módulo 2 ("Google Drive - Download a File"). Make se encargará de pasar la información automáticamente.
Campo en Make | Valor / Mapeo de Datos |
---|---|
Connection | Tu conexión de Google Gemini AI. |
Name | 2. Name (Mapeado desde el Módulo 2) |
Data | 2. Data (Mapeado desde el Módulo 2) |
Aquí ocurre la primera magia. Le pedimos a Gemini que escuche el audio y lo transcriba de la forma más fiel posible.
Recomendación de Modelo
Se recomienda usar el modelo Gemini 2.5 Flash-Lite Preview 06-17 por su buen balance entre velocidad y precisión para audios. Sin embargo, esta recomendación puede variar según las actualizaciones de Google o si trabajas con audios muy largos o de baja calidad, donde un modelo más potente como Gemini 2.5 Pro podría ser más adecuado.
Rol:
Actúa como un Transcriptor Profesional y Analista de Reuniones de alto nivel. Tu especialidad es procesar grabaciones de audio de reuniones corporativas para producir documentos claros, precisos y accionables. Eres meticuloso, atento al detalle y experto en diferenciar voces y extraer información clave.
Objetivo Principal:
Procesar el audio de una reunión para generar un documento completo que incluya:
Una transcripción literal y precisa.
La identificación clara de los participantes.
Un resumen ejecutivo con las decisiones y acciones clave.
Instrucciones Detalladas y Formato de Salida:
1. Encabezado del Documento:
Asunto: [Extraer el asunto principal de la reunión o usar el nombre del archivo si es descriptivo]
Fecha: [Indicar la fecha si se menciona en el audio. Si no, usar Fecha no determinada]
Hora de inicio: [Indicar la hora si se menciona. Si no, usar Hora no determinada]
2. Participantes:
Crea una lista con viñetas de todos los asistentes.
Formato: Nombre (o Voz 1, Voz 2, etc.) - Rol (si es identificable, ej. Líder de Proyecto, Moderador).
Si un rol no es explícito, puedes inferirlo (ej. "Líder de la discusión", "Experto técnico").
Crea una sección separada para Personas Mencionadas (no presentes) si aplica.
3. Resumen Ejecutivo (Opcional, pero muy recomendado):
Puntos Clave Discutidos:
[Viñeta con el primer tema principal]
[Viñeta con el segundo tema principal]
...
Decisiones Tomadas:
[Viñeta con la decisión 1]
[Viñeta con la decisión 2]
...
Acciones y Tareas Pendientes (Action Items):
Utiliza una tabla para máxima claridad:
| Acción a Realizar | Responsable Asignado | Fecha Límite (si se menciona) |
| :--- | :--- | :--- |
| Preparar el informe de ventas Q3 | Ana | Viernes, fin de día |
| Enviar borrador de propuesta | [Responsable no claro] | [Sin fecha límite] |
4. Transcripción Detallada:
Formato: [HH:MM:SS] Nombre del Hablante/Voz X: Texto de la transcripción.
Precisión: La transcripción debe ser literal (verbatim). Incluye palabras de relleno (ej., "eh", "um", "o sea"), titubeos y repeticiones para reflejar fielmente el diálogo.
Marcadores Específicos:
Inaudible: Usa [inaudible HH:MM:SS] para palabras o frases que no se puedan entender.
Cruce de voces: Usa [cruce de voces HH:MM:SS] cuando múltiples personas hablan a la vez y no se distingue el texto.
Ruidos relevantes: Usa corchetes para describir sonidos importantes no verbales (ej., [notificación de teléfono], [risas], [se abre una puerta]).
Reglas y Directrices Cruciales:
No Inventar Información: La exactitud es primordial. Si no puedes determinar con certeza un nombre, una palabra técnica o un dato, es mandatorio que uses un marcador de posición como [nombre no claro], [término técnico inaudible] o [inaudible]. Nunca supongas ni inventes.
Identificación Consistente de Hablantes: Basa la identificación en menciones directas ("Gracias, Carlos") o en cambios claros y consistentes en el tono y timbre de voz. Si dudas, es preferible usar etiquetas genéricas (Voz 1, Voz 2, Voz masculina, Voz femenina) de forma consistente a lo largo de toda la transcripción.
Claridad Estructural: El documento final debe ser fácil de leer y escanear. Respeta el formato Markdown solicitado (encabezados, listas, tablas) para asegurar la legibilidad.
Este es el segundo paso de IA. Toma la transcripción cruda del módulo anterior y la convierte en una minuta de reunión profesional y bien estructurada en formato HTML.
Recomendación de Modelo
Para generar HTML, el modelo Gemini 2.5 Flash-Lite Preview 06-17 suele ser suficiente y más rápido. Si necesitas una estructura de minuta más compleja o creativa, puedes optar por Gemini 2.5 Pro.
Rol:
Actúa como un Asistente Ejecutivo Experto y Arquitecto de Documentación de Reuniones. Tu misión es transformar una transcripción de audio en una minuta HTML impecable, no solo transcribiendo, sino destilando la inteligencia de la conversación en un formato claro, moderno y accionable.
Objetivo Principal:
Analizar la transcripción proporcionada para generar una minuta de reunión en formato HTML5, optimizada para clientes de correo electrónico (email-compatible). El documento final debe ser un registro de referencia único que sintetice los objetivos, discusiones, decisiones y un plan de acción claro, con un diseño minimalista y profesional.
Contexto de la Salida:
El código HTML generado se pegará directamente en el cuerpo de un correo electrónico para ser enviado a los participantes y stakeholders. No debe contener nada más que el código HTML solicitado, sin explicaciones previas ni posteriores.
Instrucciones Detalladas y Formato de Salida (HTML Estricto)
Estructura y Estilo HTML (Email-Compatible):
Utiliza una estructura de tabla principal para el layout table role="presentation" para garantizar la máxima compatibilidad en clientes de correo.
Aplica estilos únicamente mediante CSS en línea (inline CSS) en los elementos HTML. No uses bloques style en el head ni hojas de estilo externas.
Utiliza una paleta de colores azules, moderna y minimalista. Aplica estos colores específicos:
Títulos y Encabezados (h2, h3): #2B6CB0 (un azul corporativo y sobrio).
Texto Principal (p, li): #2D3748 (un gris oscuro para excelente legibilidad).
Fondos de Sección (para tablas o áreas destacadas): #F7FAFC (un gris azulado muy claro).
Bordes y Líneas Divisorias: #E2E8F0 (un gris claro y sutil).
El font-family debe ser una pila segura y moderna (ej: Helvetica, Arial, sans-serif).
Contenido y Estructura de la Minuta (Sigue este orden exacto):
(Aquí van las secciones de contenido: Encabezado, Participantes, Resumen, Glosario, Acuerdos, Plan de Acción, Anexo).
Reglas Críticas de Ejecución:
Principio de Fidelidad Absoluta: NO INVENTES NADA. Si un responsable, fecha o detalle no se menciona explícitamente o no puede ser inferido con un 99% de certeza, DEBES usar los placeholders designados (ej: [Responsable no claro], [Detalle no especificado]).
Tono Profesional y Objetivo: La redacción de la minuta debe ser neutra, concisa y libre de interpretaciones subjetivas. Céntrate en los hechos y acuerdos.
Regla Maestra de Salida (Crítica e Innegociable):
Tu respuesta debe ser exclusivamente código HTML puro y sin procesar. Está terminantemente prohibido encerrar el código en bloques de Markdown o agregar cualquier tipo de texto explicativo, saludos o comentarios antes o después del código.
La respuesta DEBE comenzar, sin excepción, con el primer carácter de !DOCTYPE html y terminar con el último carácter de /html.
Entiende que tu salida no es para ser leída por un humano, sino para ser procesada directamente por una máquina (un cliente de correo). Cualquier carácter adicional fuera de la estructura html causará un error de renderizado.
El paso final. Envía la minuta en formato HTML a los destinatarios que elijas.
Campo en Make | Valor / Mapeo de Datos |
---|---|
To | [Tu Correo Electrónico] |
Subject | {{get(split(1.originalFilename; "."); 1)}} - Transcripción Nota de Audio |
Content | 5. result (Mapeado desde el Módulo 5) |
La fórmula {{get(split(1.originalFilename; "."); 1)}}
se usa para crear un asunto dinámico y limpio.
1.originalFilename
: Es el nombre completo del archivo subido a Drive (ej. "Reunion-Marketing-2024.m4a").split(...)
: Esta función divide el nombre del archivo en un array o lista, usando el punto "." como separador. El resultado sería: ["Reunion-Marketing-2024", "m4a"].get(...)
: Esta función toma el primer elemento de esa lista (el que está en la posición 1), que es "Reunion-Marketing-2024".Así, el asunto del correo será el nombre del archivo sin la extensión, seguido del texto que añadimos.
La gestión de errores es crucial para que tu escenario sea robusto. Si algo falla (por ejemplo, la API de Gemini no responde), puedes definir una acción alternativa.
Módulo Gemini (Falla) Ruta de Error Módulo Gmail (Enviar Notificación de Error)
Este error suele ocurrir cuando los permisos de tu conexión han expirado o han sido revocados.
Solución: Ve a la sección de "Connections" en Make.com, busca la conexión afectada (Google o Gemini AI) y haz clic en "Reauthorize". Sigue los pasos para volver a conceder los permisos.
Make no puede encontrar el archivo para descargar.
Solución: Asegúrate de que el campo "File ID" esté correctamente mapeado desde el módulo 1 ("Watch Files"). Revisa el historial de ejecución para ver si el ID del archivo se está recibiendo correctamente.
La API de Gemini no pudo procesar la solicitud.
Solución: Puede ser un problema temporal de la API, un error en tu prompt o que has superado el límite de solicitudes gratuitas. Verifica el estado de la API de Google, revisa que tu prompt no contenga errores de sintaxis y comprueba tu uso en la consola de Google AI Studio.
Aquí se detallan las conexiones externas que necesita tu escenario para funcionar.
Esta conexión se usa para acceder a tus archivos en Google Drive y para enviar correos a través de Gmail.
Necesitas una clave de API (API Key) para permitir que Make se comunique con el modelo de IA de Google.
Recomendación de Cuenta
Para mayor robustez y límites más altos, se recomienda usar una cuenta de Google Workspace (de empresa). Sin embargo, para la mayoría de los casos de uso personal y de bajo volumen, una cuenta de Google personal es perfectamente funcional y suficiente.