Has grabado una entrevista de una hora y tienes que transcribirla. O quieres convertir ese episodio de podcast a texto para tu blog. MacWhisper es una aplicación para macOS que hace ese trabajo por ti, completamente en local en tu Mac sin tener que enviar el audio a un servidor.
¿Quién está detrás de MacWhisper?
MacWhisper fue lanzado en 2023 por Jordi Bruin de Ámsterdam, un conocido desarrollador indie en la comunidad Apple. La idea original era sencilla: OpenAI acababa de lanzar su potente modelo Whisper para reconocimiento de voz, pero era difícil de usar para usuarios normales de Mac. Jordi quería crear una aplicación accesible, con un principio importante: todo el procesamiento debe hacerse localmente, sin tener que enviar el audio a la nube.
Este enfoque de privacidad primero ha funcionado bien. MacWhisper ya se ha descargado más de 300.000 veces y ha ganado varios premios dentro de la comunidad Apple. La empresa detrás de la aplicación se llama Goodsnooze y permanece independiente, sin financiación externa ni adquisiciones. Jordi continúa desarrollando activamente, con actualizaciones regulares que añaden nuevas funcionalidades.
¿Para quién es MacWhisper?
MacWhisper es ideal para periodistas que necesitan transcribir entrevistas, podcasters que quieren transcribir sus episodios, estudiantes que graban clases y creadores de contenido que quieren añadir subtítulos a sus vídeos. Básicamente, cualquiera que necesite convertir regularmente audio o vídeo a texto y valore la privacidad.
Sin embargo, la herramienta no es para todos. Los usuarios de Windows no pueden usar la aplicación, ni tampoco las personas con un teléfono Android. Es realmente una historia exclusiva de Mac. También si trabajas principalmente en equipos y necesitas transcripciones en tiempo real en la nube, estarás mejor con una alternativa basada en la nube.
¿Qué puede hacer MacWhisper?
La versión gratuita de MacWhisper ofrece transcripción básica con los modelos de IA más pequeños. Para acceder a los modelos más precisos, procesamiento por lotes, reconocimiento de hablantes y todos los formatos de exportación necesitas la licencia Pro. Esto es lo que la aplicación puede hacer:
- Transcripción local: Todo el procesamiento se realiza en tu propio Mac. Tu audio nunca sale de tu dispositivo, lo que es ideal si trabajas con información sensible como entrevistas o grabaciones médicas. También funciona completamente sin conexión.
- Compatibilidad con más de 100 idiomas: Desde neerlandés e inglés hasta idiomas menos comunes. Reconoce automáticamente qué idioma se está hablando, o puedes seleccionar manualmente un idioma para obtener mejores resultados.
- Diarización de locutores: La aplicación intenta distinguir entre diferentes locutores y los etiqueta como Locutor 1, Locutor 2, etc. Útil en entrevistas o debates en panel, aunque la precisión es variable.
- Procesamiento por lotes: Arrastra una carpeta entera con archivos de audio a la aplicación y transcribe todo de una vez. Perfecto si quieres procesar varios episodios de podcast o entrevistas de golpe.
- Grabar el audio del sistema: Puedes grabar directamente el audio de tu Mac, incluyendo reuniones de Zoom, llamadas de Teams o vídeos de YouTube. La aplicación graba y transcribe al instante, sin necesidad de crear primero un archivo de audio separado.
- Amplias opciones de exportación: Exporta la transcripción a SRT y VTT para subtítulos, pero también a PDF, HTML, CSV y texto sin formato. Útil si quieres usar el texto en diferentes contextos.
- Diferentes modelos de IA: Puedes elegir entre modelos más rápidos pero menos precisos (Tiny, Small) o modelos más lentos pero más precisos (Medium, Large). Útil para valorar entre velocidad y calidad.
- Función de dictado: Además de transcribir archivos, también puedes dictar en directo. Habla por tu micrófono y ve aparecer el texto en tiempo real. Funciona como alternativa al dictado integrado de macOS.
Yo mismo uso MacWhisper regularmente para transcribir vídeos de YouTube. Arrastras un enlace de YouTube a la aplicación y automáticamente descarga y transcribe. Suele funcionar bien, aunque a veces algunos vídeos no se reconocen. Entonces tienes que descargar el audio manualmente primero.
¿Cuánto cuesta MacWhisper?
MacWhisper tiene una versión gratuita que puedes usar sin límites. Entonces tienes acceso a los modelos de IA Tiny y Small, que son menos precisos pero funcionan rápido. Para la mayoría de aplicaciones está bien, especialmente si tienes audio de buena calidad.
Si quieres la mejor calidad de transcripción, necesitas la licencia Pro. Cuesta 64 euros por un único pago y te da acceso de por vida a todas las funcionalidades: los modelos de IA más grandes y precisos, procesamiento por lotes, reconocimiento de hablantes y todos los formatos de exportación. No hay período de prueba, pero la versión gratuita ya te da una buena idea de cómo funciona la aplicación.
La gran ventaja frente a muchos competidores: es una compra única, no una suscripción. Pagas una vez y recibes todas las actualizaciones futuras gratis. Para personas que transcriben regularmente, resulta más barato rápidamente que una suscripción mensual de 10 o 20 euros.
¿En qué hay que fijarse?
El reconocimiento de hablantes (diarización) no siempre es fiable. En entrevistas con dos personas que hablan por turnos funciona razonablemente bien, pero en debates donde la gente habla a la vez o con mala calidad de audio, la aplicación comete errores con regularidad. A menudo tienes que corregir las etiquetas manualmente.
Si tienes un Mac Intel más antiguo, prepárate para largos tiempos de espera. La aplicación está optimizada para Apple Silicon (M1, M2, M3), y en chips Intel transcribir lleva mucho más tiempo. Una hora de audio puede tardar entre 30 y 40 minutos en lugar de 5-10 minutos en un chip M.
La función de dictado en vivo todavía tiene problemas iniciales. Yo mismo he experimentado cierres inesperados en usos específicos, y otros usuarios informan de problemas similares. Para transcribir archivos la aplicación funciona de forma estable, pero el modo dictado es menos fiable.
La mayor desventaja es, por supuesto, que la aplicación solo está disponible para macOS. No hay versión para Windows, ni versión web, ni aplicación para Android. Sí hay una versión para iOS, pero es independiente y tiene menos funcionalidades. Si trabajas en múltiples plataformas, tienes que buscar alternativas.
Alternativas a MacWhisper
Existen diversas alternativas si MacWhisper no se ajusta del todo a lo que buscas:
- Otter.ai: Elige esto si necesitas colaboración en tiempo real en la nube. Otter funciona en la nube con un modelo de suscripción, pero ofrece mejores funciones de equipo como transcripciones compartidas y colaboración en directo durante las reuniones.
- Aiko: Elige esto si buscas una herramienta básica de transcripción gratuita sin coste alguno. Aiko es más sencillo y tiene menos funciones, pero transcribe perfectamente y es totalmente gratuito.
- Superwhisper: Elige esto si principalmente dictas voz a texto en lugar de transcribir archivos. Superwhisper es comparable a MacWhisper pero se centra más en el dictado en directo y atajos de teclado para la productividad.
Preguntas frecuentes
Aquí están las respuestas a las preguntas más frecuentes sobre MacWhisper:
¿Están seguros mis datos?
Sí, toda la transcripción se realiza localmente en tu Mac. No se envía ningún audio a un servidor, todo permanece en tu propio dispositivo. Eso hace que MacWhisper sea ideal para grabaciones sensibles como entrevistas o información médica.
¿Funciona en Macs Intel?
Sí, MacWhisper funciona en Macs Intel, pero considerablemente más lento que en Macs con Apple Silicon. Los chips M1, M2 y M3 son mucho más rápidos procesando modelos de IA. En un Mac Intel, una hora de audio puede tardar entre 30 y 40 minutos en transcribirse.
¿Puedo grabar reuniones?
Sí, MacWhisper puede grabar el audio del sistema. Con ello puedes grabar y transcribir directamente reuniones de Zoom, Teams o Google Meet. La aplicación graba el sonido de tu Mac, incluyendo lo que sale por los altavoces.
¿Cuán precisas son las transcripciones?
Con los modelos de IA más grandes (Medium y Large), las transcripciones son muy precisas, especialmente con audio claro. Con ruido de fondo, acentos o términos técnicos, la aplicación comete errores a veces, pero en general la calidad es comparable a servicios de transcripción profesionales.
¿Puedo editar la transcripción en la aplicación?
Sí, puedes editar la transcripción directamente en MacWhisper. La aplicación tiene un editor integrado donde puedes corregir errores, renombrar hablantes y ajustar marcas de tiempo. Después lo exportas al formato deseado.
Conclusión
MacWhisper es una opción sólida si conviertes regularmente audio o vídeo a texto y la privacidad es importante para ti. La compra única de 64 euros se amortiza rápidamente si de otro modo tendrías que contratar una suscripción, y la calidad de transcripción es excelente. Yo mismo uso la aplicación con regularidad y estoy satisfecho, a pesar de pequeñas molestias como el soporte variable de YouTube. El desarrollo activo y las actualizaciones regulares dan confianza en que los errores se solucionarán. Para usuarios de Mac que quieren procesamiento local sin costes mensuales, es recomendable.





