Necesito ayuda para transcribir audios de llamadas de emergencia
Estoy trabajando en un proyecto para analizar la factibilidad de la transcripcion a llamadas de emergencia (más específicamente cuando uno pide una ambulancia por X motivos). Entonces estos audios que se guardan en una base de datos tienen una calidad de 8kHz por la infraestructura misma de la institución, no se puede mejorar eso y los modelos de transcripcion de IA trabajan mejor con audios de 16 kHz, entonces estoy probando limpiar el audio mediante IA también ya que desconozco de conocimientos técnicos para preprocesar audios yo mismo, como herramientas de transcripcion he usado Whisper y GoodTape que son como las mejores que he encontrado pero el problema es la calidad del audio, las transcripciones no están siendo fiables, con un WER (Word error rate) del 50% aproximadamente lo que es la mitad del texto equivocado prácticamente, entonces necesito ayuda porque con la mejora de audio no he podido avanzar mucho porque no la mejora tanto con las IAs que he utilizado, que herramientas conocen que me puedan ayudar, como han trabajado con las transcripciones de audio o algún consejo para trabajar con transcripciones? recordar que es un análisis de factibilidad por ende no hay dinero involucrado, me muevo en el espectro de lo gratis, se que pagando deberían haber mejoras contundentes.