Una ilustración de un micrófono proporcionada por Adobe.
Agrandar / El servicio Enhance Speech de Adobe puede eliminar el ruido de fondo de ciertas grabaciones de voz.

Adobe

Adobe lanzó recientemente una herramienta gratuita de procesamiento de audio impulsada por IA que puede mejorar algunas grabaciones de voz de baja calidad al eliminar el ruido de fondo y hacer que la voz suene más fuerte. Cuando funciona, el resultado suena como una grabación realizada en una cabina de sonido profesional con un micrófono de alta calidad.

La nueva herramienta, llamada Enhance Speech, se creó como parte de un proyecto de investigación de IA llamado Project Shasta. Adobe Project recientemente cambió el nombre de Shasta a Adobe Podcast.

El uso de Enhance Speech es gratuito, pero requiere crear una cuenta de Adobe y funciona mejor con un navegador web de escritorio. Una vez registrados, los usuarios pueden cargar un archivo MP3 o WAV de hasta una hora de duración o 1 GB de tamaño. Después de unos minutos, puede escuchar el resultado en su navegador o descargar el audio limpio resultante.

En nuestras pruebas con el servicio, Enhance Speech funcionó mejor con audio que contenía una voz sin diafonía ni ruido excesivo. Por ejemplo, grabamos audio del micrófono integrado de una iMac de una persona parada a 10 pies de distancia, incluido el ruido de un ventilador cercano, y el audio resultante (después de ser procesado por Enhance Speech) sonaba como si estuviera en una habitación de corto alcance sin ruido. ha sido grabado con un micrófono profesional.

Enhance Speech permite cargar archivos MP3 o WAV de hasta 1 GB de tamaño o una hora de duración.
Agrandar / Enhance Speech permite cargar archivos MP3 o WAV de hasta 1 GB de tamaño o una hora de duración.

Adobe

¿Como funciona? Adobe no proporcionó ningún detalle, pero sospechamos que la empresa entrenó un modelo de aprendizaje profundo en muchas (posiblemente miles) horas de audio limpio y ruidoso. Luego, el modelo podría «aprender» a filtrar las frecuencias de la voz humana y sintetizar un facsímil que coincida exactamente con la fuente. Esta es una especulación pendiente de que Adobe proporcione más detalles técnicos y nos hemos comunicado con la empresa para obtener comentarios.

En relación con esto, algunos comentaristas de Hacker News informaron resultados alucinantes (salidas inesperadas como voces fantasmas donde la IA malinterpreta el audio de entrada) de audio extremadamente ruidoso (por ejemplo, habla grabada junto a una cascada) o de fuentes que no hablan inglés. sugiriendo que Enhance Speech hace más que una técnica tradicional de reducción de ruido.

Enhance Speech no es la primera herramienta que ofrece este tipo de reducción de ruido impulsada por IA. Por ejemplo, un paquete de código abierto llamado mayavoz y un servicio comercial llamado Audo Studio hacen algo similar.

Vale la pena señalar que Enhance Speech es parte de un conjunto más grande de herramientas de podcasting impulsadas por IA de Adobe, incluida una herramienta Mic Check (también disponible de forma gratuita en este momento) y una herramienta de edición de audio basada en transcripciones que aún está disponible por invitación. solo prueba beta.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí