Vicomtech, la empresa que resucitó la voz de Franco
https://www.gorkazumeta.com/2020/06/vicomtech-la-empresa-que-resucito-la.html?m=0
La compañía donostiarra recreó la voz del dictador, mediante tecnología de clonación de voz basada en Inteligencia Artificial
Se necesitaron 6 horas de discursos navideños de Francisco Franco
Vicomtech,
nota de prensa, 3.06.2020. Este ejemplo de clonación de voz
constituye un gran reto científico-tecnológico que Vicomtech ha resuelto
mediante tecnologías de inteligencia artificial aplicadas al procesamiento del
habla. XRey es un podcast exclusivo de Spotify producido por The Story Lab que
repasa las luces y las sombras sobre la figura del rey emérito. Se ha generado
la voz clonada de Franco exclusivamente para dos momentos clave del guión y el
bonus track, en el que se explica cómo ha sido su proceso de creación.
La tecnología abre nuevas posibilidades en entornos donde se requiera la voz humana (Fotografía Pixabay) |
Vicomtech ha avanzado un paso más en la aplicación de
tecnologías de Inteligencia Artificial desarrollando un modelo de síntesis de
habla que consigue clonar con un alto nivel de precisión la voz del Dictador
Franco.
Con la tecnología empleada y basada en redes neuronales profundas, inicialmente se buscaron no menos de 20 horas de audios de entrenamiento para generar un modelo de calidad. Sin embargo, en este caso, la dificultad de encontrar audios en buen estado, limpios de ruidos y en el estilo narrativo que se buscaba, hizo que el modelo tuviera que generarse con tan solo 6 horas, compuestas principalmente por discursos navideños del dictador
El objetivo de este desarrollo se ha centrado exclusivamente
en dar respuesta a través de la tecnología a un requisito del guion de XRey que
consistía en reproducir la voz de Franco en el capítulo 4, en el que lee una
carta que él mismo escribió a Don Juan proponiendo a su hijo Juan Carlos como
sucesor en la jefatura del Estado, además de otra intervención en el capítulo
5.
El reto tecnológico de este desarrollo basado en
Inteligencia Artificial consiste en aplicar la clonación de una voz particular
a una técnica narrativa innovadora y con multitud de posibilidades aún por
explorar.
Con la tecnología empleada y basada en redes neuronales
profundas, inicialmente se buscaron no menos de 20 horas de audios de
entrenamiento para generar un modelo de calidad. Sin embargo, en este caso, la
dificultad de encontrar audios en buen estado, limpios de ruidos y en el estilo
narrativo que se buscaba, hizo que el modelo tuviera que generarse con tan solo
6 horas, compuestas principalmente por discursos navideños del Dictador. Con
este limitado material y la aplicación de tecnología avanzada de Inteligencia
Artificial, Vicomtech ha hecho posible la generación de un modelo de síntesis
de habla realista que adquiere finalmente todas las particularidades, matices y
estilo de la voz de Franco.
La tecnología desarrollada ha sido el resultado de varias
semanas de trabajo y la implicación del Grupo de investigación de Tecnologías
del Habla y del Lenguaje Natural de Vicomtech.
La serie de podcast 'XRey' es una producción de The Story Lab
disponible en exclusiva en Spotify que repasa las luces y las sombras sobre la
figura del rey emérito a través de diez episodios de unos 20 minutos de
duración.
-Relacionado: