Locutores y periodistas sustituidos por bots
- Clonar humanos está prohibido por cuestiones bioéticas, pero no así clonar sus voces, auténtica marca personal de un individuo que puede llegar a utilizarse en algunos sistemas de seguridad para autenticar identidades y acceder a información sensible
- A menudo, el progreso avanza sin hacerse muchas preguntas sobre moral o repercusiones jurídicas de lo que inventa, tan solo imaginando el negocio que reportará a un sector de la sociedad, sin pararse a pensar en los problemas que acarreará a otros colectivos directamente afectados
Los bots nos descargarán de trabajo, dicen los científicos. Tal vez sí, o tal vez no (Fotografía Pixabay) |
En más menos cinco años, cuando la inteligencia artificial y la síntesis de voz alcancen la perfección en español, no necesitaremos locutores que graben cuñas, o que conviertan libros en audiolibros. Bastará con introducir el texto en un ordenador equipado con el software apropiado, y en cuestión de ¿minutos? ¿segundos? tendremos disponible el correspondiente audiolibro
Este pasado 29 de mayo, Enrique Alpañés, en El País,
en su suplemento ‘Tendencias’, volvía a la carga con las voces artificiales
desde un artículo titulado “Cada vez oirás más voces sintéticas”, en el
que anunciaba que la tecnología de clonación ya no requiere de grabación
alguna, sino que, muy al contrario, se basa en el “uso de redes neuronales,
algoritmos matemáticos que tratan de imitar cómo se conectan las neuronas en
nuestro cerebro”. Alpañés recogía la respuesta a su pregunta sobre este
asunto de la profesora de Lingüística Computacional de la Universidad de
Barcelona, Mireia Farrús Cabeceran.
¿Hasta qué punto ha avanzado la tecnología en este campo de
la síntesis de voz? Para que se hagan una idea, en el mismo artículo, realmente
revelador, Alpañés cita a Roberto Carreras, el director de la empresa ‘Voikers’,
dedicada a la producción de podcast y audiolibros. “En inglés es
prácticamente imposible distinguir una voz sintética de una original. En español
aún no, pero llegaremos, porque la cosa está avanzando a un ritmo exponencial”,
advierte. O sea, es cuestión de tiempo, y de inversión. Y en esa carrera,
tendrán mucho que ver los 1.100 millones de euros anunciados como dotación del Proyecto
Estratégico para la Recuperación y Transformación Económica aprobado ya por
el gobierno de Pedro Sánchez. Los recursos concluirán con una
inteligencia artificial que piense, y hable, en español.
Hace tan solo un par de años, en el comienzo de la pandemia, la compañía donostiarra Vicomtech, especializada en procesos de inteligencia artificial, recibió una extraña llamada. El interlocutor les proponía sintetizar la voz del general Franco. No daban crédito a la petición. Pero accedieron. Recibieron más de seis horas de grabaciones de su voz, con discursos recuperados de diferentes fuentes, los digitalizaron, los procesaron y añadieron inteligencia artificial al experimento. El resultado es tan espectacular como inimaginable: los técnicos de Vicomtech habían recuperado la voz del dictador gallego, al que descontextualizaron deliberadamente en algunos ejemplos que luego pudimos oír: Franco imitando a Chiquito de la Calzada, e incluso cantando el “Macarena” de Los del Río. El interlocutor fue Toni Garrido, y el destino de aquel experimento fue el podcast “XRey” (Premio Ondas 2020).
¿Qué podría ocurrir en la radio? Si, como avanzan las tendencias de los estudios de audiencia en todo el mundo, este medio va a ver reducidas sensiblemente sus audiencias, y consiguientemente sus ingresos, disponer de una tecnología como esta que reduzca la carga de los costes laborales, los más cuantiosos, es una posibilidad que agradecerán sobremanera los directores financieros de las empresas informativas
Los americanos, tan dados a las previsiones y a los cálculos
económicos, ya han dado algunas muestras de por dónde pueden ir las tendencias
en este campo. Enrique Alpañés cita en su artículo en El País, que la consultora
de gestión McKinsey & Company mantiene que “el mercado de las voces
artificiales alcanzará más de mil millones de dólares en los próximos cinco
años”. Y la pregunta del millón: ¿en qué campo impactará más esta
tecnología? Alpañés no duda en afirmar que “los podcast y los audiolibros
son las industrias donde más impactará esta tecnología”.
La voz forma parte, muy destacada, de la marca personal de un individuo. Nos reconocemos a través de la voz fácilmente, incluso cuando no existe imagen de por medio que añada más información al proceso de identificación. Medio en broma, medio en serio, los imitadores de timbres de voz de la radio demostraron que sus bromas podían ir bastante más lejos de lo que inicialmente habían previsto, como cuando David Miner, del ‘Grupo Risa’, se hizo pasar por el expresidente José Luis Rodríguez Zapatero y hablar directamente con Evo Morales; Fernando Echevarría, compañero de Miner, se transformó en José María García (es mejor que el original) y engañó a José Luis Núñez, expresidente del Barça; en 2016, en el morning “El matí i la mare”, de Radio Flaixback, un imitador se hizo pasar por Carles Puigdemont y logró que Mariano Rajoy se le pusiera al teléfono. “Esto no es serio”, comentó el entonces presidente o en otro morning, esta vez en Los 40 Principales, en el “Anda Ya” de Frank Blanco, Raúl Pérez encarnó a Zapatero, hizo como tal una llamada a Mónica Cruz, en 2009, para felicitar a su hermana Penélope por su Óscar, esta se puso al teléfono y consiguieron las primeras declaraciones tras recibir la estatuilla del cine estadounidense.
«El mercado de las voces artificiales alcanzará más de 1.000M de dólares en los próximos cinco años. Los #podcasts y los #audiolibros son las industrias donde más impactará esta tecnología».
— 📻📲 🎧📑 Andoni Orrantia (@aorrantiah) May 29, 2022
Recomendable 'Cada vez oirás mas voces sintéticas', por @SenorAlpa en @el_pais. pic.twitter.com/2TudoLMUwW
La Inteligencia Artificial no deja de avanzar (Fotografía Pixabay) |
“En inglés es prácticamente imposible distinguir una voz sintética de una original. En español aún no, pero llegaremos, porque la cosa está avanzando a un ritmo exponencial” (Roberto Carreras, Voikers)
Personalmente, me niego a creer que una voz sintetizada
podrá alcanzar la perfección de Constantino Romero doblando a Clint
Eastwood o Darth Wader o de Ramón Langa haciendo lo propio
con Bruce Willis. Pero yo no soy nadie, más que un humilde observador y,
con toda probabilidad, la tecnología me dejará con el culo al aire. Y así me
quedaré. Sintetizar la voz de Francisco Franco, o de Albert Einstein
puede aportar una aproximación mucho más ajustada a la realidad del personaje, sin
otra trascendencia. Pero imagínense que alguien le da por clonar a Putin y
declarar la guerra a la OTAN, por poner un ejemplo límite. Los sistemas de
seguridad tendrán que replantearse autenticar a alguien a través de su voz, y
priorizar por ejemplo la huella digital o el iris del ojo. Son ejemplos en los
que la voz participa como marca personal.
¿Qué podría ocurrir en la radio? Si, como avanzan las tendencias de los estudios de audiencia en todo el mundo, este medio va a ver reducidas sensiblemente sus audiencias, y consiguientemente sus ingresos, disponer de una tecnología como esta que reduzca la carga de los costes laborales, los más cuantiosos, es una posibilidad que agradecerán sobremanera los directores financieros de las empresas informativas. Alguien podrá decirme que las voces sintetizadas en la radio solo podrán hacer informativos, que resultan a la postre más lineales y requieren de menos florituras. Pero eso, tal vez, ocurriría al principio y, de nuevo, la tecnología nos sorprendería. ¿O no lo creen?
A pesar de todo, y tratando de ver la vida y el progreso desde la media botella llena, sigo creyendo que la figura y la participación de los periodistas seguirá siendo imprescindible en el futuro, aunque sea para introducir criterios de valoración en las máquinas, que aspiran a sustituirnos en tantos órdenes y espacios actuales. Al igual que se plantea en la industria automovilística, donde los vehículos del futuro están siendo diseñados con tecnologías disruptivas como la Inteligencia Artificial (IA), el Internet de las Cosas (IoT) y el Big Data, pero no hay soluciones infalibles al dilema de atropellar a un peatón o tener que despeñar un coche por un barranco, las voces sintéticas plantean numerosas consecuencias éticas y jurídicas que habrá que ir resolviendo conforme avance la tecnología y la calidad de sus prestaciones. De momento, yo prefiero quedarme con los imitadores en la radio y los buenos momentos que nos hacen pasar, sin necesidad de plantear debates que ya llegarán y, por lo que cuentan, mucho antes de lo que pensamos.La posibilidad existe, y va a existir cada vez más mejorada... Sin duda viene una revolución que va afectar a la profesión de manera profunda. Veremos en qué medida y en qué términos podremos los profesionales influir y tener control sobre nuestro futuro.
— Vicky Tessio VO (@SpainSpanishVO) September 13, 2022
-Relacionado:
-Escucha el
episodio "Cómo la inteligencia artificial recreó la voz de Franco"