La inteligencia artificial sacude el mundo de la voz

La inteligencia artificial sacude el mundo de la voz

Una revolución tecnológica agita el mundo de la voz. Tecnologías capaces de narrar libros, sin actores. Bancos de voces que venden productos, sin locutores publicitarios. Y hasta, últimamente, una deformación de la boca de los actores originales, para casar sus movimientos con los del doblaje final. Un terremoto ligado a la inteligencia artificial, y que está llamado a transformar hondamente el sector de la voz profesional y sus diversas aplicaciones.

La tecnológica Apple ha sido la última en sumarse a la sacudida tecnológica que agita las aguas del uso profesional de la voz. Hace unas semanas, la creadora del iPhone anunció, dentro de su división de creación de contenidos, la llegada de un nuevo sistema de grabación de audiolibros con voz de síntesis.

De momento el servicio de audiolibros de Apple se encuentra disponible solo para el inglés, y en el género de novela romántica, uno de los puntales de la plataforma. Pero pronto contará con narradores en otros idiomas, y sumará géneros, como el misterio, el suspense, la fantasía y la ciencia ficción, a un invento llamado a abaratar costes, y cuyos resultados podemos escuchar en el enlace, más arriba.

De este modo, Apple se suma a otras empresas, como Audiobook.ai y VocaliD, que prometen ya generar un audiolibro en tan solo diez minutos, con voz de síntesis, a una décima parte del coste de producción, en el primer caso; y con toda la “emoción, familiaridad y complejidad” de la voz humana, en el segundo, imitada por robots; con la ventaja de su mayor “flexibilidad” y “velocidad de producción” respecto a los locutores humanos.

En este punto, Altered AI, otra compañía británica especializada en aplicaciones de inteligencia artificial, promete preservar del tiempo y la desgracia las voces de sus clientes, que accedan a clonar su voz y mantenerla en una cripta, a salvo de la adversidad, y disponible para el disfrute de futuras generaciones.

Un servicio de voz enlatada que su poseedor original —al que piden acreditar sus derechos, eso sí— podrá poner a trabajar, con tan solo introducir una clave, mientras él disfruta en Las Bahamas de un merecido y humano descanso.

Además, Altered AI ofrecer crear una voz única para proyectos empresariales. Una síntesis de todo aquello que la empresa quiera transmitir, precipitado en una cubeta digital, y puesto a disposición de quien pague por ello, a partir de los patrones extraídos de las voces de 20 actores profesionales, que han accedido a prestar sus instrumentos para que la inteligencia artificial los mangonee a su gusto, y establezca, mezclando deseos humanos y algoritmos, la “identidad única” que, paradójicamente, la empresa dice ofrecer.

Deformación de la imagen

La compañía opera ya con éxito en el sector del videojuego. Aunque quizás el proyecto más chocante llega de la mano de la imagen, y de otra compañía, también británica, Flawless, (Inmaculada o Perfecta, en su traducción al español), desde donde aplican la inteligencia artificial, aunque no para generar voces, sino para deformar las bocas de los actores doblados, a fin de que estas se adapten a los patrones de pronunciación del idioma de destino.

En un vídeo colgado en su web, Flawless muestra cómo le han tocado el morro a actores como Tom Hanks o Jack Nicholson, y adaptado sus boquitas a la pronunciación en francés, noruego o alemán, de diálogos presentes en clásicos como Forrest Gump o Algunos hombres nuevos.

“No leas, mira”, proclama con unción la tecnológica, que, sin embargo, no aclara quién doblará en el futuro a Nicholson o Hanks: un humano o su clon.

Dejar un comentario