Locutores europeos fijan normas para el uso de la IA

Locutores europeos fijan normas para el uso de la IA

Las pautas y consejos para el uso de la inteligencia artificial (IA) continúan aflorando poco a poco. Si hace pocos días, los actores españoles celebraban la firma de algunos grandes del sector (Netflix…) de la cláusula que impedirá que las voces del doblaje sean usadas para entrenar sus replicantes cibernéticos, hoy son los locutores alemanes quienes han logrado trazar lo que pueden ser las normas en el futuro de la voz profesional durante los próximos años.

El compromiso alemán llega después del surgimiento este 2024 de un movimiento inédito en la historia de los trabajos de la voz. Alarmados por el avance de la inteligencia artificial (IA), actores y locutores de buena parte de la Unión Europea, América Latina, junto a, entre otros, Estados Unidos y Canadá se unieron para formar United Voice Artists (UVA), un conglomerado de entidades dispuestas a plantar cara al uso incontrolado de la inteligencia artificial en el mundo de la voz profesional.

Dentro de ese compromiso, del que forman parte el madrileño sindicato Adoma, el catalán DUB, el gallego ADA, el valenciano AAPV, los vascos Bieuse y Ehbe, el andaluz Arda y el balear Cadib, destaca por su contundencia y rapidez la reacción de los locutores de habla alemana, que han publicado ya una guía de doce páginas orientada a “avanzar con éxito hacia un futuro con IA”, según señala el documento consultado por el blog de la Escuela de Doblaje de Madrid (EDM).

En este documento, firmado por la germana VDS, la austriaca Voice y la suiza VSP-ASP, los locutores tratan de “trasladar a una nueva era” los estándares probados en el pasado para regular el trabajo profesional de la voz.

A grandes rasgos, los locutores en alemán reconocen el “avance imparable” de la IA, a pesar de que esta “no puede dominar ni comprender las sutilezas necesarias” que caracterizan una buena interpretación, y piden, por un lado, asegurar un consentimiento expreso de los locutores a la hora de poner su voz al servicio de la IA, al tiempo que advierten del peligro de “daño económico total” para los profesionales que vendan su alma al diablo y accedan a entrenar los llamados sistemas de “aprendizaje neuronal” de proveedores como Open AI, Microsot, Google o Eleven Labs, según se explica más adelante.

Además, los locutores de habla alemana piden una doble retribución, una por sintetizar la voz y otra por cada uso; así como el control total sobre la trazabilidad y otros parámetros de las réplicas digitales de voz, que, en general, piden que sean utilizadas como “complemento” y nunca como sustituto de la voz humana original.

A continuación explicamos, en sucesivas entregas, algunos de los puntos más destacados del documento alemán de orientaciones para el buen uso de la IA en el ámbito de la voz profesional.

Solo los humanos expresan sentimientos

En este informe titulado ‘Orientación sobre tarifas’, los locutores de habla alemana rompen una lanza por el trabajo de los intérpretes, frente a sus sustitutos artificiales.

“Solo los humanos son capaces de expresar sentimientos en palabras y establecer un conexión empática con el público y los oyentes”, consignan en la obertura de esta “primera guía” y orientación para “un futuro con IA”.

“La inteligencia artificial (IA) no puede dominar ni comprender las sutilezas necesarias para una ejecución auténtica de esta tarea con alta calidad”, continúan.

Aun así, los germanos admiten que el desarrollo de voces sintéticas en combinación con IA avanza de “manera imparable”. Y piden regularla adecuadamente a fin de ofrecer una base de cálculo “uniforme” y protección contra abusos.

A este fin, los locutores deben revisar de manera “cuidadosa” los contratos de cesión de derechos, especialmente en lo tocante a la IA, recomiendan.

Es imprescindible firmar ese contrato, que recoja el consentimiento expreso del locutor para la creación de una réplica digital de su voz, afirman.

Debe fijarse además una “remuneración adaptada” que refleje el alcance de “todos los usos previstos” de la copia digital de la voz en cuanto al tiempo, espacio, medios de reproducción, etc.

Nunca deben acordarse derechos de uso totalmente ilimitados”, ni el tiempo ni en el espacio, ni en cuanto a medios de reproducción, continúan.

El locutor se reserva además la opción de poner fin al uso de su voz clonada al final de cada período contractual.

Y el cliente debe garantizar que se eliminan completamente los datos de voz al término del período pactado, así como prevenir usos futuros.

No al blended voices o mezcla de voces

Los locutores en alemán rechazan taxativamente la técnica blended voices–morphing, que consiste en crear una voz sintética a partir de la combinación de distintas voces humanas.

Sin embargo, en caso de utilizarse, cada uno de los locutores que presten su voz para crear el clon digital debe recibir una remuneración completa, y no proporcional, avisan.

Por su parte, el cliente debe garantizar la trazabilidad, que permita determinar qué locutores han prestado su voz para la réplica digital.

Cada uno de los locutores que han prestado su voz para este ‘frankenstein’, debe mantener el derecho completo de consentimiento, y poder controlar en todo momento el repertorio en el que se utiliza la mezcla de voces, concluyen.

Doble tarifa: síntesis y uso

La guía recuerda que, para que los sistemas de IA sean capaces de generar voces artificiales, primero deben sintetizar la voz original de un locutor.

Cada locutor es libre de sintetizar su propia voz y ofrecerla en el mercado de manera “autogestionada”, precisan.

En el caso de la sintetización por encargo, el locutor debe ser remunerado por ello, firmando un contrato “completo” que determine el uso de las grabaciones.

Aparte de esa síntesis inicial, el actor debe ser remunerado “adicionalmente” por cada uno de los usos de su réplica digital.


Hasta aquí esta primera entrega sobre el documento de orientación para el buen uso de la IA acordado por los locutores de habla alemana de Alemania, Austria y Suiza. En posteriores entregas, informaremos sobre las advertencias en torno al llamado ‘aprendizaje neuronal’, un sistema por el cual el locutor introduce su “identidad vocal” en proveedores como Open AI, Microsoft, Google y otros, a fin de entrenar un sistema de IA y convertirse en parte integral del mismo.

Esta IA puede luego generar una salida de voz con los parámetros característicos del locutor (entonación, ritmo, melodía del habla, personalidad, encanto, humor…), utilizando cualquier tono de voz deseado o combinar estos parámetros con otros.

“El sistema obtiene un aprendizaje con cada entrada (‘aprendizaje neuronal’), el cual nunca puede ser revertido, incluso si los datos de entrenamiento originales son eliminados”, advierte.

“Esto constituye la base para el desarrollo continuo de los sistemas neuronales de IA que generan voces, y por tanto tiene un gran valor”.

“El aprendizaje neuronal puede representar un daño económico total para el locutor”, avanza el informe, según veremos en próximas entregas.

Leave a comment