Vicomtech desarrolla un sistema innovador para clonar voces humanas basado en inteligencia artificial

25/05/2020

Parque Científico y Tecnológico de Gipuzkoa

La solución supone una clara evolución para entornos como los asistentes virtuales, caracteres de animación, audiolibros y generación de marcas de voz

La calidad obtenida es tan alta que la diferencia con la voz real es prácticamente inapreciable

El objetivo de la clonación automática de voz es generar voces sintéticas muy similares a las originales. Basado en técnicas de Deep Learning e Inteligencia Artificial, el sistema aprovecha un conjunto de audios de la voz original para formar un modelo capaz de generar nuevos audios que cuesta distinguirlos de los originales.

Esta tecnología de clonación de voz puede personalizarse de manera rápida y sencilla, adaptándose en tiempo récord a una voz específica, no suponiendo ninguna barrera ni el idioma ni el género. Esta tecnología supone, por lo tanto, una verdadera revolución y una oportunidad para los sectores en los que se aplica, dado su amplio y variado espectro de posibilidades.

Clonación de voz para asistentes virtuales

Este sistema tiene una aplicación muy interesante en el ámbito de los asistentes virtuales. Gracias a los avances en el campo de la Inteligencia Artificial, la tecnología de conversión de texto a voz ha experimentado una gran transformación que le permite crear voces naturales al mismo tiempo que se han ampliado las posibilidades de personalizar las mismas.

Doblaje y animación

La tecnología de clonación de voz de Vicomtech permite crear voces singulares y fácilmente reconocibles para personajes digitales o avatares. Esta aplicación en el sector del doblaje y la animación multiplica las posibilidades de producción de contenidos multimedia y audiovisuales potenciando de esta manera la creatividad del productor audiovisual.

La Marca de Voz, el uso de la voz para acciones de marketing

Se puede considerar la voz como un elemento adicional de marketing, puesto que puede convertirse en una característica más de la imagen de una compañía. El hecho de poder crear una voz sintética característica que se adecúe a la cultura organizativa y se identifique con la empresa, supone una ventaja competitiva con respecto a la competencia. Los asistentes virtuales que cuentan con una voz singular y reconocible cuentan con una mayor personalidad que facilita la identificación y refuerza la imagen.

Audiolibros

Otro campo de aplicación es el de los audiolibros ya que claramente pueden beneficiarse de la tecnología de clonación de voz, puesto que ofrece al lector libertad para sintetizar millones de ediciones y para seleccionar la voz que más le agrade a la hora de narrar el contenido.

El mejor modo de descubrir esta tecnología es probándola, os animamos por lo tanto a que la conozcáis de primera mano en el siguiente enlace. 

Volver