Un software de la UC3M subtitula en directo los informativos territoriales de RTVE

25/08/2020

Parque Científico de la UC3M

Desarrollado por el grupo de investigación SoftLab

Un software desarrollado por investigadores de la Universidad Carlos III de Madrid (UC3M) ha sido implementado en diez de los 17 centros territoriales de Radio Televisión Española (RTVE) para el subtitulado en directo de sus informativos territoriales. Este sistema pretende mejorar la comunicación de los cerca de cuatro millones de personas con discapacidad auditiva en España.

El grupo de investigación SoftLab de la UC3M ha implementado un sistema completamente autónomo para el subtitulado automático y en tiempo real, mediante técnicas de inteligencia artificial y machine Learning (aprendizaje automático). El propio software realiza la transcripción de voz a texto y la envía al sistema de insertado de subtítulos que la corporación tiene en Torrespaña. Esta, a su vez, deriva la información a cada uno de sus centros para que cada Comunidad Autónoma pueda ver los subtítulos correspondientes en función del contenido audiovisual que esté emitiendo. “La arquitectura puede soportar un gran número de generación y transmisión de subtítulos simultáneas sin afectar a la calidad o velocidad del subtítulo de cada emisión. El proceso de subtitulado retroalimenta al reconocedor, de modo que cuantas más emisiones genere el sistema de subtítulos, más preciso será en las futuras emisiones”, explica Ángel García Crespo, director de SoftLab, profesor del Departamento de Informática y subdirector del Instituto de Desarrollo Tecnológico y Promoción de la Innovación "Pedro Juan de Lastanosa" de la UC3M.

Al contrario del actual sistema de “rehablado”, que sigue en vigor y que precisa de una persona que introduzca y envíe la transcripción, el desarrollado por la UC3M realiza todo el proceso “en la nube” y no necesita prácticamente intervención humana, infraestructura o ubicación concreta. “El sistema analiza los resultados en tiempo real de varios reconocedores de voz y construye la transcripción final con resultados superiores al resultado de forma individual de cada uno de ellos”, apunta García Crespo.

Este software respeta las normas de subtitulado y escribe en una o dos líneas un máximo de 37 caracteres, tal y como exige la normativa. Además, incluye automáticamente signos de puntuación e identifica términos propios de cada zona, que se han añadido de forma individual por territorio para conseguir una transcripción más eficaz y reducir los errores que suelen producir otros sistemas similares.

Volver