En agosto de 2023, Meta presentó la primera versión de un modelo de inteligencia artificial (IA) capaz de traducir voz y texto, y de hacer traducciones directas de voz a voz en diferentes idiomas, con el objetivo de cimentar el camino hacia las traducciones universales rápidas.
Ahora, poco más de un año después, el conglomerado tecnológico, a través de un artículo en la revista Nature, reveló que su programa ha añadido varias y grandes innovaciones.
Denominado como SeamlessM4T, el modelo ya cuenta con recursos que se pondrán a disposición del público para ayudar a seguir investigando las tecnologías de traducción de voz inclusivas.
Según se explica la nota, puede traducir voz y texto en un total de 101 idiomas; además, realiza traducciones directas de voz a voz en otros 36. Pero eso no es todo, pues también ejecuta de texto a voz (96 a 36 idiomas), traducción de texto a texto (96 idiomas) y reconocimiento automático de voz (96 idiomas).
En el caso específico de la traducción de voz a voz, los autores destacan que SeamlessM4T fue programado para traducir textos con hasta un 23% más de precisión que los softwares similares existentes. De igual manera, filtra el ruido de fondo y se adapta a las variaciones del emisor.
Por todo lo anterior, aseguran que su sistema podría suponer un paso adelante en la mejora de la comunicación más allá de las barreras lingüísticas.