META presenta su Inteligencia Artificial con SeamlessM4T

Updated on 23 Ago 2023

Meta anunció su plataforma de Inteligencia Artificial “SeamlessM4T”, tecnología de traducción y transcripción multimodal, capaz de dominar 100 idiomas.

Mark Zuckerberg presentó este martes a SeamlessM4T, la cual aseveró que es el primer modelo de traducción y transcripción de inteligencia artificial multimodal y multilingüe.

Primero esta Inteligencia Artificial (IA) puede realizar traducciones de voz a texto, de voz a voz, de texto a voz y de texto a texto hasta en 100 idiomas.

Por ello, SeamlessM4T permite el uso de las siguientes herramientas de reconocimiento de voz, traducción de voz a texto, de texto a voz, de voz a voz compatible con casi 100 idiomas de entrada y 36 idiomas de salida (incluido el inglés).

De inicio está IA será lanzada bajo el enfoque de ciencia abierta, al público en genera, con una licencia de investigación para permitir a los investigadores y desarrolladores desarrollar este trabajo.

Meta anunció que están publicando los metadatos de SeamlessAlign, el conjunto de datos de traducción multimodal abierto más grande hasta la fecha, con un total de 270,000 horas de alineaciones de voz y texto extraídas”, en su blog oficial.

Como resultado, “En comparación con los enfoques que utilizan modelos separados, el enfoque de sistema único de SeamlessM4T reduce los errores y las demoras, aumentando la eficiencia y la calidad del proceso de traducción. Esto permite que las personas que hablan diferentes idiomas se comuniquen entre sí de forma más eficaz”, añadió Meta.

La compañía matriz de Facebook recordó que previamente ha diseñado herramientas de lenguaje como No Language Left Behind (NLLB), un modelo de traducción automática de texto a texto que admite 200 idiomas y que se ha integrado a Wikipedia como uno de los proveedores de traducción; Universal Speech Translator, que fue el primer sistema de traducción directa de voz a voz para Hokkien, un idioma sin un sistema de escritura ampliamente utilizado, y Massively Multilingual Speech, que proporciona reconocimiento de voz, identificación de idiomas y tecnología de síntesis de voz en más de 1,100 idiomas.

Para finalizar Meta destacó que: “SeamlessM4T se basa en los hallazgos de todos estos proyectos para permitir una experiencia de traducción multilingüe y multimodal derivada de un único modelo, construido en una amplia gama de fuentes de datos hablados con resultados de última generación”.