En la lucha por dominar el sector de la inteligencia artificial (IA), recientemente Amazon anunció la creación de Nova Sonic, un modelo capaz de procesar y generar voz de forma nativa con un sonido más natural.
Según expertos, esta nueva propuesta promete superar el rendimiento de productos similares de otras empresas como OpenAI y Google en pruebas de tiempo de respuesta, reconocimiento de voz y calidad conversaciones. Por si fuera poco, también podría representar un rival para la famosa asistente virtual Alexa.
Por su parte, especialistas de la plataforma de comercio electrónico explican que los métodos tradicionales para crear aplicaciones de voz requieren la integración de múltiples modelos independientes, especializados en tareas como reconocimiento de voz, comprensión del lenguaje y conversión de texto a voz. Esta fragmentación, indican, suele complicar el desarrollo e impide conservar el contexto acústico y los matices del habla necesarios para lograr interacciones naturales.
En contraste a esta situación, surge Nova Sonic, modelo que destaca por su arquitectura unificada, la cual integra transcripción, comprensión y generación vocal. Lo anterior le permite adaptar sus respuestas tanto al contexto acústico como a las características sonoras de las voces entrantes.
De igual manera, transcribe la voz del usuario a texto, facilitando así a los desarrolladores la creación de agentes conversacionales más sofisticados, capaces de interactuar con otras herramientas y APIs.
Nova Sonic ya se encuentra disponible a través de Bedrock, el sitio de Amazon para el desarrollo de aplicaciones empresariales de IA.