La voz neuronal personalizada es una característica de conversión de texto a voz (TTS) que le permite crear una voz sintética personalizada y única para ciertas aplicaciones como Alexa o Siri por ejemplo.
Hacete socio para acceder a este contenido
Para continuar, hacete socio de Caras y Caretas. Si ya formas parte de la comunidad, inicia sesión.
ASOCIARME Videos |
Caras y Caretas Diario
En tu email todos los días
Esta tecnología puede crear una voz de sonido muy natural con los ejemplos de audio como datos de entrenamiento.
A partir de la tecnología de conversión texto a voz neuronal y el modelo universal multilingüe y multiparte, la voz neuronal personalizada permite crear voces sintéticas con abundantes estilos de habla o idiomas cruzados adaptables.
La voz de sonido natural y realista puede representar marcas, personificar máquinas y permitir que los usuarios interactúen oralmente con las aplicaciones.