Synthèse vocale cloud
La Synthèse vocale cloud CXone vous permet de gérer tous vos profils de Synthèse vocale cloud en un seul endroit. La Synthèse vocale cloud convertit le texte en sortie parlée délivrée par des voix de synthèse. Un profil de Synthèse vocale cloud définit une combinaison de voix et de langue. Ce service peut être utilisé avec les IVR Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches, ou les deux, pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. dans CXone. Par exemple, vous pouvez ajouter plusieurs options de langues à votre IVR.
La Synthèse vocale cloud est une offre distincte du service TTS fourni avec les actions Studio comme Play.
Classiques, Inc. a récemment étendu ses activités de librairie à de nouvelles régions. Anne Shirley, le CXone administrateur, commence les menus de configurationRVI Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches, ou les deux, pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. dans les scripts pour les nouvelles régions. Elle découvre certaines lacunes dans les langues de synthèse vocale par défaut qui CXone des offres. Anne apprend qu'avec Synthèse vocale cloud, elle peut choisir un fournisseur TTS qui propose les langues dont elle a besoin. Elle aime que les fournisseurs TTS offrent un large éventail de voix parmi lesquelles choisir.
Prise en charge de SSML
Synthèse vocale cloud Prend en charge l’utilisation du langage SSML (Speech Synthesis Markup Language). Ce langage de balisage basé sur XML vous permet de spécifier de nombreux aspects de la synthèse vocale du texte. Vous pouvez l’utiliser pour affiner la pronunciation, la vitesse d’élocution, le ton de voix, le volume, etc.
Pour utiliser SSML, le texte d’entrée doit respecter les critères suivants :
- Contenu XML valide
- Contenu SSML valide
- Contenu délimité par un jeu de balise <speak> </speak>
-
Contenu utilisant des balises contenant un seul attribut chacune (vaut également pour la balise <speak>)
Afficher un exemple d’un seul attribut par balise<speak xml:lang="en-US">
<voice name="en-US-JennyNeural"> Good morning Chris! </voice>
<voice name="en-US-ChristopherNeural"> Good morning to you too, Jenny! </voice>
</speak>
Par exemple :
<speak xml:lang="en-US">
Here are <say-as interpret-as="characters">SSML</say-as> samples.
I can pause <break time="3s"/>.
I can say cardinal numbers. This number is <say-as interpret-as="cardinal">1135</say-as>.
Or I can say ordinal numbers. You are <say-as interpret-as="ordinal">1135</say-as> in line.
I can even say numbers as digits. The digits are <say-as interpret-as="characters">1135</say-as>.
I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>.
</speak>
Vous devez utiliser le langage de balisage pris en charge indiqué par le fournisseurs TTS dans vos scripts. D’autres formes de balisage TTS risquent de ne pas fonctionner. Reportez-vous à la documentation Google TTS pour plus d’informations sur les variations ou exigences SSML propres à Google.
Fournisseurs TTS
Le contenu de cette section concerne un produit ou une fonctionnalité en version contrôlée (CR). Si vous ne faites pas partie du groupe CR et souhaitez plus d’informations, contactez votreReprésentant de compte CXone.
CXone Synthèse vocale cloud utilise des fournisseurs des tiers STT Permet aux utilisateurs de saisir des invites enregistrées sous forme de texte et d'utiliser une voix générée par ordinateur pour lire le contenu.. Vous pouvez choisir lequel des fournisseurs pris en charge vous souhaitez utiliser. Vous pouvez également choisir la langue et la voix quiSynthèse vocale cloud les usages. Les langues prises en charge varient selon le fournisseur TTS.
Actuellement, CXone prend en charge les fournisseurs suivants :
- AWS Polly TTS (version contrôlée)
- Google STT
- GoogleTTS de voix personnalisée
Langues et voix prises en charge
Chaque fournisseur STT Permet aux utilisateurs de saisir des invites enregistrées sous forme de texte et d'utiliser une voix générée par ordinateur pour lire le contenu. propose un ensemble de langues différent. Pour chaque langue, ils proposent une ou plusieurs voix parmi lesquelles vous pouvez choisir. La sélection des langues et des voix peut être modifiée à tout moment. Pour obtenir la liste la plus récente des langues prises en charge, consultez la documentation de chaque fournisseur de TTS :
Si vous avez besoin de la TTS dans plusieurs langues, vous pouvez ajouter plusieurs TTSVOICE actions à vos scripts Studio et configurez chacun pour utiliser une voix différente. Chaque action peut utiliser un fournisseur TTS différent, si nécessaire.