CXone Mpower Transcription

CXone Mpower Transcription est une option native pour la transcription. Il convertit les mots prononcés en texte et possède deux modes :

Transcription en temps réel : Fournit une transcription en temps réel au fur et à mesure que l’interaction se produit. Ceci est utilisé avec des applications telles que AutoSummary et CXone Mpower Agent applications. Setup est requis pour utiliser ce mode. De plus, ce mode prend en charge les personnalisations de vocabulaire .
Transcription post-appel : Fournit une transcription complète à la fin d'une interaction. Interaction Analytics utilise ce mode. Aucune configuration n'est requise pour activer la transcription post-appel et la personnalisation du vocabulaire n'est pas prise en charge. Cette fonctionnalité fait partie d’un programme de version contrôlée. Contactez votre Représentant de compte si vous souhaitez en savoir plus.

Les deux modes de Transcription offrent les avantages suivants :

La version courante de Transcription est la v11. Il utilise un Modèle de langue étendu (LLM) piloté par l’IA lors du traitement de l’audio parlé. Cela lui permet de produire une sortie de meilleure qualité que les versions précédentes de Transcription. Il a permis d'améliorer la reconnaissance des entités, de réduire les taux d'erreurs de mots et d'améliorer la lisibilité.
Transcription produit des résultats non déterministes. Cela signifie qu'il peut y avoir des différences dans le résultat lorsque le moteur Transcription traite le même audio plusieurs fois. C'est le comportement attendu pour les modèles LLM.
Le moteur Transcription supprime les mots et les sons prononcés pendant la parole qui ne contribuent pas au sens. Cela inclut um, uh, les mots répétés, etc. Ces mots et sons improductifs rendent les transcriptions difficiles à lire. Leur suppression améliore l'expérience utilisateur en rendant les transcriptions plus lisibles.
Les interlocuteurs peuvent parler plusieurs langues au cours d’une même interaction, voire d’une même phrase. Transcription supporte cette commutation de code tant qu'il supporte les deux langues. Si une langue non prise en charge est parlée pendant l'interaction, elle n'est pas transcrite.
Transcription fournit des données sur les décalages. Le décalage est une mesure du moment où un mot ou une phrase spécifique est prononcé par rapport au début de l'enregistrement audio. Transcription mesure les décalages au niveau du mot et au niveau de l'énoncé. Un énoncé correspond à ce que dit le locuteur lors d'un tour de parole dans la conversation.

Vous pouvez accéder aux transcriptions Continuous Stream Transcription avec l'API de transcription analysée Icône d’un carré avec une flèche pointant du centre vers le coin supérieur droit. .

Transcription après appel

Le contenu de cette section concerne un produit ou une fonctionnalité en version contrôlée (CR). Si vous ne faites pas partie du groupe CR et souhaitez plus d’informations, contactez votre Représentant de compte.

La transcription post-appel fournit une transcription vocale en texte de haute précision speech-to-text Également appelé STT, ce processus convertit la langue parlée en texte. après la fin d'un appel. La transcription comprend à la fois l'agent et le contact La personne qui interagit avec un agent, un IVR ou un robot dans votre centre d’appels. de l'appel. Les agents peuvent utiliser ces transcriptions dans l’application d’agent pour confirmer les détails des appels précédents. Les superviseurs peuvent les utiliser pour la formation et les contrôles de qualité.

La transcription post-appel utilise Transcription v11. Il s'agit du moteur le plus récent et le plus précis disponible en CXone Mpower. Il est alimenté par CXone Mpower Transcription. CXone Mpower ne prend pas en charge les services de transcription tiers pour la transcription post-appel.

Le tableau suivant résume les différences entre les modes temps réel et post-appel de Transcription :

Transcription en temps réel	Transcription après appel
Prend en charge les scores de confiance au niveau du mot et au niveau de l'énoncé Ce qu’un contact dit ou tape.lorsqu'il utilise scores de confianceCXone Mpower Transcription.	Prend en charge les scores de confiance au niveau du mot et au niveau de l'énoncé Ce qu’un contact dit ou tape.scores de confiance.
Prend en charge toutes les langues disponibles pour CXone Mpower Transcription.	Prend en charge toutes les langues disponibles pour CXone Mpower Transcription.
Prend en charge le réglage personnalisé du vocabulaire .	Ne prend actuellement pas en charge le réglage personnalisé du vocabulaire.
Généralement disponible.	En diffusion contrôlée pour Interaction Analytics utilisateurs. Contactez votre Représentant de compte pour plus d’informations.

Votre Représentant de compte devrait vous permettre d'effectuer la transcription après l'appel.

Scores de confiance

Transcriptionfournit des scores de confiance au niveau de l'énoncé Ce qu’un contact dit ou tape. et du mot. Le score de confiance indique à quel point le moteur de transcription est certain de sa transcription globale de ce que le contact La personne qui interagit avec un agent, un IVR ou un robot dans votre centre d’appels. ou l'agent a dit. Les scores de confiance sont disponibles dans les données de transcription, mais ne sont visibles pour les utilisateurs que si les applications qui utilisent les transcriptions peuvent afficher ces scores.

Les scores de confiance pour Transcription:

Ce sont des échelles ordinales, où un score plus élevé indique simplement un niveau de confiance plus élevé. Un score de 0,4 n'implique pas que le niveau de confiance soit deux fois plus élevé que celui d'un score de 0,2.
Ne peut pas être utilisé pour déterminer la précision du système de transcription. Une transcription présentant un score de confiance généralement faible n'implique pas un taux d'erreurs de mots élevé.
Ne peut pas être utilisé pour filtrer ou seuiller une transcription. Supprimer les notes de faible confiance d'une transcription ne la rendra pas plus précise.

Réglage personnalisé du vocabulaire

Transcription utilise un modèle ASR Reconnaissance automatique de la parole. Permet aux contacts de répondre aux invites en parlant, en appuyant sur les touches du téléphone ou les deux. qui a été entraîné sur de grands ensembles de données. Les conversations utilisées pour former le modèle couvrent un large éventail de secteurs. Cependant, chaque organisation utilise des mots qui lui sont uniques ou qui sont utilisés dans des contextes uniques. Cela peut affecter la précision des résultats de transcription.

Vous pouvez régler le modèle que Transcription utilise. Cela vous permet de paramétrer le modèle afin qu'il reconnaisse la terminologie propre à votre organisation ou qui a un contexte unique dans votre secteur d'activité.

Le réglage personnalisé du vocabulaire est configuré dans Interaction Analytics, mais il ne nécessite pas de licence pour cela application. Vous n’avez besoin d’une licence que pour le réglage personnalisé du vocabulaire.

Le réglage personnalisé du vocabulaire est disponible pour toutes les langues que Transcription prennent en charge. Il n'est actuellement pas pris en charge pour la transcription post-appel .

Langues prises en charge

Transcription est entraîné à gérer de nombreux dialectes au sein de chacune des langues prises en charge. Le résultat de la transcription de chaque conversation cible un seul dialecte, mais peut inclure des aspects de plusieurs dialectes.

Transcription supporte les langues suivantes :

Dutch
English
Français
Allemand
Italian
Portugais
Japanese
Espagnol
Gallois