Gestion ASR
Les informations contenues dans cette page d’aide s’appliquent à la fois à CXone Studio et à Desktop Studio.
Cette section fournit des informations sur la gestion du système de menus SRVI Menu téléphonique automatisé qui permet aux appelants d’interagir via des commandes vocales, des entrées de touches ou les deux pour obtenir des informations, acheminer un appel vocal entrant, ou les deux., amélioré par la reconnaissance vocale automatique (ASR) dans CXone.
Une bonne connaissance de la reconnaissance vocale automatique et du moteur ASR Nuance est essentielle pour créer un système SRVI efficace. Une documentation complète sur l’utilisation de ce moteur est disponible auprès de Nuance.
Réglage
Autorisations requises : Rapport de réglage ASR activé
Le réglage vous permet d’améliorer votre système ASR en fonction des données relatives aux performances actuelles des actions Studio ASR. Il s’agit d’une partie importante du développement et de la maintenance de votre système ASR.
Le rapport de réglage ASR fournit des informations que vous pouvez utiliser dans votre processus de réglage. Il fournit les taux de réponse pour les actions ASR qui se déclenchent dans un script et vous permet d’afficher une liste d’énoncés que l’ASR n’a pas pu reconnaître. Ce rapport est divisé par action et par paramètre de la branche de confiance.
Si le réglage est activé, vous pouvez développer ces sections et écouter les fichiers audio enregistrés de ce segment. Cela vous donne des informations sur les réponses que le système ASR n’a pas été en mesure de comprendre. Vous pouvez les ajouter à vos fichiers de grammaire et à vos listes de phrases.
Lorsque vous réglez votre système ASR, vous pouvez :
- Consulter le rapport de réglage ASR et évaluer les données qu’il fournit.
- Écouter les enregistrements du rapport de réglage ASR pour comprendre ce qu’il y a de différent dans les interactions.
- Identifier ce que vos contacts disent et comment ils le disent.
- Mettre à jour les fichiers de grammaire en fonction de ce que vous apprenez.
- Ajuster les valeurs de confiance, si nécessaire.
Activer le réglage
Si votre SRVI capture des données IIP (informations d’identification personnelle), il peut être judicieux de choisir soigneusement les sections de votre SRVI à enregistrer lors du réglage. Vous éviterez ainsi les problèmes liés à la saisie de données personnelles. Par exemple, si vous avez une action Asrdigits qui collecte un numéro d’identification sensible, vous pouvez lancer le réglage après cette action. Cela permet d’éviter que le numéro d’identification ne soit enregistré.
Désactivez le réglage lorsque vous avez terminé de régler activement votre SRVI. Laisser la fonction de réglage activée provoque un énorme ballonnement et un stress sur le serveur, car chaque interaction crée un nouveau fichier audio.
- Dans Studio, ouvrez votre script ASR et ajoutez une action Voiceparams. Elle doit être située avant les actions ASR avec lesquelles vous souhaitez travailler lors du réglage.
- Si le seul but de cette action dans votre script est d’activer et de désactiver le réglage, modifiez Caption pour indiquer ce but. Par exemple, Tuning On and Off. Si vous utilisez également l’action pour changer la langue de votre SRVI, vous aurez peut-être besoin d’une autre légende.
- Dans l’action Voiceparams, définissez la propriété ASRTuningEnabled sur True.
- Lorsque vous avez terminé le réglage, définissez la propriété ASRTuningEnabled sur False.
Paramètres de réglage
Vous pouvez attribuer des paramètres de réglage spécifiques aux scripts pour vos actions ASR Nuance. Pour ce faire, définissez un objet de données dynamiques dans une action Snippet. Appeler l’objet nuanceTuningParamsJson. Sa valeur doit être une chaîne JSON valide contenant les paramètres Nuance à définir à partir de leurs valeurs par défaut. Par exemple :
DYNAMIC asrParams
ASSIGN asrParams.sensitivity = "87"
ASSIGN asrParams.Speech_Complete_Timeout = "1000",
ASSIGN asrParams.Speech_Incomplete_Timeout = "1000"
ASSIGN asrParams.No_Input_Timeout = "1000"
ASSIGN global:nuanceTuningParamsJson = "{asrParams.asjson()}"
Si des paramètres sont définis à des valeurs non valides, la valeur non valide est remplacée par la valeur par défaut pour ce paramètre, et une variable appelée invalidParamsList est renvoyée avec la liste des valeurs qui ont été modifiées.
Les tableaux suivants présentent les paramètres de réglage pris en charge dans Studio :
Paramètre Nuance | Description | Assistance Studio |
---|---|---|
Speech_Complete_Timeout | Combien de temps attendre avant de conclure qu’un appelant a fini de parler. |
Prise en charge en utilisant nuanceTuningParamsJson. Valeur par défaut : "Speech-Complete-Timeout" : "0" |
Speech_Incomplete_Timeout | Durée du silence pour déterminer que les appelants ont fini de parler. |
Prise en charge en utilisant nuanceTuningParamsJson. Valeur par défaut : "Speech-Incomplete-Timeout": "1500" |
No_Input_Timeout |
Combien de temps attendre la parole après la fin d’une invite. Remarque : Ce paramètre commence à compter lorsque la lecture de l’invite commence. Cela peut signifier que le script atteint le dépassement de délai trop tôt. La propriété TimeoutSeconds de l’ action |
Prise en charge en utilisant nuanceTuningParamsJson. Valeur par défaut : "No-Input-Timeout": "7000" |
sensitivity | Sensibilité du détecteur de parole lors de la recherche de la parole. | Valeur par défaut : 50 (échelle de 0 à 100) |
Les paramètres Nuance suivants ne sont pas pris en charge dans CXone, car l’action Studio Asr lit des invites au lieu de Nuance.
Paramètre Nuance | Description | Valeur par défaut |
---|---|---|
swiep_suppress_barge_in_time | Désactive l’intervention brièvement au début d’une invite. | 0 (sans délais) |
swiep_in_prompt_sensitivity_percent | Contrôle la façon dont les appelants doivent parler pour interrompre les invites (l’intervention) et détecter la parole. | 50 (pourcentage) |
swirec_barge_in_mode | Définit des modes de reconnaissance spéciaux dans le reconnaisseur. | normal |
Fichiers de grammaire
Les fichiers de grammaire vous permettent de dresser la liste des nombreuses expressions possibles qu’un contact pourrait prononcer en réponse à une invite. Le moteur ASR Nuance tente de faire correspondre la réponse du contact avec une entrée du fichier de grammaire. Comme le moteur ASR doit trouver une correspondance pour l’ensemble de l’énoncé, les fichiers de grammaire fournissent à Nuance une liste ciblée d’énoncés parmi lesquels choisir.
Un fichier de grammaire est l’un des moyens les plus efficaces d’accroître la précision de votre SRVI amélioré par ASR. L’ASR analyse les interactions humaines réelles, de sorte que le système doit reconnaître un nombre incalculable d’options. Cela rend un système ASR beaucoup plus complexe qu’un système qui ne répond qu’aux tonalités DTMF Tonalités de signalisation générées lorsqu’un utilisateur appuie ou appuie sur une touche du clavier de son téléphone.. Le système DTMF reconnaît 12 tonalités, ce qui signifie que le système SRVI doit reconnaître 12 options. La parole humaine contient un nombre exponentiel d’options et de combinaisons de sons, de mots et de phrases que le système ASR doit reconnaître.
Par exemple, un contact peut répondre à une invite lui demandant son numéro de membre par la phrase suivante : « Mon numéro de membre est 123456789 ». Un script amélioré par ASR reconnaît l’ensemble de la phrase, mais d’autres scripts échouent lorsque le contact commence par « Mon numéro d’adhérent est... » au lieu du seul numéro.
Lorsque vous mettez à jour un fichier de grammaire, renommez le fichier avant de l’utiliser dans des scripts de production. Cela permet d’éviter les conflits lors du processus de mise à jour. Cette opération conserve également le fichier d’origine comme sauvegarde au cas où vous devriez revenir en arrière pour une raison quelconque. Vous pouvez utiliser la substitution de variable lorsque vous spécifiez le nom du fichier de grammaire dans les actions ASR de vos scripts.
Précision accrue
Les fichiers de grammaire améliorent la précision des systèmes ASR. Vous pouvez ajouter à un fichier de grammaire des mots et des phrases que les contacts sont susceptibles de prononcer en plus des informations attendues. Par exemple, si l’invite demande au contact son numéro de membre, vous pouvez ajouter des phrases au fichier de grammaire telles que « mon numéro de membre est », « je pense que c’est », « attendez, je cherche ma carte », etc.
La liste ciblée d’un fichier de grammaire permet de limiter le nombre de permutations dans les énoncés. Plus la réponse attendue est longue, plus il y a de réponses possibles. Les fichiers de grammaire permettent de limiter le champ des réponses possibles en incluant les réponses les plus courantes et les plus susceptibles d’être utilisées.
Il n’est pas nécessaire de penser à toutes les réponses possibles à ajouter. Utilisez le processus de réglage pour apprendre comment les contacts parlent réellement. Vous pouvez enrichir vos fichiers de grammaire en fonction de ce que vous apprenez pendant le réglage. La création de fichiers de grammaire doit être un processus itératif, au fur et à mesure que les contacts utilisent le système et que vous apprenez les endroits où l’ASR ne comprend pas les réponses.
Variations de la prononciation
Lorsque vous réglez votre système ASR, écoutez les variations de prononciation. Il peut être utile d’ajouter plusieurs entrées à vos listes de phrases et à vos fichiers de grammaire avec différentes orthographes phonétiques.
Cela peut s’avérer particulièrement utile si l’invite peut susciter des réponses qui sont souvent mal prononcées ou qui ont des prononciations alternatives. Un exemple pourrait être « fungi » (champignons en anglais). Vous pouvez ajouter les entrées phonétiques supplémentaires suivantes en plus de l’entrée « fungi » : « fun guy », « fun jee » ou « fun gee ».
Prise en charge de plusieurs langues
ASR prend en charge plusieurs langues. La grammaire est spécifique à une langue. Mentionnez le nom de la langue dans l’en-tête du fichier afin que le moteur recherche spécifiquement les énoncés dans cette langue.
Dans tout fichier de grammaire, les entrées doivent utiliser le même alphabet, la même structure de phrase, etc. que la langue de référence. Par exemple, si vous utilisez le mot « piñata » pour une grammaire spécifique à l’espagnol, votre entrée doit utiliser le symbole du tilde (~) sur le « n » afin que l’entrée soit « piñata » et non « pinata ».
ASR et traitement du langage naturel
L’ASR et les fichiers de grammaire peuvent produire un résultat similaire à celui d’un système de traitement du langage naturel (NLP Également appelé PNL, ce processus comprend la parole ou le texte humain et répond avec un langage de type humain.), mais ce n’est pas la même chose. L’ASR est comme un pont entre DTMF et NLP. Il n’est pas censé tout capturer, mais il peut capturer la plupart des choses. C’est pourquoi les fichiers de grammaire sont si importants. Plus le fichier de grammaire est de qualité, plus le système ASR est capable de reconnaître les réponses.
Faits marquants sur les fichiers de grammaire
- Les fichiers de grammaire doivent être utilisés pour la plupart des actions ASR de Studio.
- Les actions Asralphanum, Asrcurrency, Asrdate, Asrdigits, Asrnumber, Asrtime et Asryesno ont des fichiers de grammaire intégrés. Vous pouvez créer et utiliser vos propres fichiers de grammaire en plus des fichiers intégrés.
- Les actions Asr et Asrmenu n’ont pas de fichiers de grammaire intégrés. Vous devez créer les vôtres pour ces actions.
- Les actions Asrcompile et Asrsql vous permettent de créer des fichiers de grammaire personnalisés à partir d’une base de données existante.
- Les symboles ne peuvent pas être utilisés dans l’énoncé d’un fichier de grammaire, mais peuvent être renvoyés avec la valeur.
- La création de fichiers de grammaire doit être un processus itératif. Chaque fois que vous réglez votre système ASR, vous découvrez de nouveaux éléments à ajouter à votre grammaire.
Exemples de fichiers de grammaire
Trois exemples de fichiers de grammaire à télécharger sont fournis :
Color_Grammar_Example.grxml (dans un fichier ZIP)
Digits_Grammar_Example.grxml (dans un fichier ZIP)
Format_Grammar_Example.grxml (dans un fichier ZIP)
Ces exemples illustrent « l’approche de règle » pour créer la structure d’un fichier de grammaire. Cette approche utilise trois règles : un préfixe, la grammaire principale et un suffixe. Les préfixes sont des énoncés que les gens prononcent souvent avant de donner l’essentiel de l’information, comme « c’est », « heu » ou « je pense que c’est ». Les suffixes sont de petits ajouts à la fin d’un énoncé, comme « je suppose » ou « peut-être ». La règle du milieu est la grammaire réelle dans laquelle vous pouvez définir toutes les entrées possibles pour les données que vous souhaitez collecter, telles que les couleurs, les nombres ou les modèles.
Paramètres et réglages ASR
Cette section fournit des informations sur certains paramètres et réglages ASR importants.
Paramètres de confiance
Lorsque le moteur ASR reconnaît une phrase prononcée par un appelant, il renvoie un pourcentage qui indique son degré de confiance dans la correspondance de l’énoncé avec un élément de la liste de phrases ou du fichier de grammaire. Le pourcentage de confiance peut être utilisé pour acheminer les appels vers des branches différentes dans votre script SRVI activé pour ASR.
Les niveaux de confiance utilisés dans CXone sont les suivants :
- Élevé : Niveau de confiance élevé, généralement égal ou supérieur à 75 %. Définissez la valeur de confiance avec la propriété HighConfidence dans les actions ASR. Le contact peut être acheminé par la branche OnHighConfidence sans nécessiter aucune autre confirmation de l’énonciation vocale.
- Moyen : Niveau de confiance moyen, entre le niveau de confiance élevé et le niveau de confiance minimal. Le contact peut être acheminé par la branche OnMedConfidence et requis de confirmer l’énonciation vocale. Cette catégorie n’a pas de propriété. Tout ce qui se trouve entre les niveaux minimum et maximum configurés peut être acheminé par cette branche.
- Minimal : Niveau de confiance minimal acceptable. Définissez la valeur de confiance avec la propriété MinConfidence dans les actions ASR. Cette valeur définit le numéro de la plage inférieure de la branche OnMedConfidence.
- Aucune confiance : L’énoncé est méconnaissable et le moteur ASR ne peut pas l’interpréter. Tout ce qui est inférieur à la valeur MinConfidence se situe dans cette fourchette. Le contact peut être acheminé par la branche OnNoConfidence et requis de confirmer l’énonciation vocale.
La plupart des actions ASR comportent des branches correspondant à différents niveaux de confiance. Cela vous permet de personnaliser l’expérience de l’utilisateur et de gérer la variabilité de la précision. Les variables de confiance sont des variables système et n’apparaissent donc pas dans une trace de script, sauf si vous activez les variables système pour qu’elles apparaissent dans la trace.
La confiance est affectée par des facteurs tels que le bruit de fond ou les conversations, les accents ou l’orthographe des entrées du fichier de grammaire.
MAX offre une méthode de personnalisation de la sensibilité si un agent se voit attribuer une compétence Connexion personnelle via le paramètre du seuil de voix pour aider à mesurer et filtrer les niveaux de bruit de fond, la détection de parole de l’agent, etc.
Paramètre de délai d’attente
Durée pendant laquelle l’action détectera un énoncé et tentera de trouver une correspondance; la durée par défaut est 10 secondes.
Paramètre de délai d’attente d’inter-voix
Il s’agit du temps que le système attendra après qu’un contact a cessé de parler. Le système attend de s’assurer que le contact ne continue pas à parler. Il s’agit d’un réglage similaire au réglage InterDigitTimeout pour DTMF Tonalités de signalisation générées lorsqu’un utilisateur appuie ou appuie sur une touche du clavier de son téléphone..
Par exemple, lorsqu’ils fournissent un numéro de compte, les contacts regroupent généralement les chiffres en les séparant par des pauses : « 123 <pause> 456 <pause> 789 <pause> ». Les <pauses> dans l’exemple précédent représentent le délai d’attente d’inter-voix. La valeur par défaut est 3 secondes. Lors de la création ou du réglage d’un script, n’oubliez pas de tenir compte du temps nécessaire pour que le contact parle, du délai d’attente d’inter-voix et d’un petit temps de traitement. Un trop grand nombre de paramètres de délai d’attente peut s’empiler les uns sur les autres et entraîner l’échec de l’action.
Erreurs
Erreur | Description |
---|---|
Échec de l’initialisation ASR | Le serveur de médias n’est pas en mesure de contacter le serveur ASR. Cela peut être dû à plusieurs raisons, notamment le service ASR qui ne fonctionne pas ou les ports qui ne sont pas ouverts. |
Erreur de fichier de grammaire: la grammaire n’a pas pu être compilée. Veuillez vérifier votre grammaire pour les erreurs de syntaxe. | Généralement causée par des problèmes XML avec la grammaire. |
Échec de l’URL. Le logiciel de reconnaissance n’a pas pu accéder à l’URL spécifiée. | La grammaire n’existe pas, n’a pas été référencée correctement ou le serveur de fichiers n’a pas pu être atteint. |
ASRRESULT | Détermine si un ASR a été détecté. |
ASRCONF | Valeur de confiance ASR résultante, 0-100. |
ASRCOMPLETIONCAUSECODE | Indique que ASR est terminé. |
ASRERRORMESSAGE | Une description textuelle de l’erreur rapportée par Nuance. |
ASRSTATUSCODE | Indique l’état avec l’une des valeurs suivantes :
|