Gestion d’ASR

Les informations sur cette page d’aide concernent à la fois CXone Studio et Desktop Studio.

Cette section fournit des informations sur la gestion du système de menus IVRFermé Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches, ou les deux, pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. amélioré par la reconnaissance vocale automatique (ASR) dans CXone.

Une compréhension existante de la reconnaissance vocale automatique et du moteur Nuance ASR est cruciale pour créer un système IVR compatible ASR. Une documentation complète sur l'utilisation de ce moteur est disponible auprès de Nuance.

Réglage

Autorisations requises : Rapport de réglage ASR Activé

Le réglage vous permet d'améliorer votre système ASR en fonction des données relatives aux performances actuelles des actions ASR Studio. Il s'agit d'une partie importante du développement et de la maintenance de votre système ASR.

Le rapport de réglage ASR fournit des informations que vous pouvez utiliser dans votre processus de réglage. Il fournit les taux de réponse pour les actions ASR qui se déclenchent dans un script et vous permet de voir une liste d'énoncés que l'ASR n'a pas pu reconnaître. Ce rapport est ventilé par action et par paramètre de branche de confiance.

Si le réglage est activé, vous pouvez développer ces sections et écouter les fichiers audio enregistrés à partir de ce segment. Vous disposez ainsi d’informations sur les réponses que le système ASR n'a pas été en mesure de comprendre. Vous pouvez les ajouter à vos fichiers de grammaire et à vos listes de phrases.

Lorsque vous réglez votre système ASR, vous pouvez :

  • Consultez le rapport de réglage ASR et évaluez les données qu'il fournit.
  • Écoutez les enregistrements du rapport de réglage ASR pour comprendre ce qu'il y a d’identique dans les interactions.
  • Identifiez ce que vos contacts disent et comment ils le disent.
  • Mettez à jour les fichiers de grammaire en fonction de ce que vous apprenez.
  • Ajustez les valeurs de confiance, si nécessaire.

Activation du réglage

Si votre IVR capture des données PII (Personal Identifiable Information), vous devez choisir avec soin les sections de votre IVR à enregistrer lors du réglage. Vous éviterez ainsi les problèmes liés à la capture de données personnelles. Par exemple, si vous avez une action Asrdigits qui collecte un numéro d'identification sensible, vous pouvez lancer le réglage après cette action. Cela permet d'éviter que le numéro d'identification ne soit enregistré.

Désactivez le réglage lorsque vous avez terminé de régler activement votre IVR. Laisser la fonction de réglage activée provoque une énorme ballonnement et un stress sur le serveur, car chaque interaction crée un nouveau fichier audio.

  1. Dans Studio, ouvrez votre script ASR et ajoutez une action Voiceparams. Elle doit se trouver avant les actions ASR avec lesquelles vous voulez travailler lors du réglage.
  2. Si le seul but de cette action dans votre script est d'activer et de désactiver le réglage, modifiez la Caption pour indiquer ce but. Par exemple, Tuning On and Off. Si vous utilisez également l'action pour changer la langue de votre IVR, vous aurez peut-être besoin d'une autre légende.
  3. Dans l’action Voiceparams, réglez la propriété ASRTuningEnabled sur True.
  4. Lorsque vous avez terminé le réglage, réglez la propriété ASRTuningEnabled sur False.

Paramètres de réglage

Vous pouvez attribuer des paramètres de réglage spécifiques au script pour vos actions ASR Nuance. Pour ce faire, définissez un objet de données dynamique dans une action Snippet. Appelez l'objet nuanceTuningParamsJson. Sa valeur doit être une chaîne JSON valide contenant les paramètres Nuance à définir à partir de leurs valeurs par défaut. Par exemple :

DYNAMIC asrParams
ASSIGN asrParams.sensitivity = "87"
ASSIGN asrParams.Speech_Complete_Timeout = "1000",
ASSIGN asrParams.Speech_Incomplete_Timeout = "1000"
ASSIGN asrParams.No_Input_Timeout = "1000"
ASSIGN global:nuanceTuningParamsJson = "{asrParams.asjson()}" 		

Si des paramètres sont définis sur des valeurs non valides, la valeur non valide sera remplacée par la valeur par défaut de ce paramètre et une variable appelée invalidParamsList est retournée afin d’énumérer les valeurs qui ont été modifiées.

Les tableaux suivants présentent les paramètres de réglage pris en charge dans Studio :

Paramètre Nuance Description Prise en charge de Studio
Speech_Complete_Timeout Combien de temps attendre avant de conclure qu'un appelant a fini de parler.

Prise en charge en utilisant nuanceTuningParamsJson.

Par défaut : "Speech-Complete-Timeout" : "0"

Speech_Incomplete_Timeout Durée du silence pour déterminer que les appelants ont fini de parler.

Prise en charge en utilisant nuanceTuningParamsJson.

Par défaut : "Speech-Incomplete-Timeout": "1500"

No_Input_Timeout

Combien de temps attendre la parole après la fin d'une invite.

Remarque : ce paramètre commence le décompte au début de la lecture de l’invite. Cela signifie que le script peut atteindre le délai trop tôt. La propriété TimeoutSeconds de l’action ASR commence le décompte à la fin de l’invite.

Prise en charge en utilisant nuanceTuningParamsJson.

Par défaut : "No-Input-Timeout": "7000"

sensitivity Sensibilité du détecteur de parole lors de la recherche de parole. Par défaut : 50 (échelle de 0 à 100)

Les paramètres de Nuance suivants ne sont pas pris en charge dans CXone, car l'action Studio Asr joue des invites au lieu de Nuance.

Paramètre de nuance Description Valeur par défaut
swiep_suppress_barge_in_time Désactive brièvement l'intervention au début d'une invite. 0 (sans retard)
swiep_in_prompt_sensitivity_percent Contrôle le niveau de volume des appelants pour interrompre les invites (intervention) et détecter la parole. 50 (pourcentage)
swirec_barge_in_mode Définit des mods de reconnaissance spéciaux dans le module de reconnaissance. normal

Fichiers de grammaire

Les fichiers de grammaire vous permettent de répertorier de nombreux énoncés potentiels qu'un contact peut prononcer en réponse à une invite. Le moteur Nuance ASR tente de faire correspondre la réponse du contact avec une entrée du fichier de grammaire. Comme le moteur ASR doit trouver une correspondance pour l'ensemble de l'énoncé, les fichiers de grammaire fournissent à Nuance une liste ciblée d'énoncés parmi lesquels choisir.

Un fichier de grammaire est l'une des méthodes les plus efficaces pour augmenter la précision de votre IVR amélioré ASR. ASR analyse les interactions humaines réelles, ce qui crée une énorme liste d'options que le système doit reconnaître. Cela rend un système ASR beaucoup plus complexe qu'un système qui ne répond qu'aux tonalités DTMFFermé Tonalités de signalisation générées lorsqu'un utilisateur appuie ou appuie sur une touche de son clavier téléphonique.. Le système DTMF reconnaît 12 tonalités, ce qui signifie que le système IVR doit reconnaître 12 options. La parole humaine contient un nombre exponentiel d'options et de combinaisons de sons, de mots et de phrases que le système ASR doit reconnaître.

Par exemple, un contact peut répondre à une invite lui demandant son numéro de membre par la phrase suivante : « Mon numéro d'adhérent est 123456789 ». Un script amélioré ASR reconnaît l'ensemble de la phrase, mais d'autres scripts échouent lorsque le contact commence par « Mon numéro d'adhérent est... » au lieu du numéro seul.

Précision accrue

Les fichiers de grammaire améliorent la précision des systèmes ASR. Vous pouvez ajouter à un fichier de grammaire des mots et des phrases que les contacts sont susceptibles de dire en plus des informations attendues. Par exemple, si l'invite demande au contact son numéro d'adhérent, vous pouvez ajouter au fichier de grammaire des phrases telles que « mon numéro au fichier de grammaire est », « je pense que c'est », « attendez, je cherche ma carte », etc.

La liste ciblée d'un fichier de grammaire permet de limiter le nombre de permutations dans les énoncés. Plus la réponse attendue est longue, plus il y a de réponses possibles. Les fichiers de grammaire permettent de limiter le champ des réponses possibles en incluant les réponses les plus courantes et les plus susceptibles d'être utilisées.

Il n'est pas nécessaire de penser à toutes les réponses possibles à ajouter. Utilisez le processus de réglage pour apprendre comment les contacts parlent réellement. Vous pouvez enrichir vos fichiers de grammaire en fonction de ce que vous apprenez pendant le réglage. La création de fichiers de grammaire doit être un processus itératif, au fur et à mesure que les contacts utilisent le système et que vous apprenez les endroits où l’ASR ne comprend pas les réponses.

Variations de la prononciation

Lors du réglage de votre système ASR, écoutez les variations de prononciation. Il peut être utile d'ajouter plusieurs entrées à vos listes de phrases et à vos fichiers de grammaire avec différentes orthographes phonétiques.

Cela peut être particulièrement utile si l'invite peut susciter des réponses souvent mal prononcées ou qui possèdent des prononciations alternatives. Un exemple pourrait être "fungi" (pluriel de champignon). Vous pouvez ajouter les entrées phonétiques supplémentaires suivantes en plus de l'entrée "fungi": "fun guy", "fun gee", "fun jee".

Prise en charge de langues multiples

ASR prend en charge des langues multiples. Les grammaires sont spécifiques à une langue. Faites référence au nom de la langue dans l'en-tête du fichier afin que le moteur recherche spécifiquement les énoncés dans cette langue.

Dans chaque fichier de grammaire, les entrées doivent utiliser le même alphabet, la même structure de phrase, etc. que la langue référencée. Par exemple, si vous utilisez le mot « piñata » pour une grammaire spécifique à l'espagnol, votre entrée doit utiliser le symbole tilde (~) au-dessus du « n »; l'entrée est donc « piñata » et non « pinata ».

ASR et traitement du langage naturel

Les fichiers ASR et de grammaire peuvent produire un résultat similaire à celui d'un système de traitement du langage naturel (NLPFermé État qui permet à un agent de remplir les exigences de travail après avoir terminé une interaction), mais ce n'est pas la même chose. ASR est comme un pont entre le DTMF et le NLP. Il n'est pas censé tout capturer, mais il peut capturer la plupart des choses. C'est pourquoi les fichiers de grammaire sont particulièrement importants. Plus le fichier de grammaire est de qualité, plus le système ASR peut reconnaître de réponses.

Faits clés sur les fichiers de grammaire

  • Les fichiers de grammaire doivent être utilisés pour la plupart des Actions Studio ASR.
  • Les actions Asralphanum, Asrcurrency, Asrdate, Asrdigits, Asrnumber, Asrtime et Asryesno comportent des fichiers de grammaire intégrés. Vous pouvez créer et utiliser vos propres fichiers de grammaire en plus des fichiers intégrés.
  • Les actions Asr et Asrmenu ne comportent pas de fichiers de grammaire intégrés. Vous devez créer les vôtres pour ces actions.
  • Les actions Asrcompile et Asrsql permettent de créer des fichiers de grammaire personnalisés à partir d'une base de données existante.
  • Les symboles ne peuvent pas être utilisés dans l'énoncé d'un fichier de grammaire, mais peuvent être renvoyés avec la valeur.
  • La création de fichiers de grammaire doit être un processus itératif. À chaque fois que vous réglez votre système ASR, vous découvrez de nouveaux éléments à ajouter à vos grammaires.

Exemples de fichiers de grammaire

Trois exemples de fichiers e grammaire sont disponibles en téléchargement :

Color_Grammar_Example.grxml (dans un fichier ZIP)

Digits_Grammar_Example.grxml (dans un fichier ZIP)

Format_Grammar_Example.grxml (dans un fichier ZIP)

Ces exemples illustrent l '«approche par règles» pour créer la structure d'un fichier de grammaire. Cette approche utilise trois règles : un préfixe, la grammaire principale et un suffixe. Les préfixes sont des énoncés que les gens disent souvent avant de donner le corps principal des informations, comme « c'est », « euh » ou « je pense que c'est ». Les suffixes sont de petits ajouts à la fin d'un énoncé, comme « je suppose » ou « peut-être ». La règle du milieu est la grammaire réelle dans laquelle vous pouvez définir toutes les entrées possibles pour les données que vous souhaitez collecter, telles que les couleurs, les nombres ou les modèles.

Paramètres et réglages ASR

Cette section fournit des informations sur des paramètres et réglages ASR importants.

Paramètres de confiance

Lorsque le moteur ASR reconnaît une phrase prononcée par un appelant, il renvoie un pourcentage qui indique à quel point il a confiance en sa mise en correspondance de l'énoncé avec un élément de la liste de phrases ou du fichier de grammaire. Le pourcentage de confiance peut être utilisé pour acheminer les appels vers des tronçons différents dans votre script SVI activé pour ASR.

Les niveaux de confiance utilisés dans le CXone sont les suivants :

  • Haut : degré de confiance élevé, généralement égal ou supérieur à 75 %. Définissez la valeur de confiance à l’aide de la propriété HighConfidence dans les actions ASR. Le contact peut être acheminé par la branche OnHighConfidence sans nécessiter aucune autre confirmation de l'énoncé.
  • Moyen : confiance moyenne, entre la confiance élevée et la confiance minimale. Le contact peut être acheminé par la branche OnMedConfidence et être invité à confirmer l'énoncé. Cette catégorie n'a pas de propriété. Tout ce qui se trouve entre les niveaux minimum et maximum configurés peut être acheminé par cette branche.
  • Minimal : le niveau de confiance minimale acceptable. Définissez la valeur de confiance à l’aide de la propriété MinConfidence dans les actions ASR. Cette valeur définit le numéro de la plage inférieure de la branche OnMedConfidence.
  • Aucune confiance : l'énoncé était méconnaissable et le moteur ASR ne peut pas l'interpréter. Tout ce qui est inférieur à la valeur MinConfidence se situe dans cette plage. Le contact peut être acheminé via la branche OnNoConfidence et être invité à répéter l'énoncé.

La plupart des actions ASR comportent des branches correspondant à différents niveaux de confiance. Cela vous permet de personnaliser l'expérience utilisateur et de gérer la variabilité de la précision. Les variables de confiance sont des variables système. Elles n'apparaissent donc pas dans une trace de script, à moins que vous n’activiez l’affichage des variables système dans la trace.

La confiance est affectée par des facteurs tels que le bruit de fond ou les conversations, les accents ou l'orthographe des entrées du fichier de grammaire.

MAX offre une méthode de personnalisation de la sensibilité si un agent se voit attribuer une Connexion personnelle compétence si le réglage du seuil de voix pour aider à mesurer et filtrer les niveaux de bruit de fond, la détection vocale de l'agent, etc.

Réglage du délai d'expiration

La durée pendant laquelle l'action détectera un énoncé et tentera de trouver une correspondance ; la durée par défaut est 10 secondes.

Paramètre de délai d'attente entre les voix

Il s'agit du temps que le système attendra après qu'un contact a cessé de parler. Le système attend afin de s'assurer que le contact ne continue pas à parler. Il s'agit d'un réglage similaire à celui de InterDigitTimeout pour DTMFFermé Tonalités de signalisation générées lorsqu'un utilisateur appuie ou appuie sur une touche de son clavier téléphonique..

Par exemple, lorsqu'ils fournissent un numéro de compte, les contacts prononcent généralement des groupes de nombres en les entrecoupant de pauses : « 123 <pause> 456 <pause> 789 <pause> ». Les <pauses> dans l'exemple précédent représentent le délai d'attente entre les voix. La valeur par défaut est 3 secondes. Lors de la création ou du réglage d'un script, n'oubliez pas de tenir compte du temps nécessaire pour que le contact parle, du délai d'attente entre les voix et d'un petit temps de traitement. Un trop grand nombre de paramètres de délai d'attente peut s'empiler les uns sur les autres et entraîner l'échec de l'action.

Erreurs

Erreur Description
Échec de l'initialisation ASR Le serveur multimédia ne parvient pas à contacter le serveur ASR. Cela peut être dû à plusieurs raisons, notamment le service ASR qui ne fonctionne pas ou les ports qui ne sont pas ouverts.
Erreur de fichier de grammaire: la grammaire n'a pas pu être compilée. Veuillez vérifier votre grammaire pour les erreurs de syntaxe. Généralement causé par des problèmes XML dans la grammaire.
Échec de l'URL. L'outil de reconnaissance n'a pas pu accéder à l'URL spécifiée. La grammaire n'existe pas, n'a pas été référencée correctement ou le serveur de fichiers n'a pas pu être atteint.
RESULTATASR Détermine si ASR a été détecté.
ASRCONF La valeur de confiance ASR résultante, 0-100.
CODEDECAUSEDEREALISATIONASR Indique la fin de l'ASR.
MESSAGED'ERREURASR Une description textuelle de l'erreur rapportée par Nuance.
CODED'ETATASR Indique l'état avec l'une des valeurs suivantes:
  • ASR_STATUS_WAITING = 100 (TCP ouvert est toujours en attente)
  • ETAT_ASR_OK = 200
  • DTMF_ETAT_ASR = 298
  • ASR_RECOGNITION_D'ETAT_ECHOUEE = 299
  • _RESULTAT_DECONFIDENCE_MALFORME_D'ETAT_ASR = 300
  • ERREUR_DECLIENT_D'ETAT_ASR = 400
  • ERREUR_SERVEUR_D'ETAT_ASR = 500
  • L'ETABLISSEMENT_SERVEUR_DASR_STATUS_SERVER_ESTABLISHMENT_FAILED = 590
  • ASR_STATUS_SERVER_SELECT_WSAEINTR = 591
  • CONNECTION_TCP_FERMEE_PAR_SERVEUR_D'ETAT_ASR = 592
  • ASR_STATUS_SERVER_TCP_RECV_FAILED = 593
  • ETAT_ASR_PAS_DE_LIGNE_DE_RELAI_DISPONIBLE = 594
  • ASR_STATUS_SERVER_TCP_OPEN_TIMED_OUT = 595
  • ASR_STATUS_SERVER_RESPONSE_TIMED_OUT = 596
  • ETAT_ASR_DES_SESSIONS_MAX_EXCEDE = 597
  • ETAT_ASR_DUPLICATE_ENABLE_REQUEST_ERREUR = 598
  • ERREUR_INTERNE_D'ETAT_ASR = 599
  • ASR_STATUS_STOPPED_BY_MEDIA_CHANNEL = 998