Gerenciamento ASR
As informações nesta página de ajuda são aplicáveis tanto ao CXone Studio quanto ao Desktop Studio.
Esta seção fornece informações sobre como gerenciar o seu sistema de menu IVR Menu de telefone automatizado que permite que os chamadores interajam por meio de comandos de voz, entradas de teclas ou ambos para obter informações, encaminhar uma chamada de voz de entrada ou ambos. com reconhecimento automático de fala expandido no CXone.
Um entendimento existente do reconhecimento automático de fala e o mecanismo Nuance são cruciais para a criação de um sistema IVR com ASR habilitado eficaz. A documentação completa para o uso deste mecanismo está disponível no Nuance.
Ajuste
Permissões necessárias: Relatório de ajuste ASR ativado
O ajuste permite que você melhore o seu sistema ASR com base nos dados sobre como está o desempenho atual das ações ASR do Studio. Essa é uma parte importante do desenvolvimento e manutenção do seu sistema ASR.
O Relatório de Ajuste ASR fornece informações que você pode usar no processo de ajuste. Ele fornece taxas de resposta para ações ASR que são acionadas em um script e permite que você veja uma lista de enunciados que o ASR não conseguiu reconhecer. Este relatório é dividido por ação e cada configuração de ramal de confiança.
Se o ajuste estiver ativado, você poderá expandir essas seções e ouvir os arquivos de áudio gravados desse segmento. Isso lhe fornece informações sobre as respostas que o sistema ASR não conseguiu entender. Você pode adicioná-las aos seus arquivos de gramática e listas de frase.
Ao ajustar o seu sistema ASR, você pode:
- Ver o Relatório de ajuste ASR e avaliar os dados que este fornece.
- Ouvir as gravações do Relatório de ajuste ASR para entender os padrões nas interações.
- Identificar o que os seus contatos estão dizendo e como estão falando.
- Atualizar os arquivo de gramática com base no que aprendeu.
- Ajustar valores de confiança, se necessário.
Ativar ajuste
Se o seu IVR capturar quaisquer dados PII (informações pessoais identificáveis), é melhor escolher com cuidado quais sessões do seu IVR gravar durante o ajuste. Isso o ajudará a evitar problemas com captura de dados pessoais. Por exemplo, se tiver uma ação Asrdigits que coleta um número sigiloso de ID, você pode iniciar o ajuste após tal ação. Isso manteria o número de ID fora da gravação.
Desative o ajuste quando terminar de ajustar ativamente o seu IVR. Deixar o recurso de ajuste ativado causa um enorme inchaço e estresse no servidor, pois cada interação cria um novo arquivo de áudio.
- No Studio, abra o seu script ASR e adicione uma ação Voiceparams. Ela deve estar localizada antes das ações ASR que você quer que funcionem durante o ajuste.
- Se o único propósito desta ação no seu script é ativar e desativar o ajuste, altere a Caption para indicar este propósito. Por exemplo, Tuning On and Off. Se também usar a ação para alterar o idioma do seu IVR, pode precisar de uma legenda diferente.
- Na ação Voiceparams, defina a propriedade ASRTuningEnabled para True.
- Ao terminar de ajustar, defina a propriedade ASRTuningEnabled para False.
Parâmetros de ajuste
Você pode atribuir parâmetros de ajuste específicos do script para suas ações ASR do Nuance. Para fazer isso, configure um objeto de dados dinâmicos em uma ação Snippet. Chame o objeto de nuanceTuningParamsJson. Seu valor deve ser uma sequência JSON válida que contenha os parâmetros Nuance a serem definidos a partir de seus padrões. Por exemplo:
DYNAMIC asrParams
ASSIGN asrParams.sensitivity = "87"
ASSIGN asrParams.Speech_Complete_Timeout = "1000",
ASSIGN asrParams.Speech_Incomplete_Timeout = "1000"
ASSIGN asrParams.No_Input_Timeout = "1000"
ASSIGN global:nuanceTuningParamsJson = "{asrParams.asjson()}"
Se algum parâmetro for definido com valores inválidos, o valor inválido será substituído pelo padrão desse parâmetro e uma variável chamada invalidParamsList será retornada, listando os valores que foram alterados.
As tabelas a seguir fornecem os possíveis parâmetros de ajuste que são compatíveis com o Studio:
Parâmetro Nuance | Descrição | Suporte Studio |
---|---|---|
Speech_Complete_Timeout | Quanto tempo esperar antes de concluir que um chamador terminou de falar. |
Suportado usando nuanceTuningParamsJson. Padrão: "Speech-Complete-Timeout" : "0" |
Speech_Incomplete_Timeout | Duração do silêncio para determinar se os chamadores terminaram de falar. |
Suportado usando nuanceTuningParamsJson. Padrão: "Speech-Incomplete-Timeout": "1500" |
No_Input_Timeout |
Quanto tempo esperar pela fala após o término de um prompt. Observação: este parâmetro começa a contar quando o prompt é iniciado. Isso pode significar que o script atinja o tempo limite muito cedo. A propriedade TimeoutSeconds da ação |
Suportado usando nuanceTuningParamsJson. Padrão: "No-Input-Timeout": "7000" |
sensitivity | Sensibilidade do detector de fala ao procurar fala. | Padrão: 50 (escala de 0-100) |
Os seguintes parâmetros do Nuance não são suportados no CXone pois a ação Asr do Studio reproduz prompts em vez do Nuance.
Parâmetro Nuance | Descrição | Valor padrão |
---|---|---|
swiep_suppress_barge_in_time | Desativa a entrada rápida no início de um prompt. | 0 (sem demora) |
swiep_in_prompt_sensitivity_percent | Controla o quão alto os chamadores devem falar para interromper as solicitações (entrada) e detectar a fala. | 50 (por cento) |
swirec_barge_in_mode | Define mods de reconhecimento especiais no reconhecedor. | normal |
Arquivo de gramática
Os arquivos de gramática permitem que você liste vários enunciados possíveis que um contato pode falar em resposta a um prompt. O mecanismo de Nuance ASR tenta associar a resposta do contato com uma entrada no arquivo de gramática. Como o mecanismo ASR deve encontrar uma correspondência para todo o enunciado, os arquivos de gramática fornecem ao Nuance uma lista focada de enunciados a serem escolhidos.
Um arquivo de gramática é um dos métodos mais eficazes para aumentar a precisão do seu IVR com adição de ASR. O ASR analisa as interações humanas reais para que haja um vasto número de opções que seu sistema deve reconhecer. Isto torna um sistema ASR muito mais complexo do que um que apenas responde aos tons DTMF Tons de sinalização gerados quando um usuário pressiona ou toca em uma tecla do teclado do telefone.. O DTMF reconhece 12 tons, o que significa que há 12 opções que o sistema IVR deve reconhecer. As falas humanas contêm exponencialmente mais opções e combinações de sons, palavras e frases que o sistema ASR deve reconhecer.
Por exemplo, um contato pode responder a uma solicitação que pede o seu número de cadastro com a frase: "Meu número de cadastro é 123456789." Um script com ASR expandido reconheceria a frase inteira, mas outros scripts falhariam quando o contato começasse com "Meu número de cadastro é...” em vez da resposta ser somente o número.
Ao atualizar um arquivo de gramática, renomeie o arquivo antes de usá-lo em scripts de produção. Isso ajuda a evitar conflitos durante o processo de atualização. Isto também deixa o arquivo original como um backup caso precise revertê-lo por qualquer motivo. Você pode usar substituição de variável ao especificar o nome do arquivo de gramática em ações ASR nos seus scripts.
Precisão aprimorada
Arquivos de gramática melhoram a precisão de sistemas ASR. No arquivo de gramática, você pode adicionar palavras e frases que contatos provavelmente dirão além da informação esperada. Por exemplo, se a solicitação pedir ao contato por um número de cadastro, você pode adicionar ao arquivo de gramática frases como "meu número de cadastro é", "Acho que é", "Um momento, deixe eu encontrar meu cartão" e assim por diante.
A lista focada no arquivo de gramática ajuda a limitar o número de variantes nos enunciados. Quanto mais longa uma resposta esperada for, maior será o número de respostas possíveis. Arquivos de gramática ajudam a limitar o escopo de respostas possíveis ao incluir aquelas que são comuns e mais provavelmente serão usadas.
Você não precisa pensar em todas as respostas possíveis para adicionar. Use o processo de ajuste para aprender como os contatos realmente falam. Você pode adicionar frases aos arquivos de gramática com base no que aprendeu durante o ajuste. Criar arquivos de gramática deve ser um processo repetido à medida que os contatos usam o sistema e você aprende analisando onde o ASR falha em entender respostas.
Variações na pronúncia
Ao ajustar seu sistema ASR, ouça por variações de pronúncia. Pode ser útil adicionar diversas entradas às suas listas de frases e arquivos de gramática com várias grafias fonéticas.
Isso pode ser especialmente útil se o prompt puder obter respostas que são frequentemente pronunciadas incorretamente ou que possuem pronúncias alternativas. Um exemplo pode ser "gratuito" (grátis). Você pode adicionar as seguintes entradas fonéticas (corretas ou incorretas) adicionais, além da entrada "gratuito": "gratuíto", "grátis", "de graça".
Suporte a vários idiomas
O ASR é compatível com vários idiomas. As gramáticas são específicas aos idiomas. Faça referência ao nome do idioma no cabeçalho do arquivo para que o mecanismo procure especificamente por enunciados naquela língua.
Em qualquer arquivo de gramática, as entradas deverão usar o mesmo alfabeto, estrutura de frases e assim por diante do idioma referenciado. Por exemplo, se você usar a palavra "piñata" para uma gramática específica do espanhol, sua entrada deverá usar o símbolo de til (~) sobre o "n"; a entrada deve ser "piñata" e não "pinata.”
ASR e Processamento de linguagem natural
O ASR e os arquivos de gramática podem criar um resultado que é semelhante a um sistema de processador de linguagem natural (NLP Também chamado PLN, esse processo entende a fala humana ou texto e responde com linguagem similar à dos humanos.), mas eles não são os mesmos. O ASR é como uma ponte entre o DTMF e o NLP. Ele não é feito para capturar tudo, mas consegue capturar a maioria dos enunciados. É por isso que os arquivos de gramática são tão importantes. Quanto melhor for o arquivo de gramática, mais respostas poderão ser reconhecidas com sucesso pelo sistema ASR.
Fatos importantes sobre arquivos de gramática
- Arquivos de gramática devem ser usados para a maioria das ações ASR do Studio.
- As ações Asralphanum, Asrcurrency, Asrdate, Asrdigits, Asrnumber, Asrtime e Asryesno possuem arquivos gramaticais integrados. Você pode criar e usar seus próprios arquivos de gramática além dos integrados já existentes.
- As ações Asr e Asrmenu não possuem arquivos gramaticais integrados. Você deve criar os seus próprios para essas ações.
- As ações Asrcompile e Asrsql permitem que você crie arquivos de gramática personalizados a partir de um banco de dados existente.
- Os símbolos não podem ser usados no enunciado de um arquivo de gramática, mas podem ser retornados com o valor.
- Criar arquivos de gramática deve ser um processo contínuo. Toda vez que ajusta o seu sistema ASR, você descobre novos itens para adicionar às suas gramáticas.
Exemplos de arquivos de gramática
Três exemplos de arquivos de gramática são fornecidos para você baixar.
Color_Grammar_Example.grxml (em um arquivo ZIP)
Digits_Grammar_Example.grxml (em um arquivo ZIP)
Format_Grammar_Example.grxml (em um arquivo ZIP)
Esses exemplos ilustram a "abordagem de regras" para criar a estrutura de um arquivo de gramática. Esta abordagem usa três regras: um prefixo, a gramática principal e um sufixo. Prefixos são enunciados que as pessoas costumam dizer antes de fornecer o corpo principal de informações, como "é", "hum" ou "acho que é”. Sufixos são pequenas adições no final de um enunciado, como "eu acho" ou "talvez.” A regra do meio é a gramática real onde você pode definir todas as entradas possíveis para os dados que deseja coletar, como cores, números ou modelos.
Parâmetros e configurações de ASR
Esta seção fornece informações sobre os parâmetros e configurações importantes do ASR.
Parâmetros de confiança
Quando o mecanismo ASR reconhece uma frase falada por um chamador, ele retorna uma porcentagem que indica o quão confiante está sobre a sua associação do enunciado com um item na lista de frases ou no arquivo de gramática. A porcentagem de confiança pode ser usada para rotear chamadas para diferentes ramais no script de IVR com ASR ativado.
Os níveis de confiança utilizados no CXone são:
- Alto: confiança alta; normalmente 75% ou mais. Defina o valor de confiança com a propriedade HighConfidence nas ações ASR. O contato pode ser roteado através do ramal OnHighConfidence sem qualquer confirmação adicional do enunciado.
- Médio: confiança média, entre a alta e a baixa. O contato pode ser roteado através do ramal OnMedConfidence e solicitado a confirmar o enunciado. Esta categoria não tem uma propriedade. Tudo que seja classificado entre os níveis mínimo e alto configurados pode ser roteado por este ramal.
- Mínimo: o nível mínimo de confiança aceitável. Defina o valor de confiança com a propriedade MinConfidence nas ações ASR. Este valor define o número para o alcance mais baixo do ramal OnMedConfidence.
- Sem confiança: o enunciado era irreconhecível e o mecanismo ASR não pode interpretá-lo. Qualquer enunciado menor que o valor MinConfidence cai nessa categoria. O contato pode ser roteado através do ramal OnNoConfidence e solicitado a repetir o enunciado.
A maioria das ações ASR tem ramais para níveis diferentes de confiança. Isso permite que você personalize a experiência do consumidor e lide com uma precisão variável. Variáveis de confiança são variáveis do sistema e, portanto, não aparecem em um rastreamento de script, a menos que você permita que variáveis do sistema apareçam no rastreamento.
A confiança é afetada por fatores como ruído de fundo ou conversas, sotaques ou ortografia das entradas de arquivos gramaticais.
MAX oferece um método de personalização de sensibilidade se um agente receber uma competência Personal Connection na configuração do limite de voz para ajudar na medição e filtragem dos níveis de ruído de fundo, na detecção de voz do agente e assim por diante.
Configuração de tempo limite
O período de tempo em que a ação detectará um enunciado e tentará encontrar uma correspondência; a duração padrão é de 10 segundos.
Configuração de tempo limite entre voz
Esta é a quantidade de tempo que o sistema esperará depois que um contato parar de falar. O sistema espera até ter certeza de que o contato parou de falar. É parecida com a configuração InterDigitTimeout para DTMF Tons de sinalização gerados quando um usuário pressiona ou toca em uma tecla do teclado do telefone..
Por exemplo, ao fornecer um número de conta, os contatos geralmente falam grupos de números com pausas entre eles - "123 <pausa> 456 <pausa> 789 <pausa>". As <pausas> no exemplo anterior representam o tempo limite entre voz. O valor padrão é de 3 segundos. Ao criar ou ajustar um script, lembre-se de levar em consideração o tempo necessário para o contato falar, o tempo limite entre voz e uma pequena quantidade de tempo para processamento. Configurações de tempo limite em excesso podem se acumular e resultar em falha na ação.
Erros
Erro | Descrição |
---|---|
Falha na inicialização do ASR | O servidor de mídia não pode entrar em contato com o servidor ASR. Isso pode ser causado por vários motivos, incluindo o serviço ASR não estar em execução ou portas não estarem abertas. |
Erro no arquivo de gramática: Não foi possível compilar a gramática. Verifique sua gramática quanto a erros de sintaxe. | Geralmente causado por problemas de XML na gramática. |
Falha de URL. O reconhecedor não conseguiu acessar o URL especificado. | A gramática não existe, não foi referenciada corretamente ou o servidor de arquivos não pôde ser alcançado. |
ASRRESULT | Determina se o ASR foi detectado. |
ASRCONF | O valor de confiança ASR resultante, 0-100. |
ASRCOMPLETIONCAUSECODE | Indica a conclusão do ASR. |
ASRERRORMESSAGE | Uma descrição textual do erro, conforme relatado pela Nuance. |
ASRSTATUSCODE | Indica o status com um dos seguintes valores:
|