Reconocimiento automático de voz (ASR)

La información de esta página de ayuda aplica tanto a CXone Studio como a Desktop Studio.

El Reconocimiento Automático de Voz (ASR) permite que los contactos respondan a las indicaciones de la IVRCerrado Menú telefónico automatizado que permite a las personas que llaman interactuar a través de comandos de voz, entradas de teclas o ambos, para obtener información, enrutar una llamada de voz entrante o ambos. al hablar. Puede usar ASR en sus guiones de IVR en lugar de o además de un sistema de menús basado en DTMFCerrado Tonos de señalización que se generan cuando un usuario presiona o toca una tecla en el teclado de su teléfono.. ASR puede simplificar y acelerar la experiencia de los contactos con su IVR. Una IVR habilitada para ASR debe reconocer tanto palabras como frases. Puede combinarlos con valores que haya predefinido y enrutar o responder llamadas según corresponda.

En CXone, el ASR es una función opcional. Utiliza la versión 11 del motor Nuance ASR, que mejora la precisión del reconocimiento de voz de su sistema. El motor Nuance ASR también puede grabar en estéreo.

Una comprensión existente del reconocimiento de voz automático y el motor del ASR de Nuance es crucial para crear un sistema efectivo de IVR mejorado por ASR. La documentación completa para usar este motor está disponible en Nuance.

Terminología del ASR

Antes de trabajar con el ASR en CXone, debe estar familiarizado con la siguiente terminología relacionada con ASR:

  • Enunciado: palabras o frases pronunciadas por un contacto en respuesta a avisos de la IVRCerrado Menú telefónico automatizado que permite a las personas que llaman interactuar a través de comandos de voz, entradas de teclas o ambos, para obtener información, enrutar una llamada de voz entrante o ambos..
  • Archivo de gramática: El archivo que proporciona reglas para el motor ASR. Abarca las palabras o frases que se espera que digan los contactos en respuesta a un mensaje, luego asigna contenido a las variables en función de esas respuestas. Esto hace que el proceso de reconocimiento sea más eficiente y otorga mayores índices de precisión. Puede aprender más sobre los archivos de gramática en la página de Gestión del ASR.
  • Lista de Frases: Una lista de frases que se puede esperar que las personas que llaman digan en respuesta a una indicación. Cada frase de la lista debe aparecer en una línea por separado. una por línea. Generalmente se ingresan las listas de frases usando la PhraseList propiedad de una acción del ASR Studio.
  • Porcentaje de Confianza: También conocido como porcentaje de reconocimiento. Cuando el motor del ASR reconoce una frase pronunciada por una persona, devuelve un porcentaje que indica cuán seguro está en la coincidencia de un enunciado con el elemento en la lista de frases o el archivo de gramática. El porcentaje de confianza pueden ser utilizados para enrutar las llamadas a diferentes ramas en su ASR-enabled script IVR.Puede aprender más sobre los porcentajes de confianza en la página de Gestión del ASR.
  • Ajuste: El proceso de capturar datos sobre su sistema ASR. El informe de ajuste del ASR proporciona información que puede utilizar para mejorar y enriquecer sus archivos de gramática. Esto ayuda a mejorar la precisión del sistema. Puede aprender más sobre ajustes en la página de Gestión del ASR.

Acciones de ASR

Studio tiene varias acciones del ASR para su uso con los scripts del IVRCerrado Menú telefónico automatizado que permite a las personas que llaman interactuar a través de comandos de voz, entradas de teclas o ambos, para obtener información, enrutar una llamada de voz entrante o ambos. . Hay dos acciones generales y otras que están diseñadas para tipos específicos de mensajes. Además, hay dos acciones de ASR que le permiten crear archivos de gramática personalizados.

A excepción de las acciones que crean archivos de gramática, todas las acciones del ASR le permiten:

Las acciones del ASR en Studio son:

  • : Una acción ASR general que acepte cualquier tipo de expresión y que la interprete basándose en una lista personalizada de frases o archivo de gramática que usted proporcione. Esta acción ofrece una gran flexibilidad, pero también es más complicado de configurar.
  • : Acepta una expresión que sea una combinación de letras, números o ambos, como una contraseña o una dirección de correo electrónico. Esta acción viene con un archivo de gramática.
  • : Acepta la expresión de un valor monetario, por ejemplo, un importe de pago. Esta acción viene incorporada con un archivo de gramática para una o más monedas, según el paquete de idiomas de Nuance para su tenant.
  • : Acepta una variedad de expresiones relacionadas con fechas, según su archivo incorporado de gramática. Esto incluye fechas completas, días de la semana y referencias de fechas correspondientes como yesterday.
  • : Acepta la expresión de una cadena de dígitos, como un número de teléfono o un número de ID. Esta acción viene con un archivo de gramática.
  • : Una acción general que acepta expresiones que usted defina para crear un menú habilitado por la voz. Esta acción puede usar una lista de frases personalizada o un archivo de gramática. Puede usar las variables de rama que cree para el menú en sí como base para interpretar la expresión de la persona que llama.
  • : Acepta una expresión de valores numéricos. Por ejemplo, una expresión de "cinco seis" sería interpretada por esta acción como "cincuenta y seis". Use la acción Asrdigits si desea que se interprete un enunciado como una cadena de dígitos separados, como "cinco" y "seis". Esta acción viene con un archivo de gramática.
  • : Acepta una variedad de expresiones relacionadas a horas, según su archivo incorporado de gramática. Esto incluye las duraciones (como "doce horas"), además de tiempos específicos (tales como "tres p m").
  • : Acepta expresiones positivas o negativas basadas en su archivo incorporado de gramática. Por ejemplo, existen múltiples variaciones sobre la manera en que un contacto puede decir "sí" (sí, así es, correcto, de acuerdo, está bien, etc.). Esta acción se reconoce este tipo de variaciones.

Varias de las acciones del ASR ofrecen una opción entre entradas de habla y DTMFCerrado Tonos de señalización que se generan cuando un usuario presiona o toca una tecla en el teclado de su teléfono.. En algunos casos, el DTMF puede proporcionar una mejor experiencia de llamada. Por ejemplo, ingresar un número de seguro social puede ser tan fácil como decirlo y puede ser más fácil de interpretar para el sistema.

Acciones para crear archivos de gramática personalizados

Hay dos acciones en Studio que usted puede usar para crear un archivo de gramática personalizado a partir de una base de datos existente. Esto es útil si su IVR necesita pedir a los contactos el nombre de un empleado de su organización o el número de pieza de un producto en el catálogo de su organización. Puede usar las bases de datos que ya tiene para crear archivos de gramática que se usen en su IVR.

Las acciones Studio que usted puede usar para crear archivos de gramática personalizados son:

  • : Que se utiliza para compilar archivos de gramática personalizados en formato GRAM que emplea el motor del ASR de Nuance. Esta acción se utiliza en scripts que se ejecutan una vez o, a lo sumo, en forma ocasional. Se puede usar el script para procesar archivos existentes GRXML o junto con Asrsql para crear un nuevo archivo de gramática personalizado.
  • : Trabaja con el Connector DB para extraer un archivo de valores a partir de una base de datos existente. Este archivo puede ser formateada y compilado en un archivo de gramática para su ASR-enabled IVR. DB Connector es un servicio que actúa como puerta de enlace entre CXone y una base de datos.

Al actualizar el archivo de gramática, renombrar el archivo antes de usarlo en los scripts de producción. Esto ayuda a evitar conflictos durante el proceso de actualización. También deja al archivo original como respaldo en caso de que necesite regresar a él por algún motivo. También puede usar la sustitución de variables al especificar el nombre del archivo de gramática en las acciones ASR en sus scripts.

Localización y ASR

Varían los idiomas disponibles para el reconocimiento de voz dependiendo del lugar donde se encuentre su tenant. Puede configurar el idioma con la acción Studio en su script. Pregunte a su Representante de cuenta CXone para más información.

Si su organización planea usar ASR para admitir más de un idioma, tenga en cuenta lo siguiente:

  • A lo largo del análisis, "inglés" está codificado de forma rígida.

  • Al analizar el dinero, solo se admite "$".

  • Al analizar el dinero, '.' siempre se usa para verificar valores fraccionarios. ',' no es apoyado.

  • Al pronunciar dinero, "dólares" y "centavos" están codificados.

  • Al pronunciar números, "negativo" está codificado.

  • Al pronunciar números, "punto" está codificado de forma rígida.

  • ReadString no está localizado (lee palabras English).

Datos clave sobre el ASR en CXone

Cuando desarrolle scripts de IVRCerrado Menú telefónico automatizado que permite a las personas que llaman interactuar a través de comandos de voz, entradas de teclas o ambos, para obtener información, enrutar una llamada de voz entrante o ambos. con función de ASR, tenga en cuenta lo siguiente:

  • Los archivos de gramatica se deben usar para la mayoria de las acciones Studio ASR.
  • Puede ajustar las configuraciones del ASR para cada script (o aun antes/después de las acciones individuales del ASR) configurando una nuanceTuningParamsJson variable con una acción Snippet.
  • Los scripts deben incluir enrutamiento en caso de que haya una falla en la funcionalidad del ASR. Por ejemplo, en caso de falla, antes de finalizar la interacción, puede hacer que la secuencia de comandos vuelva al modo de solo DTMF. También puede hacer que el script reproduzca un mensaje donde se informe al contacto del problema.
  • El grupo de Servicios Profesionales de NICE CXone puede ayudarlo a desarrollar scripts de IVR con función para el ASR y sus componentes. Pueden ayudar con cosas como la creación de archivos de gramática personalizados que se generen a partir de su base de datos existente. Póngase en contacto con su Representante de cuenta CXone para obtener más información sobre este servicio.
  • Para garantizar una alta disponibilidad de los archivos de gramática y reducir la posibilidad de que se produzcan problemas de tiempo límite de ASR:

    • Los archivos de gramática de gran tamaño se almacenan en caché de forma proactiva.
    • Los archivos de gramática se replican en todos los servidores ASR cuando se compilan.