CXone Mpower Transcription

CXone Mpower Transcription es una opción nativa para la transcripción. Convierte palabras habladas en texto y tiene dos modos:

Transcripción en tiempo real: Proporciona transcripción en tiempo real a medida que ocurre la interacción. Esto se utiliza con aplicaciones como AutoSummary y CXone Mpower Agent aplicaciones. Se requiereconfiguración para utilizar este modo. Además, este modo admite personalizaciones de vocabulario.
Transcripción posterior a la llamada: Proporciona una transcripción completa al final de una interacción. Interaction Analytics utiliza este modo. No se requiere configuración para habilitar la transcripción posterior a la llamada y no se admite la personalización de vocabulario. Esta característica es parte de un programa de versión controlada. Póngase en contacto con su Representante de cuenta si desea más información.

Ambos modos de Transcription proporcionan los siguientes beneficios:

La versión actual de Transcription es v11. Utiliza un Modelo lingüístico (LLM) impulsado por IA al procesar audio hablado. Esto le permite producir resultados de mayor calidad que las versiones anteriores de Transcription. Ha mejorado el reconocimiento de entidades, reducido los índices de error de palabras y facilita la legibilidad.
Transcription produce resultados no deterministas. Esto significa que puede haber diferencias en la salida cuando el motor Transcription procesa el mismo audio varias veces. Este es el comportamiento esperado para los modelos LLM.
El motor Transcription elimina palabras y sonidos pronunciados al hablar que no contribuyen al significado. Esto incluye um, uh, palabras repetidas, etc. Estas palabras y sonidos improductivos hacen que las transcripciones sean difíciles de leer. Eliminarlos mejora la experiencia del usuario al hacer que las transcripciones sean más legibles.
Los contactos pueden hablar más de un idioma en una sola interacción o incluso en la misma frase. Transcription admite este cambio de código siempre que admita ambos idiomas. Si durante la interacción se habla un idioma no admitido, no se transcribe.
Transcription proporciona datos sobre las compensaciones. El desplazamiento es una medida de cuándo se pronuncia una palabra o frase específica en relación con el inicio del audio. Transcription mide las compensaciones a nivel de palabra y a nivel de enunciado. Un enunciado es lo que el hablante dice durante un turno de la conversación.

Puede acceder a las transcripciones Continuous Stream Transcription con la API de transcripciones analizadas Icono de un cuadrado con una flecha que apunta desde el centro hacia la esquina superior derecha. .

Transcripción posterior a la llamada

El contenido de esta sección es para un producto o característica con liberación controlada (CR). Si no forma parte del grupo CR y desea obtener más información, comuníquese con suRepresentante de cuenta.

La transcripción posterior a la llamada proporciona una transcripción de voz a texto También llamado STT, este proceso convierte el lenguaje hablado en texto. de alta precisión una vez finalizada la llamada. La transcripción incluye tanto el lado del agente como el del contacto La persona que interactúa con un agente, IVR o bot en su centro de contacto. de la llamada. Los agentes pueden usar estas transcripciones en La aplicación agente para confirmar detalles de llamadas anteriores. Los supervisores pueden utilizarlos para formación y controles de calidad.

La transcripción posterior a la llamada utiliza Transcription v11. Este es el motor más nuevo y preciso disponible en CXone Mpower. Está impulsado por CXone Mpower Transcription. CXone Mpower no admite servicios de transcripción de terceros para la transcripción posterior a la llamada.

La siguiente tabla resume las diferencias entre los modos de tiempo real y posterior a la llamada de Transcription:

Transcripción en tiempo real	Transcripción posterior a la llamada
Admite puntuaciones de confianza a nivel de palabra y de enunciado Lo que dice o escribe un contacto.cuando utiliza .CXone MpowerTranscription	Admite puntuaciones de confianza a nivel de palabra y de enunciado Lo que dice o escribe un contacto.puntuaciones de confianza.
Admite todos los idiomas disponibles para CXone Mpower Transcription.	Admite todos los idiomas disponibles para CXone Mpower Transcription.
Admite ajustes de vocabulario personalizados.	Actualmente no es compatible con el ajuste de vocabulario personalizado.
Generalmente disponible.	En liberación controlada para Interaction Analytics usuarios. Póngase en contacto con suRepresentante de cuenta para más información.

Su Representante de cuenta debe habilitar la transcripción posterior a la llamada para usted.

Puntuaciones de confianza

Transcription proporciona puntuaciones de confianza a nivel de enunciado Lo que dice o escribe un contacto. y de palabra. La puntuación de confianza indica qué tan seguro está el motor de transcripción en su transcripción general de lo que dijo el contacto La persona que interactúa con un agente, IVR o bot en su centro de contacto. o agente. Los puntajes de confianza están disponibles en los datos de transcripción, pero solo son visibles para los usuarios si las aplicaciones que usan las transcripciones pueden mostrar los puntajes.

Las puntuaciones de confianza para Transcription:

Son ordinales, donde una puntuación mayor solo indica un mayor nivel de confianza. Una puntuación de 0,4 no implica que el nivel de confianza sea el doble que una puntuación de 0,2.
No se puede utilizar para determinar la precisión del sistema de transcripción. Una transcripción con un puntaje de confianza generalmente bajo no implica una alta tasa de error de palabras.
No se puede utilizar para filtrar o establecer un umbral para una transcripción. Eliminar puntuaciones de confianza bajas de una transcripción no la hará más precisa.

Ajuste de vocabulario personalizado

Transcription utiliza un modelo ASR Reconocimiento automático de voz. Permite a los contactos responder a las indicaciones hablando, presionando las teclas del teléfono o ambos. que ha sido entrenado en grandes conjuntos de datos. Las conversaciones utilizadas para entrenar el modelo abarcan una amplia gama de industrias. Sin embargo, cada organización utiliza palabras que son únicas o que se utilizan en contextos únicos. Esto puede afectar la precisión de los resultados de la transcripción.

Puedes ajustar el modelo que Transcription utiliza. Esto le permite ajustar el modelo para que reconozca la terminología que es exclusiva de su organización o que tiene un contexto único en su línea de negocio.

El ajuste de vocabulario personalizado está configurado en Interaction Analytics, pero no requiere una licencia para ese aplicación. Solo necesitas tener una licencia para personalizar el vocabulario.

El ajuste de vocabulario personalizado está disponible para todos los idiomas que Transcription admite. Actualmente no se admite la transcripción posterior a la llamada.

Idiomas compatibles

Transcription está entrenado para manejar muchos dialectos dentro de cada uno de los idiomas admitidos. El resultado transcrito de cada conversación se dirige a un solo dialecto, pero puede incluir aspectos de más de un dialecto.

Transcription admite los siguientes idiomas:

Dutch
English
Francés
Alemán
Italian
Portugués
Japanese
Español
Galés