Transcrição e TTS
Os Aplicativos baseados em IA usados em CXone Mpower trabalham com texto de interações com contatos
A pessoa que interage com um agente, RVI ou bot em seu centro de contato.. O áudio das interações nos canais de voz deve ser convertido em texto para que o Aplicativos de IA possa trabalhar com ele. Depois de analisar o texto, osAplicativos de IA podem fornecer as respostas que foram projetados para dar. Isso é feito usando serviços de transcrição
Forma escrita de toda ou parte de uma interação de voz ou digital., também conhecidos como conversão de fala em texto (STT).
As respostas dos aplicativos de IA são fornecidas em formato de texto. No entanto, os agentes virtuais precisam converter esse texto em áudio que possa ser reproduzido para o contato. Isso permite que os agentes virtuais "falem" com os contatos. Essa conversão é feita usando serviços de conversão de texto em fala
Permite que os usuários insiram prompts gravados como texto e usem uma voz gerada por computador para falar o conteúdo. (TTS).
Trabalhar com transcrição e TTS em CXone Mpower requer scripts Studio personalizados. O script gerencia a captura do áudio de interação e o envia para o serviço de transcrição e para o aplicativode destino. O script também gerencia as respostas do aplicativo, incluindo enviá-las ao serviço STT, se necessário. O script necessário varia de acordo com o caso de uso. Ele é descrito na ajuda online para configurar cada agente virtual ou integração de assistência ao agente.
Transcrição
Os serviços de transcrição convertem áudio em texto, criando versões escritas da linguagem falada. Eles usam IA para interpretar com precisão o áudio como linguagem humana. A IA ajuda na precisão da transcrição quando padrões de fala, sotaques e ruído de fundo criam diferenças na forma como o áudio soa. Também ajuda aplicando Natural Idioma Understanding
Esse processo se expande no Processamento de Linguagem Natural (PLN) para tomar decisões ou agir com base no que ele entende. (NLU) para melhorar a tomada de decisão sobre qual palavra o falante usou nos casos em que o áudio é indistinto ou quando as palavras soam iguais.
Em CXone Mpower, a transcrição é usada para menus ASR
Reconhecimento automático de fala. Permite que os contatos respondam aos avisos falando, pressionando as teclas do telefone ou ambos. e integrações com aplicativos de assistência ao agente e agentes virtuais para converter a fala do contato em texto para análise por um mecanismo de IA. As transcrições resultantes são usadas por vários Aplicativos no plataforma.
CXone Mpower suporta duas opções de transcrição:
- O primeiro é Turn-by-Turn Transcription. Esta opção fornece transcrição enunciado
O que um contato diz ou digita. por enunciado durante uma interação. O áudio é transcrito em texto e enviado para o aplicativo baseado em IA. As integrações de agentes virtuais usam esse tipo de transcrição. Além disso, alguns provedores de agentes virtuais oferecem serviços de transcrição que você pode usar. Quando você usa o serviço de transcrição de um provedor, o áudio da interação é enviado ao provedor e convertido em texto. - A segunda opção de transcrição é Continuous Stream Transcription. Esta opção envia um fluxo contínuo de transcrição em pequenos segmentos. O aplicativo de IA recebe o texto transcrito em tempo real e é capaz de fornecer respostas apropriadas que são relevantes para a conversa atual. Os aplicativos de assistência ao agente usam esse tipo de serviço de transcrição.
Ambas as opções oferecem suporte a serviços de transcrição de terceiros. CXone Mpowertambém oferece um serviço nativo de transcrição de fluxo contínuo chamado CXone Mpower Transcription.
A transcrição às vezes é chamada de conversão de fala em texto (STT).
TTS
A conversão de texto em fala converte palavras escritas em áudio na forma de vozes geradas por computador. A IA ajuda a saída gerada por computador a soar mais humana, reproduzindo entonação, ênfase, ritmo e pronúncia de som natural. Além CXone Mpower, TTS é usado em menus RVI e integrações agente virtual
Um aplicativo de software que interage com os clientes no lugar de um agente humano ao vivo..
Para TTS, você pode usar serviços TTS de terceiros ou o serviço TTS nativo.