转录和 TTS

中使用的基于 应用程序AI 的CXone Mpower处理与联系人关闭 与联络中心的坐席、IVR 或机器人交互的人员。交互中的文本。 语音通道上交互的音频必须转换为文本,以便 AI 应用程序可以使用它。 分析文本后,AI应用程序 可以提供他们旨在给出的响应。 这是使用 transcription关闭 语音或数字交互的全部或部分文字记录。 服务(也称为语音转文本 (STT))完成的。

AI 应用程序的响应以文本格式提供。 但是,虚拟代理需要将此文本转换为可为联系人播放的音频。 这允许虚拟代理与联系人“交谈”。 此转换是使用 文本到语音转换关闭 允许用户将录制的提示作为文本输入,并使用计算机生成的语音来朗读内容。 (TTS) 服务完成的。

CXone Mpower 中使用转录和 TTS 需要自定义 Studio 脚本。 该脚本管理交互音频的捕获,并将其发送到转录服务和目标应用。 该脚本还管理应用程序的响应,包括在需要时将它们发送到 STT 服务。 所需的脚本因使用案例而异。 在线帮助中介绍了如何设置每个虚拟代理或 Agent Assist 集成。

转录

转录服务将音频转换为文本,创建口语的书面版本。 他们使用 AI 将音频准确地解释为人类语言。 当语音模式、口音和背景噪音造成音频听起来的方式差异时,AI 有助于提高转录的准确性。 它还可以通过应用自然语言理解关闭 该流程扩展了自然语言处理 (NLP),以根据它所理解的内容做出决定或采取行动。 (NLU) 来改进在音频模糊或单词发音相似的情况下使用哪个单词的决策。

CXone Mpower中,转录用于ASR关闭 自动语音识别。 允许联系人通过语音、按键或两者结合的方式响应提示。菜单以及与代理辅助应用程序和虚拟代理的集成,将联系人的语音转换为文本,供人工智能引擎分析。 由此产生的转录本被应用程序中的各种平台使用。

CXone Mpower 支持两种转录选项:

  • 首先是 Turn-by-Turn Transcription。 此选项在交互期间按话语提供听录 utterance关闭 联系人所说或输入的内容。。 音频被转录为文本,然后发送到基于 AI 的应用程序。 虚拟代理集成使用这种类型的转录。 此外,一些虚拟代理提供商提供您可以改用的转录服务。 当您使用提供商的转录服务时,交互音频将发送到提供商,然后转换为文本。
  • 第二个转录选项是 Continuous Stream Transcription。 此选项以小分段的形式发送连续的转录流。 AI 应用程序实时接收转录的文本,并能够提供与当前对话相关的适当响应。 代理协助应用程序使用这种类型的转录服务。

这两个选项都支持第三方转录服务。 CXone Mpower还提供了一个名为 CXone Mpower Transcription的原生连续流转录服务。

转录有时被称为语音转文本(STT)。

TTS

文本到语音转换将书面文字转换为计算机生成语音形式的音频。 AI 通过再现自然的语调、重音、节奏和发音来帮助计算机生成的输出听起来更人性化。  在 CXone Mpower 中,TTS 用于 IVR关闭 交互式语音响应。 自动电话菜单,联系人可通过语音或按键输入获取信息、转接呼入语音呼叫,或同时实现这两种功能。 菜单和虚拟坐席关闭 代替现场人工坐席处理客户交互的软件应用程序。集成。

对于 TTS,您可以使用第三方 TTS 服务native TTS 服务。