トランスクリプションとTTS

contactsアプリケーションとのインタラクションからのテキストを操作するで使用されるCXone MpowerAIベースの。 音声チャネルでのインタラクションの音声は、AIアプリケーションが操作できるようにテキストに変換する必要があります。 テキストを分析した後、AIアプリケーションは、提供するように設計された応答を提供できます。 これは、音声テキスト化(STT)とも呼ばれるトランスクリプションクローズ済 音声またはデジタルインタラクションの全体または一部を文字化したもの。サービスを使用して行われます。

AIアプリケーションの応答はテキスト形式で提供されます。 ただし、バーチャルエージェントは、このテキストをコンタクトが再生できる音声に変換する必要があります。 これにより、バーチャルエージェントはコンタクトと「話す」ことができます。 この変換は、テキスト読み上げクローズ済 ユーザーが録音プロンプトをテキストとして入力し、コンピューターで生成された音声を使用してその内容を読み上げる機能。 (TTS) サービスを使用して行われます。

CXone MpowerでトランスクリプションとTTSを使用するには、カスタムStudioスクリプティングが必要です。 このスクリプトは、インタラクション音声のキャプチャを管理し、トランスクリプションサービスと宛先アプリケーションに送信します。 また、このスクリプトは、必要に応じてSTTサービスへの送信など、アプリケーションの応答を管理します。 必要なスクリプトは、ユースケースによって異なります。 これは、各バーチャルエージェントまたはエージェントアシスト統合を設定するためのオンラインヘルプで説明されています。

トランスクリプション

文字起こしサービスは、音声をテキストに変換し、話し言葉の書き言葉バージョンを作成します。 彼らはAIを使用して、音声を人間の言語として正確に解釈します。 音声パターン、アクセント、背景ノイズによって音声の聞こえ方に違いが生じる場合、AIはトランスクリプションの精度を高めます。 また、自然言語理解クローズ済 このプロセスは自然言語処理(NLP)を拡張し、理解した内容に基づいて判断またはアクションを実行します。(NLU)を適用することで、音声が不明瞭な場合や、単語が似ている場合に、スピーカーがどの単語を使用したかに関する意思決定を改善します。

CXone Mpowerでは、ASRクローズ済 自動音声認識(ASR)。 コンタクトが音声で話すか、電話のキーを押すか、またはその両方でプロンプトに応答できるようにする機能。 メニューやエージェント支援アプリケーションおよび仮想エージェントとの統合に文字起こしが使用され、連絡先の音声が AI エンジンで分析できるテキストに変換されます。 結果として得られたトランスクリプトは、アプリケーション 内のさまざまな プラットフォームによって使用されます。

CXone Mpower は転写の 2 つのオプションをサポートしています。

  • 1つ目はTurn-by-Turn Transcriptionです。 このオプションは、インタラクション中の発話による文字起こし発話クローズ済 コンタクトが発言または入力すること。を提供します。 音声はテキストに文字起こしされ、AIベースのアプリケーションに送信されます。 バーチャルエージェント統合では、このタイプのトランスクリプションを使用します。 さらに、一部のバーチャルエージェントプロバイダーは、代わりに使用できるトランスクリプションサービスを提供しています。 プロバイダーのトランスクリプションサービスを使用すると、インタラクション音声がプロバイダーに送信され、テキストに変換されます。
  • 2番目の文字起こしオプションはContinuous Stream Transcriptionです。 このオプションは、小さなセグメントで文字起こしの連続ストリームを送信します。 AIアプリケーションは、書き起こされたテキストをリアルタイムで受信し、現在の会話に関連する適切な応答を提供できます。 エージェントアシストアプリケーションは、このタイプのトランスクリプションサービスを使用します。

どちらのオプションも、サードパーティのトランスクリプションサービスをサポートしています。 CXone Mpowerは、CXone Mpower Transcriptionと呼ばれるネイティブの連続ストリーム文字起こしサービスも提供しています。

文字起こしは、音声テキスト変換 (STT) と呼ばれることもあります。

TTS

テキスト読み上げ(Text-to-Speech)は、書かれた言葉をコンピューターで生成された音声の形式で音声に変換します。 AIは、自然なイントネーション、ストレス、ペーシング、発音を再現することで、コンピューターで生成された出力をより人間的に聞こえさせるのに役立ちます。  CXone Mpowerでは、TTSはIVRクローズ済 音声応答システム(IVR)。 音声またはキー入力を使用して情報を取得したり、着信音声通話を振り分けたりする自動化された電話メニュー。メニューとバーチャルエージェントクローズ済 ライブの人間のエージェントの代わりに顧客とのやり取りを処理するソフトウェアアプリケーション。統合で使用されます。

TTSの場合、サードパーティのTTSサービスまたはネイティブのTTSサービスを使用できます。