CXone Mpower Transcription

CXone Mpower Transcription は転写用のネイティブオプションです。話された言葉をテキストに変換します。2 つのモードがあります。

リアルタイム文字起こし: インタラクションが発生すると、リアルタイムで文字起こしが行われます。これは、AutoSummary や CXone Mpower エージェントアプリケーションなどのアプリケーションで使用されます。このモードを使用するにはセットアップが必要です。さらに、このモードでは語彙のカスタマイズがサポートされています。
通話後の文字起こし: 対話の終了時に完全な文字起こしを提供します。 Interaction Analyticsはこのモードを使用します。通話後の文字起こしを有効にするためにセットアップは必要ありません。また、語彙のカスタマイズはサポートされていません。この機能は、限定リリースプログラムの一部です。詳細については、担当のアカウント担当者に問い合わせてください。

Transcriptionの両方のモードには、次の利点があります。

Transcription の現在のバージョンは v11 です。音声を処理する際には、AI 主導の大規模言語モデル (LLM) を使用します。これにより、以前のバージョンのTranscriptionよりも高品質の出力を生成できます。エンティティ認識が向上し、単語エラー率が低下し、読みやすさが向上しました。
Transcriptionは、非決定論的な結果を生成します。つまり、Transcription エンジンが同じオーディオを複数回処理すると、出力に違いが生じる可能性があります。これは LLM モデルでは予想される動作です。
Transcriptionエンジンは、話しているときに発せられた意味に寄与しない単語や音を削除します。これには、「えーと」、「あのー」、繰り返される言葉などが含まれます。これらの非生産的な単語や音は、トランスクリプトを読みにくくします。これらを削除すると、トランスクリプトが読みやすくなるため、ユーザーエクスペリエンスが向上します。
コンタクトは、1回のインタラクションで複数の言語を話す場合もあれば、同じ文を話す場合もあります。 Transcription は、両方の言語をサポートしている限り、このコード切り替えをサポートします。対話中にサポートされていない言語が話された場合、文字起こしは行われません。
Transcription はオフセットに関するデータを提供します。オフセットは、オーディオの開始を基準として特定の単語またはフレーズがいつ話されたかを測定するものです。 Transcriptionは単語レベルと発話レベルでオフセットを測定します。発話とは、会話の中で話者が1回話す内容です。

Continuous Stream Transcription のトランスクリプトにアクセスできます。Analyzed Transcript API 中央から右上隅を通る矢印のポイントを持つ正方形のアイコン。を使用して、

通話後文字起こし

このセクションのコンテンツは、限定リリース(CR)の製品または機能用です。 CRグループに参加していない場合で、詳細情報を知りたい方は、アカウント担当者にお問い合わせください。

通話後の文字起こしでは、通話終了後に高精度の音声テキストこのプロセスはSTTとも呼ばれ、話し言葉をテキストに変換します。文字起こしが行われます。トランスクリプトには、通話のエージェント側と連絡先側コンタクトセンターでエージェント、IVR、またはボットとやり取りする人。の両方が含まれます。エージェントは、エージェントアプリケーションでこれらのトランスクリプトを使用して、過去の通話の詳細を確認できます。監督者はトレーニングや品質チェックにこれを使用できます。

通話後の文字起こしにはTranscription v11を使用します。これは CXone Mpowerで利用できる最新かつ最も正確なエンジンです。これは CXone Mpower Transcriptionによって駆動されています。 CXone Mpower は、通話後の文字起こしにサードパーティの文字起こしサービスをサポートしていません。

次の表は、Transcriptionのリアルタイムモードと通話後モードの違いをまとめたものです。

リアルタイム文字起こし	通話後文字起こし
を使用する場合、単語レベルと発話レベルの CXone Mpower信頼スコアTranscriptionがサポートされます。	単語レベルと発話レベルの信頼スコアをサポートします。
CXone Mpower Transcriptionで利用可能なすべての言語をサポートします。	CXone Mpower Transcriptionで利用可能なすべての言語をサポートします。
カスタム語彙調整をサポートします。	現在、カスタム語彙の調整はサポートされていません。
一般公開されています。	Interaction Analytics 人のユーザー向けに制御リリースされています。詳細はアカウント担当者にお問い合わせください。

アカウント担当者では通話後の文字起こしを有効にする必要があります。

信頼度スコア

Transcription は、発話コンタクトが発言または入力すること。および単語レベルで信頼スコアを提供します。信頼度スコアは、連絡先コンタクトセンターでエージェント、IVR、またはボットとやり取りする人。またはエージェントが言った内容の全体的な転写において、転写エンジンがどの程度確実であるかを示します。信頼度スコアはトランスクリプションデータで使用できますが、トランスクリプトを使用するアプリケーションがスコアを表示できる場合にのみユーザーに表示されます。

Transcriptionの信頼スコア:

順序付きで、スコアが高いほど信頼度が高いことを示します。スコアが .4 だからといって、信頼度がスコアが .2 の 2 倍であることを意味するわけではありません。
転写システムの精度を判断するために使用することはできません。一般的に信頼度スコアが低いトランスクリプトは、単語エラー率が高いことを意味するものではありません。
トランスクリプトをフィルタリングしたりしきい値を設定したりするために使用することはできません。トランスクリプトから低い信頼度スコアを削除しても、精度は上がりません。

カスタム語彙調整

Transcription は、大規模なデータセットでトレーニングされた ASR 自動音声認識(ASR)。コンタクトが音声で話すか、電話のキーを押すか、またはその両方でプロンプトに応答できるようにする機能。モデルを使用します。モデルのトレーニングに使用された会話は、幅広い業界に及びます。ただし、すべての組織が使用する固有の単語や、固有の文脈で使用される単語は異なります。これは、トランスクリプション結果の精度に影響する可能性があります。

が使用するモデルをチューニングモデルチューニングTranscriptionできます。これにより、組織に固有の用語や、基幹業務に固有のコンテキストを持つ用語を認識するようにモデルを調整できます。

カスタムボキャブラリーチューニングはInteraction Analyticsで構成されていますが、そのアプリケーションのライセンスは必要ありません。必要なのは、カスタムボキャブラリーチューニングのライセンスだけです。

カスタム語彙のチューニングは、Transcription サポートすべての言語で利用できます。現在、通話後の文字起こしにはサポートされていません。

サポートされている言語

Transcription は、サポートされている各言語内の多くの方言を処理できるようにトレーニングされています。各会話の転記された出力は単一の方言を対象としていますが、複数の方言の側面が含まれる場合があります。

Transcriptionは以下の言語をサポートしています：

Dutch
English
フランス語
ドイツ語
Italian
ポルトガル語
Japanese
スペイン語
ウェールズ語