自動音声認識(ASR)

このヘルプページの情報は、CXone StudioDesktop Studioの両方に適用されます。

自動音声認識(ASR)では、コンタクトが話すことでIVR閉じた 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。プロンプトに応答できるようにします。IVRスクリプトでは、ASRをDTMF閉じた ユーザーが電話のキーパッドのキーを押すかタップしたときに生成される信号音。ベースのメニューシステムの代わりに使用したり、またはそれに加えて使用したりできます。ASRでは、IVRでのコンタクトのエクスペリエンスを簡素化および高速化することができます。ASR対応のIVRは、単語とフレーズの両方を認識する必要があります。あらかじめ設定した値と照合し、それに応じて通話をルーティングしたり、応答したりできます。

CXoneでは、ASRはオプション機能です。Nuance ASRエンジンのバージョン11を使用してシステムの音声認識の精度を高めています。Nuance ASRエンジンはステレオ録音も可能です。

自動音声認識(およびNuance ASRエンジン)を理解しておくことは、効果的なASR対応のIVRシステムを作成するために重要です。このエンジンを使用するための完全なドキュメントは、Nuance社から入手できます。

ASRの用語

CXoneでASRを使用する前に、以下のASR関連の用語を理解しておく必要があります。

  • 発話IVR閉じた 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。プロンプトに応答してコンタクトが話す単語またはフレーズ。
  • 文法ファイル:ASRエンジンのルールを提供するファイル。プロンプトに応答してコンタクトが言うことが期待できる単語やフレーズをカバーし、それらの応答に基づいて変数にコンテンツを割り当てます。これにより、認識プロセスが効率的になり、精度が向上します。文法ファイル については、ASR管理のページで詳しく説明しています。
  • フレーズリスト:プロンプトに応答して発信者が言うと予想できる簡単なフレーズのリスト。リストの各フレーズは別々の行に指定する必要があります。1行につき1フレーズを入力します。フレーズリストは通常、ASRStudioアクションのPhraseListプロパティを使用して入力されます。
  • 信頼度:認識率とも呼ばれます。ASRエンジンは、発信者が話したフレーズを認識すると、発話とフレーズリストまたは文法ファイルとの一致結果についてどの程度自信があるかを示すパーセンテージを返します。信頼度のパーセンテージは、ASR対応のIVRスクリプトのさまざまなブランチにコールをルーティングするために使用できます。信頼度のパーセンテージについては、ASR管理のページで詳しく説明しています。
  • 調整:ASRシステムに関するデータを取得するプロセス。ASR調整レポートは、文法ファイルを改善するために使用できる情報を提供します。これはシステムの精度向上に役立ちます。調整については、ASR管理のページで詳しく説明しています。

ASRアクション

Studioには、IVR閉じた 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。スクリプトで使用するASRアクションがいくつかあります。2つの一般的なアクションと、特定のタイプのプロンプト用にデザインされたアクションが含まれています。さらに、カスタム文法ファイルを作成できる2つのASRアクションもあります。

文法ファイルを作成するアクションを除き、すべてのASRアクションで以下のことが行えます。

Studioには次のASRアクションがあります。

  • Asr:あらゆる種類の発話を受け入れ、提供したカスタムフレーズリストまたは文法ファイルに基づいてそれを解釈する一般的なASRアクション。このアクションはかなりの柔軟性を提供しますが、セットアップがさらに複雑です。
  • Asralphanum:文字、数字、またはその両方の組み合わせの発話(たとえば、パスワードやメールアドレス)を受け入れます。このアクションには、組み込みの文法ファイルが付属しています。
  • Asrcurrency:金額の発話(支払い金額など)を受け入れます。このアクションには、テナント閉じた テクニカルサポート、請求、およびCXone環境のグローバル設定の管理に使用される高レベルの組織グループの言語パックに基づいて、1つ以上の通貨用の組み込みの文法ファイルが付属しています。
  • Asrdate:組み込みの文法ファイルに基づいて、日付に関連するさまざまな発話を受け入れます。これには、完全な日付、曜日、相対的な日付参照(yesterdayなど)などが含まれます。
  • Asrdigits:数字列の発話(電話番号やID番号など)を受け入れます。このアクションには、組み込みの文法ファイルが付属しています。
  • Asrmenu:発話可能なメニューを作成するために定義した発話を受け付ける一般的なアクション。このアクションでは、カスタムフレーズリストまたは文法ファイルを使用できます。発信者の発話を解釈するための基礎として、メニュー自体に作成したブランチ変数を使用できます。
  • Asrnumber:数値の発声を受け入れます。たとえば、「five six」という発話は、この動作によって「56」と解釈されます。「5」と「6」というように、発話を別々の数字の列挙として解釈したい場合は、Asrdigitsアクションを使用してください。このアクションには、組み込みの文法ファイルが付属しています。
  • Asrtime:組み込みの文法ファイルに基づいて、時間に関連するさまざまな発話を受け入れます。これには、特定の時間(「午後3時」など)に加えて、期間(「12時間」など)が含まれます。
  • Asryesno:組み込みの文法ファイルに基づいて、ポジティブまたはネガティブな発話を受け入れます。たとえば、コンタクトが「はい」と言う方法には複数のバリエーションがあります(はい、はい、うん、うん、うん、大丈夫など)。このアクションは、そのようなバリエーションを認識します。

いくつかのASRアクションでは、音声入力とDTMF閉じた ユーザーが電話のキーパッドのキーを押すかタップしたときに生成される信号音。入力のどちらかを選択できます。場合によっては、DTMFがより優れた発信者エクスペリエンスを提供することがあります。たとえば、社会保障番号をキー入力することは、それを話すのと同じくらい簡単であり、システムが解釈しやすくなる場合があります。

カスタムの文法ファイルを作成するアクション

Studioには、既存のデータベースからカスタム文法ファイルを作成するためのアクションが2つあります。これは、IVRがコンタクトに組織の従業員名やカタログの製品番号を尋ねる必要がある場合に役立ちます。すでにお持ちのデータベースを使用して、IVRで使用する文法ファイルを作成できます。

カスタム文法ファイルの作成に使用できるStudioアクションは以下のとおりです。

  • Asrcompile:カスタム文法ファイルをNuance ASRエンジンで使用されるGRAM形式にコンパイルするために使用されます。このアクションは、1回または多くても時々実行されるスクリプトで使用されます。このスクリプトを使用して、既存のGRXMLファイルを処理するか、またはAsrsqlと組み合わせて新しいカスタム文法ファイルを作成できます。
  • AsrsqlDBコネクターと連携して、既存のデータベースから値のファイルをプルします。次に、このファイルをフォーマットして、ASR対応IVRの文法ファイルにコンパイルできます。DBコネクターは、CXoneとデータベース間のゲートウェイとして機能するサービスです。

文法ファイルを更新する場合は、本番稼働のスクリプトで使用する前にファイル名を変更してください。これにより、更新プロセス中の競合を避けることができます。また、何らかの理由で元に戻す必要がある場合に備えて、元のファイルをバックアップとして残しておくことができます。スクリプトのASRアクションで文法ファイル名を指定する際に、変数置換を使用できます。

ローカライゼーションとASR

音声認識で使用できる言語は、テナント閉じた テクニカルサポート、請求、およびCXone環境のグローバル設定の管理に使用される高レベルの組織グループが置かれている場所によって異なります。スクリプトのVoiceparamsStudioアクションで言語を設定できます。詳細についてはCXoneアカウント担当者にお尋ねください。

組織がASRを使用して複数の言語をサポートすることを計画している場合は、次の点に注意してください。

  • 解析全体を通して、「英語」はハードコーディングされています。

  • お金の解析では、「$」のみがサポートされます。

  • お金を解析する際に、「。」小数値をチェックするために常に使用されます。'、'はサポートされていません。

  • お金の発音では、「ドル」と「セント」がハードコーディングされています。

  • 数字の発音では、「負」はハードコーディングされています。

  • 数字の発音では、「ポイント」はハードコーディングされています。

  • Englishはローカライズされていません(ReadStringの単語を読み取ります)。

CXoneのASRについての重要情報

ASR対応のIVR閉じた 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。スクリプトを開発する時は、次の点に注意してください。

  • 文法ファイルは、ほとんどのASRStudioアクションに使用する必要があります。
  • アクションでnuanceTuningParamsJson変数を設定Snippetすることで、各スクリプト(または個々のASRアクションの前後でも)のASR設定を微調整できます。
  • スクリプトには、ASR機能に障害が発生した場合のルーティングを含める必要があります。たとえば、障害が発生した場合、インタラクションを終了する前に、スクリプトをDTMF専用モードに戻すことができます。また、スクリプトで問題をコンタクトに知らせるメッセージを再生させることもできます。
  • NICE CXoneプロフェッショナルサービスグループでは、ASR対応IVRスクリプトとそのコンポーネントの開発をお手伝いしています。既存のデータベースからカスタム文法ファイルを作成する場合などに支援を得ることができます。このサービスの詳細については、CXoneアカウント担当者にお問い合わせください。