自動語音識別 (ASR)

自動語音識別 (ASR) 功能允許聯絡人透過說話來回應 IVRClosed 自動電話菜單,允許呼叫者透過語音命令或按鍵輸入或二者進行互動,以獲取資訊、路由至呼入語音通話或二者兼有。 提示,可以代替按下電話上的按鍵或者作為按鍵的補充。CXone 利用業界領先的 Nuance ASR 引擎(版本 11)將 ASR 作為可選功能提供,從而提高系統的語音識別準確度,並允許您執行立體聲錄音。

ASR 用於簡化和加快呼叫者使用 IVR 的體驗。啟用了 ASR 的 IVR 不僅會識別字詞,還會識別短語,並將其與預先定義的值進行比對,然後相應地轉接或接聽來電。

術語

您應該要熟悉以下術語在 ASR 中的特定用法:

  • 話語 — 呼叫者在回應 IVR 提示時所說的字詞或短語。
  • 文法檔案 — 為 ASR 引擎提供了規則。其中包含預計呼叫者在回應提示時可能會說的字詞或短語,然後其會根據這些回應向變數指派內容。這會大幅提高識別效率和準確度。很多 ASR Studio動作都有內建的文法檔案。您還可以為某些動作使用自訂文法檔案或文法。文法檔案一般採用 XML 格式編寫,儲存為 .grxml 檔案。這些檔案應先進行編譯,然後才能在 CXone 系統中使用。
  • 短語清單 — 提供一個簡單的清單,其中包含預計呼叫者在回應提示時可能會說的短語清單,每行一條。短語清單一般使用 Studio 動作的 PhraseList 屬性。
  • 可信度 (%) — 也稱為識別率 (%)。當 ASR 引擎識別呼叫者所說的短語時,還將返回一個百分比,指示解析的可信度,或將話語與短語清單或文法檔案進行比對。可信度 (%) 可用於將通話來電路由至啟用了 ASR 的 IVR 指令碼中的不同分支。CXone 中使用的可信度:
    • — 可信度 (%) 較高;一般為 75% 或更高。可透過 OnHighConfidence 分支路由聯絡,不再進一步確認話語。
    • — 可信度 (%) 為中等;即介於中等和高之間。可透過 OnMedConfidence 分支路由聯絡,並要求確認話語。
    • — 可信度 (%) 在可接受的最低水平。此值一般用於設定 OnMedConfidence 分支的下限值。
    • 不可信 — 話語不可識別,ASR 引擎無法進行解析。可透過 OnNoConfidence 分支路由聯絡,並要求重複話語。

ASR 動作

對於生產性 IVR 指令碼,Studio 提供了七種用於特定提示的 ASR 動作和兩種通用動作。所有這些動作都允許您捕捉和解析話語、根據話語填入變數,然後根據變數值、可信度 (%) 或二者路由聯絡。為每個提示選擇最佳動作將有助於指令碼更有效地處理語音。若要檢視 Studio 中的 ASR 動作,必須在您的角色中啟用 ASR。以下是每個 ASR 動作的清單:

  • Asr — 接受任何類型的話語,並將根據您提供的自訂短語清單或文法檔案進行解析。此動作提供了很大的靈活性,但設定起來也更複雜。
  • Asralphanum — 接受字母、數字或二者組合而成的話語(例如密碼或電郵地址)。此動作隨內建文法檔案提供。
  • Asrcurrency — 接受表述貨幣值的話語(例如支付金額)。此動作隨內建文法檔案提供,適用於一種或多種貨幣,並且基於租戶的語言套件。
  • Asrdate — 接受各種與日期相關的話語,基於內建的文法檔案。這包括完整日期、星期、相對日期(例如昨天)等。
  • Asrdigits — 接受表述一串數字的話語(例如電話號碼或社保號碼)。此動作隨內建文法檔案提供。
  • Asrmenu — 接受您定義用於建立語音式選單的話語。此動作可使用自訂短語清單或語法檔案,或者您可以使用為選單建立的分支變數,作為解析呼叫者話語的基礎。
  • Asrnumber — 接受表述數字值的話語。例如,呼叫者說「56」將被此動作解析為「五十六」,但會被 Asrdigits 解析為 2 個單獨的數字「5」和「6」。此動作隨內建文法檔案提供。
  • Asrtime — 接受各種與時間相關的話語,基於內建的文法檔案。這包括持續時間(例如「十二小時」)和具體時間(例如「下午三點」)。
  • Asryesno — 根據內建的文法檔案接受表述肯定或否定的話語。例如,呼叫者表達「yes」的方式有很多(例如:是、對的、對、是的、好的)。此動作將識別這些變體。

Studio 還提供了兩個可用於從現有資料庫構建自動文法檔案的動作。例如,IVR 可能會問呼叫者零件號碼。或者,您可能想讓呼叫者透過提供員工姓名來選擇分機。每種情況下,您可能已經擁有一個資料庫,其中包含呼叫者可能會說的值,因此明智的做法是使用您已經擁有的資料建立自己的檔案。用於此目的的兩個動作為:

  • Asrcompile — 用於將自訂文法檔案編譯成 Nuance ASR 引擎所使用的 .gram 格式。此動作適用於執行一次或至多偶爾執行一次的指令碼。該指令碼可用於處理現有的 .grxml 檔案,或與 Asrsql 結合用於建立新的自訂文法檔案。
  • Asrsql — 與資料庫連接器功能結合用於從現有資料庫中獲取值檔案。該檔案隨後可進行格式化,並編譯成可供啟用了 ASR 的 IVR 使用的文法檔案。

最佳做法

在開發啟用了 ASR 的 IVR 指令碼時,謹記下列事項:

  • 熟悉 ASR 動作,以便能為每個提示選擇合適的動作。
  • 有一些動作會允許選擇語音和 DTMFClosed 使用者點擊或輕點電話鍵盤上的某個鍵而產生的訊號音。 輸入。在某些情況下,DTMF 可能會為呼叫者提供更好的體驗。例如,輸入社保號碼就像說出來一樣降低,可能也讓系統更容易解析。
  • 語音識別可用的語言因租戶所在位置而異,但可以使用 Voiceparams Studio 動作設定。更多資訊,請諮詢您的客戶經理。
  • 您還可以使用句段清單中的語音拼寫或文法檔案來提高準確度。如果提示可能引起經常發音錯誤的回應,這將特別有用。例如「fungi」(fungus 的複數)。除了輸入項目「fungi」以外,您還可以新增下列附加語音輸入項目:「fun guy」、「fun jee」或「fun gee」。由於文化方面的差異,語言和發音並不完全標準,因此,透過語音拼寫新增附加項目能夠提高準確度。這突顯出了解呼叫者以及調整或微調 IVR 的重要性。
  • 您可以對每個指令碼微調 ASR 設定(甚至在各 ASR 動作之前/或之後):透過 Snippet 動作設定 nuanceTuningParamsJson 變數
  • 指令碼應包括在 ASR 功能執行失敗時的路由,例如轉換到僅 DTMF 模式,或在結束互動之前播放提示失敗的訊息。
  • 您可以請專業人員來協助您開發啟用了 ASR 的 IVR 指令碼及其元件,例如從現有資料庫構建的自訂文法檔案。欲了解更多資訊,請聯絡您的客戶經理。

當地語系化和 ASR

如果組織計劃使用 ASR 來支援多種語言,請謹記以下事項:

  • 在整個解析過程中,「英文」採用硬式編碼。

  • 在解析貨幣值時,僅支援「$」。

  • 在解析貨幣值時,一律使用「.」來檢查分數值。不支援「,」。

  • 在表述貨幣值時,「美元」和「美分」均採用硬式編碼。

  • 在表述數字值中,「負數」採用硬式編碼。

  • 在表述數字值中,「點」採用硬式編碼。

  • ReadString 並不會當地語系化(讀出英文單字)。

ASR 和 TTS 支援的語言
美國地區(PCI、非 PCI 和 FedRAMP)
  • 巴西葡萄牙語
  • 加拿大法語
  • 英語:美國
  • 英語:英國
  • 法語
  • 德語
  • 義大利文
  • 西班牙文:歐洲
  • 西班牙文:美國
加拿大
  • 加拿大法語
  • 英語:美國
  • 英語:英國
  • 法語
  • 德語
  • 義大利文
  • 西班牙文:歐洲
  • 西班牙文:美國
歐洲(包括南非)
  • 阿拉伯
  • 荷蘭語:荷蘭和比利時
  • 英語:英國
  • 英語:美國
  • 法語
  • 德語
  • 義大利文
  • 葡萄牙文
  • 西班牙文:歐洲
  • 西班牙文:美國
英國 (UK)
  • 荷蘭語:荷蘭和比利時
  • 英語:英國
  • 英語:美國
  • 法語
  • 德語
  • 義大利文
  • 葡萄牙文
  • 西班牙文:歐洲
  • 西班牙文:美國
澳洲
  • 英語:澳洲
  • 英語:英國
  • 英語:美國
  • 法語
  • 德語
  • 義大利文
  • 西班牙文:歐洲
  • 西班牙文:美國
日本
  • 英語:美國
  • 日本人
  • 韓文
  • 國語