CXone Mpower Transcription

CXone Mpower Transcription ist eine native Option für die Transkription. Es wandelt gesprochene Wörter in Text um und verfügt über zwei Modi:

Echtzeit-Transkription: Bietet Transkription in Echtzeit während der Interaktion. Dies wird bei Anwendungen wie AutoSummary und CXone Mpower Agent Anwendungen verwendet. Setup ist erforderlich, um diesen Modus zu verwenden. Darüber hinaus unterstützt dieser Modus Vokabularanpassungen.
Transkription nach dem Anruf: Erstellt am Ende einer Interaktion ein vollständiges Transkript. Interaction Analytics verwendet diesen Modus. Für die Aktivierung der Transkription nach dem Anruf ist keine Konfiguration erforderlich, eine Anpassung des Vokabulars wird jedoch nicht unterstützt. Diese Funktion ist Teil eines Programms zur kontrollierten Freigabe. Kontaktieren Sie Ihren Kundenbetreuer, wenn Sie mehr darüber erfahren möchten.

Beide Modi von Transcription bieten folgende Vorteile:

Die aktuelle Version von Transcription ist v11. Bei der Verarbeitung gesprochener Audiodaten wird ein KI-gesteuertes großes Sprachmodell (LLM) verwendet. Dadurch kann es eine höhere Ausgabequalität als frühere Versionen von Transcription erzeugen. Es bietet eine verbesserte Entitätserkennung, niedrigere Wortfehlerraten und eine bessere Lesbarkeit.
Transcription liefert nichtdeterministische Ergebnisse. Dies bedeutet, dass es zu Unterschieden im Ergebnis kommen kann, wenn die Transcription-Engine dasselbe Audio mehrmals verarbeitet. Dies ist ein zu erwartendes Verhalten für LLM-Modelle.
Die Transcription-Engine entfernt Wörter und Laute, die beim Sprechen geäußert werden und nicht zur Bedeutung beitragen. Dies umfasst um, uh, wiederholte Wörter und so weiter. Diese unproduktiven Wörter und Laute erschweren das Lesen der Transkripte. Durch das Entfernen der Transkripte wird die Benutzerfreundlichkeit verbessert, da diese dadurch besser lesbar werden.
Gesprächspartner können in einer einzigen Interaktion oder sogar im selben Satz mehr als eine Sprache sprechen. Transcription unterstützt diesen Code-Switching, solange es unterstützt beide Sprachen. Wird während der Interaktion eine nicht unterstützte Sprache gesprochen, wird diese nicht transkribiert.
Transcription liefert Daten über Offsets. Der Offset ist ein Maß dafür, wann ein bestimmtes Wort oder eine bestimmte Phrase im Verhältnis zum Beginn der Audioaufnahme gesprochen wird. Transcription misst Abweichungen auf Wortebene und auf Äußerungsebene. Eine Äußerung ist das, was der Sprecher während eines Redebeitrags sagt.

Sie können auf Continuous Stream Transcription Transkripte mit der Analysed Transcript API Symbol eines Quadrats mit einem Pfeil, der von der Mitte durch die obere rechte Ecke zeigt. zugreifen.

Transkription nach dem Anruf

Der Inhalt dieses Abschnitts bezieht sich auf ein Produkt oder eine Funktion in kontrollierter Freigabe (CR). Wenn Sie nicht Teil der CR-Gruppe sind und weitere Informationen wünschen, wenden Sie sich an Ihren Kundenbetreuer.

Die Transkription nach dem Anruf ermöglicht eine hochpräzise Sprache-zu-Text Dieses Verfahren, auch STT genannt, wandelt gesprochene Sprache in Text um.-Transkription nach Beendigung eines Anrufs. Das Transkript enthält sowohl die Agenten- als auch die Kontaktseite des Gesprächs. Agenten können diese Transkripte in Agentenanwendung verwenden, um Details aus früheren Anrufen zu bestätigen. Vorgesetzte können sie für Schulungen und Qualitätskontrollen nutzen.

Die Transkription nach dem Anruf verwendet Transcription v11. Dies ist die neueste und präziseste Engine, die in CXone Mpower verfügbar ist. Es wird angetrieben von CXone Mpower Transcription. CXone Mpower unterstützt keine Transkriptionsdienste von Drittanbietern für die Transkription nach dem Anruf.

Die folgende Tabelle fasst die Unterschiede zwischen dem Echtzeit- und dem Nachbearbeitungsmodus von Transcription zusammen:

Echtzeit-Transkription	Transkription nach dem Anruf
Unterstützt Konfidenzwerte auf Wortebene und Äußerungsebene Was ein Kontakt sagt oder tippt., wenn es CXone Mpower Transcription verwendet.	Unterstützt Konfidenzwerte auf Wortebene und Äußerungsebene Was ein Kontakt sagt oder tippt..
Unterstützt alle für CXone Mpower Transcription verfügbaren Sprachen.	Unterstützt alle für CXone Mpower Transcription verfügbaren Sprachen.
Unterstützt custom vocabulary tuning.	Die Anpassung benutzerdefinierter Vokabulare wird derzeit nicht unterstützt.
Allgemein verfügbar.	In kontrollierter Freigabe für Interaction Analytics Benutzer. Wenden Sie sich für weitere Informationen an Ihren Kundenbetreuer.

Ihre Kundenbetreuer muss die Transkription nach dem Anruf für Sie aktivieren.

Konfidenzwerte

Transcription liefert Konfidenzwerte auf Äußerungs- Was ein Kontakt sagt oder tippt. und Wortebene. Der Konfidenzwert gibt an, wie sicher sich die Transkriptions-Engine bei der Gesamttranskription dessen ist, was der Kontakt Die Person, die mit einem Agenten, IVR oder Bot in Ihrem Contact Center interagiert. oder Agent gesagt hat. Die Konfidenzwerte sind in den Transkriptionsdaten verfügbar, aber für die Benutzer nur dann sichtbar, wenn die Anwendungen, die die Transkripte verwenden, die Werte anzeigen können.

Die Konfidenzwerte für Transcription:

Es handelt sich um eine Ordinalskala, bei der ein höherer Wert lediglich ein höheres Maß an Vertrauen anzeigt. Ein Wert von 0,4 bedeutet nicht, dass das Konfidenzniveau doppelt so hoch ist wie bei einem Wert von 0,2.
Kann nicht zur Bestimmung der Genauigkeit des Transkriptionssystems verwendet werden. Ein Transkript mit einem generell niedrigen Konfidenzwert impliziert nicht zwangsläufig eine hohe Fehlerquote bei den Wörtern.
Kann nicht zum Filtern oder Schwellenwertsetzen eines Transkripts verwendet werden. Das Entfernen von Transkripten mit niedrigen Konfidenzwerten macht sie nicht genauer.

Benutzerdefinierte Vokabelanpassung

Transcription verwendet ein ASR Automatic Speech Recognition (automatische Spracherkennung). Ermöglicht es Kontakten, auf Aufforderungen durch Sprechen zu reagieren, Telefontasten zu drücken oder beides.-Modell, das mit großen Datensätzen trainiert wurde. Die zum Trainieren des Modells verwendeten Gespräche erstrecken sich über ein breites Spektrum an Branchen. Allerdings verwendet jede Organisation Wörter, die einzigartig sind oder in einzigartigen Kontexten verwendet werden. Dies kann die Genauigkeit der Transkriptionsergebnisse beeinträchtigen.

Sie können das Modell, das Transcription verwendet, anpassen. Dies ermöglicht es Ihnen, das Modell so anzupassen, dass es Fachbegriffe erkennt, die für Ihre Organisation spezifisch sind oder einen besonderen Kontext in Ihrer Branche haben.

Die Anpassung des benutzerdefinierten Vokabulars wird in Interaction Analytics konfiguriert, erfordert jedoch keine Lizenz dafür Anwendung. Sie benötigen lediglich eine Lizenz für die individuelle Vokabelanpassung.

Eine individuelle Vokabelanpassung ist für alle Sprachen verfügbar, die Transcription unterstützt. Für nach dem Anruf transkribiert wird dies derzeit nicht unterstützt.

Unterstützte Sprachen

Transcription ist darauf trainiert, viele Dialekte innerhalb jeder der unterstützten Sprachen zu verarbeiten. Die Transkription jedes Gesprächs zielt auf einen einzelnen Dialekt ab, kann aber Aspekte mehrerer Dialekte enthalten.

Transcription unterstützt die folgenden Sprachen:

Dutch
English
Französisch
Deutsch
Italian
Portugiesisch
Japanese
Spanisch
Walisisch