Speaker Recognitionとは?概要やメリットを解説
Speaker Recognitionの概要
Speaker Recognitionとは、音声生物測定学を利用することによって話者を認証して識別するSpeechサービス機能です。「話しているのは誰か」といった問いに回答するのが大きな目的です。
一人の話者のデータを登録することにより、プロファイルが作成されます。次にオーディオサンプルとこのプロファイルを確認し、同一であるか(話者認証)が行われます。
さらにグループに対しても任意のプロファイルと一致するかの確認(話者識別)を行います。
検証プロセスを合理化することにより、スムーズかつ安全なカスタマーエクスペリエンスを提供します。
音声データは、エンタープライズグレードのセキュリティやコンプライアンスにより守られています。
Speaker Recognitionのメリット
Speaker Recognitionには、以下のようなメリットがあります。
- 2種類の検証
- 言語
2種類の検証
話者認証を行う際、テキストに依存する方法と依存しない方法があります。依存する場合は登録フェーズと検証フェーズにおいて、パスフレーズは話者が選択することになります。テキストを保存しない検証では、日常的な言語を利用することができることになります。
言語
サポートされている言語は、英語、フランス語、スペイン語、中国語、ドイツ語、イタリア語、日本語、ポルトガル語です。
参考資料
https://azure.microsoft.com/ja-jp/services/cognitive-services/speaker-recognition/