【AWS re:Invent 2017】新サービス「Amazon Transcribe」が発表!

この記事は公開されてから半年以上経過しています。情報が古い可能性がありますので、ご注意ください。

AWS re:Invent 2017で新サービスAmazon Transcribeが発表されました。
Amazon Translate, Amazon Comprehendと共に発表されたテキスト処理系のサービスです。

Amazon Transcribeは音声データをテキスト化する自動音声認識(ASR)サービスです。
元となる音声データをS3に置き、Transcribe APIを呼び出すことでテキスト化されたデータが得られます。

Amazon Transcribeの特徴は以下の通りです。

読みやすい文章

多くのテキスト化サービスは、文章を句読点なしで出力することが多いのですが、Amazon Transcribeは句読点ありで出力するため非常に読みやすい文章になります。

通話のテキスト化も高品質

通話録音の場合は通常音声品質があまりよくありませんが、Amazon Transcribeは通話録音でも非常に高い精度でテキスト化を行うように設計されています。

多言語対応

現時点では英語とスペイン語のみ対応していますが、今後複数の言語に対応予定とのことです。

使用が簡単

数行の簡単なコードでAPIを呼び出せば、S3にある音声データからテキストを得ることができます。

カスタムボキャブラリ

音声認識のボキャブラリがカスタマイズ可能です。固有名詞や専門用語などもボキャブラリを追加することで正確に認識させることが可能です。

タイムスタンプサポート

テキスト化されたデータには単語毎にタイムスタンプが付加されるため、音声の特定部分のテキストが簡単に判別可能です。

複数の話者を識別可能

音声で話者の変化を認識するため、各話者毎でテキスト化するなども可能です。

公式ドキュメントにも記載がありますが、上記の特徴よりサービスセンター等の通話をテキスト化するのに最適なサービスのようです。Amazon Comprehendと組み合わせて顧客満足度の分析などもできそうですね。正式サービスインがとても楽しみです。

投稿者プロフィール

けひ
組み込み開発から運用までカバーするエンジニアです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


Time limit is exhausted. Please reload CAPTCHA.