速報!OpenAIがGPT-4o-mini-ttsをリリース。日本語対応し、音声文字起こしやテキスト読み上げ。

OpenAIが開発したGPT-4o-mini-ttsは、高性能なTTS(Text-to-Speech)モデルです。このモデルはテキストを読み上げる際に、自然なイントネーションや感情表現を加えることができます。従来のTTS技術と比較して、より滑らかでリアルな音声を生成できるのが大きな特徴です。

GPT-4oシリーズの一員として開発されたこのモデルは、より軽量でありながら高品質な音声生成を実現しています。「mini」の名を冠していますが、その性能は従来の標準的なTTSモデルを大きく上回ります。さらに、多言語対応やリアルタイムでの音声生成機能も備えています。

Introducing next-generation audio models in the API | OpenAI

OpenAI.fm

デモを試してみましたが、日本語の読み上げもなめらかでびっくりしました。

    コメント

    タイトルとURLをコピーしました