OpenAIは2024年6月25日(米国時間)、GPT-4oの新しい音声モードの提供を延期すると発表しました。
GPT-4oの新しい音声モードは、2024年5月にGPT-4oとともに紹介されました。音声入力に対して最短232ミリ秒、平均320ミリ秒という素早いレスポンスが可能で、人間と話しているのと同じような体験が得られるようになります。新しい音声モードは、GPT-4oの発表時点から数週間でChatGPT Plusユーザーにα版として提供予定とされていました。
We're sharing an update on the advanced Voice Mode we demoed during our Spring Update, which we remain very excited about:
We had planned to start rolling this out in alpha to a small group of ChatGPT Plus users in late June, but need one more month to reach our bar to launch.…
— OpenAI (@OpenAI) June 25, 2024
しかしOpenAIは、新しい音声モードが展開するための基準に達していないという理由から、提供開始まであと1カ月必要だとして予定していた6月下旬からの展開を延期。改善に取り組んでいる機能の例として、特定のコンテンツを検出して拒否するモデルが挙げられています。有害なコンテンツなどに対するセキュリティのさらなる強化が図られているものとみられます。そのほか、UX(ユーザーエクスペリエンス)の向上や、リアルタイムのレスポンスを維持しながら数百万人規模に対するためのインフラ準備なども進められているとのことです。
現時点でのOpenAIの発表内容に基づけば、GPT-4oの新しい音声モードは7月下旬から8月にかけて一部のChatGPT Plusユーザー向けにα版として提供されると考えられます。α版でのフィードバックと改善を経て、2024年秋にはすべてのChatGPT Plusユーザーが新しい音声モードにアクセスできるようになる予定です。
なおOpenAIによれば、映像や画面を共有する機能の展開にも取り組んでいるとのこと。この機能に関する進捗は別途案内するとしています。