Home OpenAI、リアルタイムAPI公開|音声対話アプリ開発が加速

OpenAI、リアルタイムAPI公開|音声対話アプリ開発が加速

人工知能(AI)開発企業のOpenAIは1日、リアルタイムAPIのパブリックベータを開始した。これにより、有料開発者は低遅延でマルチモーダルな体験をアプリケーションに組み込むことが可能になる。

リアルタイムAPIの特徴と機能

リアルタイムAPIは、先日発表されたChatGPTの高度な音声モードと同様に、APIで提供されている6つのプリセット音声を使用した自然な音声対話をサポートする。

この新しいAPIの最大の特徴は、音声入力と出力を直接ストリーミングすることで、より自然な会話体験を実現できる点だ。

さらに、人間の会話のように割り込みを自動的に処理する機能も備えている。これらの機能により、開発者は単一のAPI呼び出しで自然な会話体験を構築できるようになった。

活用事例と可能性

リアルタイムAPIの活用事例として、フィットネスコーチングアプリ「Healthify」と語学学習アプリ「Speak」が挙げられる。

Healthifyでは、AIコーチRiaとの自然な会話を実現し、必要に応じて人間の栄養士による個別サポートも提供している。一方、Speakは新しい言語での会話練習をサポートするロールプレイ機能にこのAPIを活用している。

これらの事例から、カスタマーサポート、教育、言語学習など、幅広い分野での応用が期待される。

開発者向け情報と今後の展望

リアルタイムAPIは現在、有料利用者向けにパブリックベータとして提供されている。価格設定は、テキスト入力トークンが100万トークンあたり5ドル、出力トークンが100万トークンあたり20ドルとなっている。これは音声の場合、入力が約1分あたり0.06ドル(約8.63円)、出力が約1分あたり0.24ドル(約34.51円)に相当する。

また同日OpenAIは、Prompt Cachingと呼ばれる新機能も導入した。この機能により、モデルは過去に見たトークンを再利用できるようになり、開発者は50%割引でより多くのキャッシュされたコンテキストをモデルに追加できる。しかも、遅延に影響を与えることなくこれを実現できる点が特筆される。

今後の展開として、OpenAIはビジョンやビデオなどの新たなモダリティの追加や、同時セッション数の増加、公式SDKのサポート、プロンプトキャッシングの導入などを計画している。さらに、将来的にはGPT-4o miniもサポートする予定だ。

リアルタイムAPIの登場により、開発者は教育、翻訳、カスタマーサービス、アクセシビリティなど、さまざまな用途で魅力的な音声体験を創造できるようになる。

これは人工知能と人間のインタラクションに新たな可能性をもたらし、より自然で効果的なコミュニケーションの実現に貢献するだろう。

ReadWriteの編集プロセスについて

ReadWriteの編集方針では、テクノロジー業界の主要な動向を常に注視しています。新製品の発売、AI分野での画期的な進展、ビデオゲームの新作リリース、その他注目すべき出来事など、幅広いトピックを取り上げています。編集者は、各トピック分野に精通したスタッフライターまたはフリーランス寄稿者に関連記事を割り当てます。記事は公開前に、正確性、明瞭性を確保し、ReadWriteのスタイルガイドラインへの準拠を確認するため、厳密な編集プロセスを経ます。

Eiji M.
Editor

CryptoKittiesをきっかけにWeb3の世界に没頭。ブロックチェーンゲームDecentralandや米大手企業のゲームエンジンローカライズに携わる。最新の生成AI技術にも精通し、Web3とAI…...

重要テクノロジーニュースをあなたのメールボックスへお届け

    By signing up, you agree to our Terms and Privacy Policy. Unsubscribe anytime.

    テックニュース

    最先端テクノロジーの世界をご案内します。私たちが厳選した情報だけをお届けし、急速に進化するテクノロジー業界の本質を捉えた、簡潔でわかりやすい最新情報をご提供します。膨大な情報の中から、真に価値ある内容のみをお伝えします。

    テクノロジー徹底解説

    最新技術が私たちの生活に与える影響を掘り下げます。データに基づく綿密な分析と、その背後にある物語を通じて、テクノロジーの真の姿に迫ります。業界の最新トレンドを紐解き、テクノロジーと社会の複雑な関係性をより深く理解するための洞察を提供します。

    専門家によるレビュー

    あなたの賢明な選択をサポートします。業界のエキスパートによる深い洞察と綿密な分析を通じて、テクノロジーの奥深さを紐解きます。最新のお得情報をお届けし、目まぐるしく変化するテクノロジー市場を確実に進むための羅針盤となります。信頼できる情報で、常に一歩先を行く選択をお手伝いします。