OpenAIは9日、テキストからリアルな動画を生成できるAIモデル「Sora」をリリースした。
同社は2月にSoraを発表し、現実世界の理解とシミュレーションにおけるAIの可能性を提示してきた。Sora Turboは、以前のバージョンと比較して大幅に高速化され、スタンドアロン製品としてSora.comでChatGPT PlusおよびProユーザーに提供される。
Sora Turboのリリースは、動画生成AIの分野における大きな進歩である。この技術は、現実世界のシミュレーションや物理世界とのインタラクションを可能にするAIモデル開発の重要な一歩と言える。
高速化と高解像度を実現
Sora Turboは、最大1080pの解像度、最大20秒の長さの動画を生成できる。ワイドスクリーン、縦型、正方形のアスペクト比に対応しており、ユーザーはテキストから完全に新しいコンテンツを生成したり、自身の素材を用いて拡張、リミックス、ブレンドしたりすることが可能だ。
また、新しいインターフェースにより、テキスト、画像、動画を使ったプロンプト入力が容易になった。ストーリーボードツールを使用すると、各フレームの入力を正確に指定できる。
これらの機能強化は、ユーザーの創造性を大幅に向上させる。特に、高解像度化と生成時間の短縮は、プロの現場での利用を促進するだろう。
安全性と倫理的課題への対応
OpenAIは、Sora Turboの安全性と倫理的課題に積極的に取り組んでいる。生成されたすべての動画には、暗号資産(仮想通貨)分野でも用いられるC2PAメタデータが含まれており、Soraによって生成されたことを識別できる。
また、目に見える透かしをデフォルトで追加し、内部検索ツールを使用して、コンテンツの出所を確認できるようにしている。
児童性的虐待コンテンツや性的ディープフェイクなどの特に有害な悪用をブロックし、人物のアップロードを制限する措置も講じられている。
同社は、ディープフェイク対策を強化しながら、この機能をより多くのユーザーに展開していく予定だ。安全性に関する取り組みは、ユーザーの信頼獲得に不可欠である。