米Googleの人工知能研究部門DeepMindは4日、1枚の画像から探索可能な3D環境を生成できる人工知能システム「Genie 2」を発表した。同社はこの技術により、次世代の実施環境型AIエージェントの開発が加速すると期待されている。
画期的な3D世界生成技術の詳細
When we started Genie 1 over two years ago, we always imagined a foundation world model will one day be able to generate an endless curriculum for training embodied AGI. Today, we made a big step towards that future.“this is the worst AI will ever be”
同社の研究者ジャック・パーカー・ホルダー氏は、Genie 2が従来モデルの制約を超える画期的な基盤モデルだと説明した。このシステムはテキストプロンプトから完全に遊べるゲーム環境を生成し、最大1分間の探索を可能にする。ユーザーはキーボードとマウスを使用して、ジャンプや水泳などの動作を実行できる。
動画データで学習したGenie 2は、物体の相互作用やアニメーション、光の効果、物理演算、反射、そしてNPC(ノンプレイヤーキャラクター)の動作を正確にシミュレートする。さらに複雑な照明効果や煙の表現まで実現している。この技術は今年初めに発表された初代Genieの機能を大幅に拡張したものとなっている。
AIエージェントとの連携で広がる可能性
DeepMindは同社のAIエージェント「SIMA」とGenie 2を組み合わせた実験も実施した。SIMAは生成された3D空間内で「青いドアを開ける」などの自然言語指示に従って行動できることが確認された。
When we started Genie 1 over two years ago, we always imagined a foundation world model will one day be able to generate an endless curriculum for training embodied AGI. Today, we made a big step towards that future.“this is the worst AI will ever be”
研究者のティム・ロクテシェル氏は、2年前に開発を始めたGenie 1から大きな進歩を遂げ、汎用人工知能の訓練に活用できる無限のカリキュラム生成に近づいたと評価している。同様の技術開発に取り組むWorld LabsやDecartなどのスタートアップ企業との競争も激化している。
日本のゲーム業界への影響と展望
この技術は日本のゲーム開発業界に大きな影響を与える可能性がある。3D環境の迅速な生成は開発コストの削減につながり、小規模スタジオでも高品質なゲームコンテンツの制作が可能になる。特にインディーゲーム開発者にとって、プロトタイプ作成や環境デザインの効率化に貢献すると予想される。
一方で、動画データの使用に関する著作権の問題も指摘されている。過去にOpenAIはYouTubeのコンテンツをAI学習に無断使用した疑いで批判を受けており、Genie 2の学習データについても透明性の確保が求められる。
開発者や投資家は、この技術がもたらすゲーム開発の革新に注目する一方で、著作権やAI倫理の観点から慎重な検討も必要となる。今後は技術の発展と並行して、適切な利用ガイドラインの策定も重要な課題となるだろう。