グーグルは24日、人工知能(AI)が生成したコンテンツを識別する技術「SynthID」をオープンソース化し、Responsible Generative AI Toolkitを通じて無料で公開した。
開発者や企業は、この技術を活用してAIが生成したテキストコンテンツを特定できるようになる。
SynthIDの仕組みと特徴
SynthIDは、AIが生成したコンテンツに人間には気づかないデジタル透かしを埋め込む技術だ。
テキストの場合、AIが文章を生成する際の単語の選択確率を微調整することで透かしを作成する。音声コンテンツでは、音の波形をスペクトログラムに変換し、そこに透かしを埋め込む仕組みを採用している。
画像や動画においても、ピクセルレベルで透かしを追加することで、品質を損なうことなく識別を可能にした。このデジタル透かしは、画像の切り取りやフィルター処理、圧縮などの加工を施しても残り続ける特徴がある。
オープンソース化の意義と展開
今回のオープンソース化により、開発者は自社の大規模言語モデル(LLM)が生成したテキストに透かしを埋め込み、その出所を確認できるようになる。グーグルはこの技術を学術誌「Nature」で詳細に解説し、責任あるAI開発の促進を目指している。
現在、この技術はVertex AIの画像生成モデル「Imagen」シリーズやImageFXで生成された画像にすでに実装されている。また、音楽生成モデル「Lyria」や動画生成モデル「Veo」にも導入され、生成コンテンツの識別に活用されている。
AIコンテンツ管理の未来
SynthIDの無償公開は、偽情報の拡散防止や著作権管理における重要な一歩となる。
開発者プラットフォームのHugging Faceでも利用可能となり、AIコンテンツの透明性向上に貢献することが期待されている。
さらに、グーグルの検索やChromeブラウザの「About this image」機能を通じて、一般ユーザーもAI生成画像かどうかを確認できるようになる。AIコンテンツの適切な管理と活用に向けた新たな標準として、その普及が注目されている。