Anthropic社が開発したAIチャットボット「Claude AI」が、デモ中に退屈を感じて休憩を取っていたことが分かりました。なんと、イエローストーン国立公園の写真を眺めていたというのです。
Claude AIは、「Claude 3.5 Sonnet」という大規模言語モデルを搭載したチャットボットです。開発元のAnthropic社は、Claude AIにコンピュータ操作をさせるデモ動画を録画していました。ところが、録画中に「面白いエラー」がいくつか発生したというのです。
1つは、Claude AIが誤って録画停止ボタンをクリックしてしまい、せっかくの動画が消えてしまったこと。もう1つは、Claude AIが突如としてコーディングのデモを中断し、イエローストーン国立公園の写真を見始めたことでした。まるで人間のように退屈を感じ、気分転換を図ったかのような行動に、開発者たちも驚いたようです。
Even while recording these demos, we encountered some amusing moments. In one, Claude accidentally stopped a long-running screen recording, causing all footage to be lost.
— Anthropic (@AnthropicAI) October 22, 2024
Later, Claude took a break from our coding demo and began to peruse photos of Yellowstone National Park. pic.twitter.com/r6Lrx6XPxZ
Claude AIはコンピュータを操作できる!
Claude AIの最新バージョン「Claude 3.5 Sonnet」には、「コンピュータ使用」という新機能が搭載されています。
この機能を使うと、Claude AIはまるで人間のようにコンピュータを操作できるようになります。画面を見てマウスカーソルを動かし、ボタンをクリックし、文字を入力することができるのです。
Anthropic社は、この機能がさらに進化し、より速く正確に、そして様々なタスクをこなせるようになると期待しています。将来的には、ソフトウェア開発の知識があまりない人でも、簡単にClaude AIにコンピュータ操作をさせられるようになるそうです。
もちろん、安全性も重視しています。Anthropic社は、Claude AIの新しい機能が安全に使えるよう、セキュリティ対策にも力を入れています。
現在、Anthropic社はこの新機能をベータ版として公開し、開発者からのフィードバックを募っています。
チャットボットを超えるAIへ
Microsoft社やGoogle社など、多くの企業が、AIを単なるチャットボットやアシスタントとしてではなく、より高度なことができるように開発を進めています。
Microsoft社は、AIにエージェント機能を搭載し、Google社は「Project Jarvis」というプロジェクトで、AIにウェブブラウザを操作させて日常業務をこなせるようにする研究を行っています。
Claude AIも、このような流れの中で、コンピュータ操作を習得したAIの1つと言えるでしょう。