AIがロボット犬を人間の助けなしに操り、最速の人間チームより約20倍速くタスクを完遂——物理世界に出てきたエージェントAIの実験です🐕
タイトル: Project Fetch: Phase Two
URL:
🐕 概要
Anthropic の Frontier Red Team による研究で、先進的な言語モデルが四足歩行ロボット(ロボット犬)を自律制御し、高度なタスクを完遂できるかを検証した追跡実験(Phase Two)です。
❓ 解決する課題
2025年8月の初回に続き、次の問いに答えます。
・新しいClaudeモデルは、前世代(Opus 4.1)よりロボティクスのタスクで優れているか
・人間の助けなしに、自律的に動作できるか
💡 方法論と実験設定
・Claude Opus 4.7を、Claude Code上で最大の適応的思考の努力レベルに設定し3回試行
・Phase Oneで人間チームが行ったのと同じタスクに挑戦:映像・LiDARセンサー接続、制御プログラムの記述、経路監視、ビーチボール検出、自律回収
・人間の関与は最小限(ノートPC接続、最初のプロンプト、コマンド/タスク承認のみ)
📊 実験結果
・人間の助けなしのClaude Opus 4.7が、最速の人間チームより約20倍速い
・全グループ完了の4タスクで、非Claudeチームより平均37.7倍、Claude支援ありチームより18.9倍速い
・生成コードは1,045行で人間Claudeチーム(10,309行)の約1/10、それで同等以上の結果
・一方、閉ループのフィードバックを要する精密なボール操作には苦戦
#
エージェントAI# #
ロボティクス#