ゲーム生成を X で検索 — Twitter ブラウザ

2026.06.17 22:26

🎮 「AIエージェントは、実際のゲームエンジンで“遊べるゲーム”を最後まで作れるのか？」——この問いに正面から答えるベンチマークが登場しました。結果は、最強でも成功率41%という厳しいものでした。タイトル: GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine? URL: 🎮 概要 GameCraft-Benchは、自然言語の仕様から実エンジン（Godot 4）上で完成・起動・プレイ可能なゲームをエンドツーエンドで作れるかを評価するベンチマークです。15ジャンル・計140タスクで構成されています。 ❓ 解決する課題これまでのコーディング評価は「コードが正しいか」が中心でした。・ゲームの良し悪しは、実際に動かしたときの挙動で決まる・既存ベンチマークは実エンジン上の「遊べる成果物」を評価できていなかった 💡 方法論と提案手法 3つの評価原則を立てています。・Engine Grounding：実エンジンGodot 4上で開発（ヘッドレス実行で再現可能な自動テスト）・Artifact Completeness：起動可能で自己完結したプロジェクトを提出。起動できなければ0点（Build Gate）・Interactive Verification：エージェントが入力トレース（マウス/キー操作列）を提出し、検証器がGodotで再生して動画化、GPT-5.5がルーブリックで採点採点はCore Mechanics・Content Depth・Functional Visuals・Art & Presentationの4観点で重み付けします。 🎯 ユースケースコーディングエージェントを「コードの正しさ」ではなく「遊べる成果物を作り切れるか」で測れます。自動でプレイ検証まで回るため、ゲーム生成やUI生成エージェントの実力評価に使えます。 📊 実験結果・最高はClaude Opus-4.7で41.46%、GPT-5.5が39.49%、多くは40%未満・Core Mechanicsは比較的強い（上位で約55%）が、Art & Presentationが最も弱い（約36%）・スクリーンショットで確認を重ねるエージェントほど好成績。一方でツール使用量と最終スコアの相関はほぼゼロ（r=+0.016）で、build→replay→evaluateのループを閉じることが鍵でした #AIエージェント# #ゲーム生成#

0

コミュニティへ転送

あそびのちから@SzVj0gBvcawgM3v

2026.06.12 15:09

【はじめまして🐣】「あそびのちから」は、AIの力で発達支援と知育を"エンタメ"から届けるプロジェクトです。「言いたいことが言えない」「やるべきことに取りかかれない」「気持ちの切り替えが苦手」 ——子どもにも大人にもあるこの困りごとを、AIが一人ひとりに合わせた【1分クエスト】に変えて、社会性や日常の生きやすさにつながる20の力を育てます。第1弾はゲーム『ミニクエ』⚔️ ✅ 力チェックで、あなたの伸ばしどころをAIが分析（無料） ✅ 弱点に合わせて、AIが毎回あなた専用のクエストを生成 ✅ クエストに答える＝ボスに攻撃。相棒は無限に進化 ✅ ひらがな／漢字モードで、子どもも大人も体験はこちら👇 アプリ内の📣ご意見ボタンから感想・要望を送れます。全部読んで改善します🙏 リプライ欄用: なぜ"ゲーム"なのか、AIで何が変わるのか。くわしい想いはnoteに書きました📝

0

38

1

コミュニティへ転送

【公式】勝利の女神：NIKKE@NIKKE_japan

2026.04.22 09:43

【★NIKKEモーション紹介★】アニス：スター(CV：岡咲美保) ◆使用武器ロケットランチャー「トゥインクルスター」 ◆スキル部隊構成に応じて、自分の攻撃能力または味方の生存能力を強化。バーストスキル発動時には、周囲に自動攻撃を行う小さな星を生成し戦場をサポート。 ※戦闘動画はテスト環境で撮った内容であり、実際の内容はゲーム内をご参照ください。 ※数値はレベル10時点のものとなります。 ※スキル内容や数値はポスト投稿時点の参考であり、今後変更する可能性がございます。 ※画像が綺麗に表示されない場合は、長押しして「高画質で読み込む」を選択すると、高画質版で確認することができます。

0

135

7.2K

2.2K

コミュニティへ転送