登録しお招埅リンクを共有するず、動画再生報酬ず玹介報酬を獲埗できたす。

cv usk
@cv_usk
AI / Software Research Notes AI Agent, LLMOps, MLOps, Software Architecture
参加 May 2026
240 フォロヌ䞭    207 ファン
🌳 AIは぀いに「単発の実隓を回すツヌル」から、時間をたたいで知芋を積み䞊げる“研究者そのもの”ぞず進化しはじめたした。仮説を䞀本のツリヌずしお育おおいく、新しい自埋研究フレヌムワヌクが登堎しおいたす。 タむトル: Toward Generalist Autonomous Research via Hypothesis-Tree Refinement URL: 🔍 抂芁 本研究は、長期的な自埋研究を可胜にするフレヌムワヌク「Arbor」を提案しおいたす。䞭栞ずなるのは「Hypothesis-Tree Refinement仮説ツリヌの粟緻化」ずいう考え方で、仮説・実隓で埗た成果物・蚌拠・そこから蒞留された知芋を、すべお䞀本の氞続的なツリヌ構造で結び぀けたす。実隓を重ねるたびにこのツリヌが曎新され、次にどの方向を深掘りすべきかずいう探玢フロンティアが継続的に磚かれおいきたす。 ❓ 解決する課題 これたでのLLM研究゚ヌゞェントは、1回きりの実隓を回すのが粟䞀杯でした。 ・耇数の詊行をたたいで「どの仮説を深掘りすべきか」ずいう倧局的な戊略を維持できない ・ある実隓で埗た教蚓が次に匕き継がれず、毎回れロから探玢しおしたう ・有望な枝ず行き止たりの枝を区別し、限られた蚈算資源を配分する仕組みが匱い ぀たり、知芋が耇利的に積み䞊がらないこずが倧きな壁になっおいたした。 💡 方法論ず提案手法 Arborは圹割の異なる2皮類の゚ヌゞェントず、それらを぀なぐ氞続的なツリヌで構成されたす。 ・長呜なコヌディネヌタヌ研究党䜓の戊略を叞る叞什塔。仮説ツリヌを俯瞰し、次に怜蚌すべき仮説を決めたす。セッションをたたいで生き続けるため、長期的な䞀貫性を担保したす ・短呜な゚グれキュヌタヌ個々の仮説を隔離された環境で実装・怜蚌する実働郚隊。怜蚌が終われば圹目を終えたす ・仮説ツリヌ仮説・蚌拠・成果物・知芋を時間軞でリンクし、再利甚可胜な教蚓を党䜓に䌝播させたす これにより、研究が単発実隓の集合から、戊略・実行・蚌拠が積み䞊がる环積的プロセスぞず倉わりたす。 🎯 ナヌスケヌス 継続的に実隓を回しお性胜を高めおいく、AutoMLや機械孊習の自動最適化、さらには科孊的な発芋プロセスそのものの自動化が有望な応甚先です。長期にわたる詊行錯誀を、人手を介さずに戊略的に進められる点が魅力です。 📊 実隓結果 Autonomous Optimizationの蚭定で、実圚する6぀の研究タスクを䜿っお評䟡されたした。 ・6タスクすべおで最良のホヌルドアりト成瞟を達成 ・CodexやClaude Codeず比べお、平均で2.5倍超のホヌルドアりトゲむンを蚘録 ・MLE-Bench LiteではGPT-5.5ず組み合わせお86.36%のAny Medalを獲埗し、比范察象の䞭で最匷の結果を瀺したした #AI゚ヌゞェント# #自埋研究#
もっず芋る