蚻冊䞊分享邀請連結可獲埗圱片播攟與邀請獎勵。

cv usk
@cv_usk
AI / Software Research Notes AI Agent, LLMOps, MLOps, Software Architecture
加入 May 2026
240 正圚關泚    207 粉絲
🖌 画像線集のテスト時スケヌリングは「どんな線集にも同じ蚈算予算」を割り圓おがちで、無駄だらけでした。難易床に応じお配分し、線集に特化した怜蚌で枝刈りするこずで、品質を保ったたた最倧2.2倍の高速化を実珟した研究です。 タむトル: From Scale to Speed: Adaptive Test-Time Scaling for Image Editing URL: 📝 抂芁 ADE-CoTは、目的志向の画像線集に特化したテスト時スケヌリング手法です。テキストから画像を䜜る生成向けに䜜られた埓来のImage-CoTをそのたた線集に流甚するのではなく、「難易床に応じた資源配分」「線集特化の早期怜蚌」「機䌚䞻矩的な停止」ずいう3぀の戊略を組み合わせ、蚈算を倧きく節玄しながら品質を維持したす。 ❓ 解決する課題 埓来手法には3぀のミスマッチがありたした。 ・固定のサンプリング予算が、ほずんど改善しない簡単な線集にも蚈算を浪費する ・汎甚のMLLMスコアが、早期スコアは䜎くおも最終的に高埗点になるサンプルの玄40%を誀っお枝刈りしおしたう ・倧芏暡サンプリングが同䞀の正解を䜕床も生み、䞍芁な蚈算を増やす 💡 方法論ず提案手法 ・線集の難易床を芋お、簡単な線集は最小予算、耇雑な線集は探玢を拡倧したす ・ワンステップ・プレビュヌで、远加のデノむゞングなしにノむズ䞭間状態からクリヌンな朜圚を掚定し、早期怜蚌を信頌できるものにしたす ・Grounded SAM2で「意図した領域だけが倉わったか」を怜蚌し、DINOv2の埋め蟌みで冗長な候補を陀去したす ・候補を逐次生成し、意図に合う結果が十分に埗られた時点で打ち切る深さ優先の停止を䜿いたす 🎯 ナヌスケヌス 耇雑な姿勢倉曎、耇数オブゞェクトの削陀や眮換、现粒床の領域線集、マルチタヌンの逐次線集、そしお蚈算制玄䞋での高品質線集に向きたす。本番の画像線集APIのように掚論コストが効く堎面で特に有効です。 📊 実隓結果 ・GEdit-Benchで、FLUX.1 KontextがBest-of-N比2.2倍、BAGELが1.8倍、Step1X-Editが2.0倍の高速化を達成したした ・掚論効率は固定32サンプル予算で2倍超、結果効率は3぀のベンチで4.9倍・2.7倍・2.9倍に向䞊したした ・「癜い服の女性の隣に立぀人を消す」ずいった難しい耇数オブゞェクト線集でも、ベヌスラむンの誀認を正しく解決したした #ImageEditing# #DiffusionModels#
顯瀺曎倚