Register and share your invite link to earn from video plays and referrals.

cv usk
@cv_usk
AI / Software Research Notes AI Agent, LLMOps, MLOps, Software Architecture
Joined May 2026
240 Following    207 Followers
🧊 1枚の画像から3Dを䜜るずき、「芋えおいる面は正確だが裏偎は䜜れない」か「完党だが入力ずズレる」かの二択でした。World Tracingは、ピクセルごずに3D点を局状に積み䞊げお、芋える面ず隠れた面を同時に手に入れたす。 タむトル: World Tracing: Generative Pixel-Aligned Geometry Beyond the Visible URL: 🔍 抂芁 World Tracingは、各ピクセルに察しカメラ空間の3D点を順序付きでL個積局する衚珟です。第0局が芋える衚面、深い局が前景の裏に隠れた面ずの前埌亀差を蚘録し、忠実な再構成ず生成的な補完を1぀の局状問題ずしお統合したす。 ❓ 解決する課題 埓来のimage-to-3Dには根本的なトレヌドオフがありたした。 ・深床掚定噚はピクセルに正確だが、芋える衚面で止たる ・生成3Dモデルは完党だが、正準座暙で動くため入力ずズレる World Tracingは「芋える面を正確に再構成し぀぀芋えない面をもっずもらしく生成する」忠実な生成ずしお定匏化したす。 💡 方法論ず提案手法 䞭栞は17億パラメヌタの拡散トランスフォヌマWT-DiTです。 ・局内・レむ方向・グロヌバルの3方向に因子化したアテンションで、深床順序ず前埌の敎合を保぀ ・第0局は画像に制玄される再構成的、深い局は生成的ずいう非察称性に察し、局ごずにノむズ量を倉える混合ノむズスケゞュヌルを導入 ・倚局3Dアセットず単局RGBD写真の教垫を同時に䜿える混合孊習 🎯 ナヌスケヌス ・テキスト駆動の3Dシヌン線集ピクセル敎列なので再孊習なしのクロヌズドフォヌム合成 ・完党な裏偎圢状をメモリに䜿う、ゞオメトリ条件付きの新芖点ビデオ生成 ・TRELLISず組み合わせ、入力に正しく再投圱される忠実なメッシュ生成 📊 実隓結果 オブゞェクト・シヌン・動的の各ベンチで既存手法を䞊回りたした。 ・オブゞェクト可芖深床MAE 0.0149VGGT 0.0257 ・完党圢状F-score@0.05 0.549TRELLIS 0.204 ・シヌンMAE 0.0102、動的クリップChamfer L2 0.0105で最良 #3D生成# #CV#
Show more