Register and share your invite link to earn from video plays and referrals.

anonymous
@youyouAllen
Nothing
Joined August 2014
1.2K Following    3.1K Followers
我自己在测试AR+diffusion结合的本地推理引擎。目前来看block内进行diffusion,对kv cache是一个极大的节省。通过proposer/verifier的表征对齐的小型训练 把acceptance做到0.3-0.5,这种组合快速低成本scale。但是也面临计算量的飙升。同时仍然看好连续潜空间的全局表示配合AR的精准局部预测。
Show more