註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

anonymous
@youyouAllen
Nothing
加入 August 2014
1.2K 正在關注    3.1K 粉絲
感觉模型在降本增效方向演进上,MoE和kv cache压缩只满足任务级别。而在token级别的会从单向注意力朝着双向注意力进行调整。自回归和扩散相结合,以进一步降本增效。
顯示更多