Aliez Ren(@aliez_ren):给 KTransformers 提的 PR 合并了！

註冊並分享邀請連結，可獲得影片播放與邀請獎勵。

立即註冊

Aliez Ren

@aliez_ren

独立开发者菜鸡架构师我的产品 @taoli_tools

加入 June 2014

1.7K 正在關注 16.3K 粉絲

Aliez Ren@aliez_ren

2026.04.30 09:30

给 KTransformers 提的 PR 合并了！

Aliez Ren@aliez_ren

2026.03.05 16:03

跑本地大模型真令人上瘾，从最开始的用 LM Studio，Ollama，改为使用 llama.cpp，使用 Unsloth 量化的 GGUF。再到 vLLM，SGLang，KTransformers 都摸索了一遍，然后发现目前的工具其实对于 RTX 5090 (sm120) 的 FP4 支持的都不太好，虽然能运行 4bit 量化模型省显存，但都还无法利用原生 FP4 硬件加速。虽然都是 Blackwell 架构，但服务器上的 B200 和家用的 RTX 5090 区别很大，最终走向了自己修改编译 SGLang 的道路。

顯示更多

0

0

3

38

2

轉發到社區

熱門用戶

3.9M 粉絲

176.1K 粉絲

730K 粉絲

i-dle (아이들)

@official_i_dle

2.4M 粉絲

588.2K 粉絲

185.2K 粉絲

로이킴 (Roy Kim_Official)

@official_roykim

15.4K 粉絲

421.7K 粉絲

브라운더스트2 공식트위터

19.8K 粉絲

@miorin_lemon212

280.5K 粉絲

93.7K 粉絲

승리의 여신: 니케 - 신규 업데이트

76.5K 粉絲

247.5K 粉絲

INFINITE(인피니트) Official

515.3K 粉絲

蜜雅MiaKcup🩷身長149 75K~L cup🍼🍼🍼

108K 粉絲