TwiScan
人気
コミュニティ
ログイン
登録
English
日本語
한국의
简体中文
繁体中文
登録して招待リンクを共有すると、動画再生報酬と紹介報酬を獲得できます。
今すぐ登録
vLLM
@vllm_project
A high-throughput and memory-efficient inference and serving engine for LLMs. Join to discuss together with the community!
参加 March 2024
36
フォロー中
38.7K
ファン
vLLM
@vllm_project
2026.05.08 14:00
🚀 vLLM-Omni v0.20.0 is out — aligned with upstream vLLM v0.20.0 (CUDA 13.0 · PyTorch 2.11 · Transformers 5.x). ⚡ Qwen3-Omni throughput +72% on H20, 32 conc (0.241 → 0.414 req/s) via talker / code2wav multi-replica scaling 🎙️ TTS faster & leaner: VoxCPM2 RTF 0.946 → 0.106 · Fish Speech Fast AR latency -53% · Qwen3-TTS / Voxtral-TTS Code2Wav saves ~3.2 GiB 🎨 Diffusion dynamic step-level batching: +7.8% throughput / -5.8% latency 🆕 New / improved: HunyuanImage-3.0, ERNIE T2I, AudioX, Wan2.2-S2V, LTX-2.3, FastGen Wan 2.1 📱 Wan2.2 on NPU production-ready: MindIE-SD, fused ops, VAE BF16, HSDP/USP — +50–60% perf 🧮 Quant expanded: Qwen Omni W4A16, OmniGen2 FP8, Z-Image FP8, HunyuanImage3 NPU, GLM-Image 🧩 Multi-backend updates across CUDA / ROCm / MUSA / NPU / XPU Check it out →
もっと見る
0
0
15
235
27
コミュニティへ転送
人気のあるユーザー
一劍浣春秋
@chee828
229K ファン
合沢萌
@aizawamoe0515
5.9K ファン
alex01 AV🔞
@gzjsyvv
33.1K ファン
SieuThiAV
@SieuThiAV
212.8K ファン
森咲智美
@p_tomo0812
354.3K ファン
♥愛葉るび♡Ruby♥👑💿全力元年🎶配信中
@rubyaiba816
3.3K ファン
Aqua水淼
@aqua_cosplay
1.9M ファン
希島あいり💐:*.
@airi_kijima
1.4M ファン
Natsuko夏夏子💕C107(水)東7 T-11b
@Natsuko233
286.2K ファン
真島なおみ
@naomi_majima
699.2K ファン
菅田将暉
@sudaofficial
3M ファン
ケイン・ヤリスギ「♂」
@kein_yarisugi
542.3K ファン
ねね🐻❄
@__zzz___oo0
370.6K ファン
涼森れむ
@remu19971203
1.5M ファン
明日花キララ🏰🐇
@asukakiraran
2.4M ファン