Baseten(@baseten):We serve Qwen3-TTS on vLLM-Omni at $3 per 1M characters. That's 90% lower in cost than comparable closed-source TTS APIs. Our engineers optimized a single-replica serving stack to get there. Details on the optimized stack and cost per concurrent stream here.

註冊並分享邀請連結，可獲得影片播放與邀請獎勵。

立即註冊

Baseten

@baseten

Inference is everything.

加入 March 2021

340 正在關注 10.2K 粉絲

Baseten@baseten

2026.05.14 17:26

We serve Qwen3-TTS on vLLM-Omni at $3 per 1M characters. That's 90% lower in cost than comparable closed-source TTS APIs. Our engineers optimized a single-replica serving stack to get there. Details on the optimized stack and cost per concurrent stream here.

顯示更多

0

0

3

93

6

轉發到社區

熱門用戶

108.8K 粉絲

一劍浣春秋

229K 粉絲

彭博商業周刊 / 中文版

40.9K 粉絲

170.9K 粉絲

31.2K 粉絲

福禄寿 UV DAO

102K 粉絲

李老师不是你老师

@whyyoutouzhele

2.2M 粉絲

16.3K 粉絲

东京不太热

286K 粉絲

绿帽俱乐部

414.8K 粉絲

夜郎奔（精品资源搬运工）

69.4K 粉絲

12.3K 粉絲

小鱼儿精品AV

463K 粉絲

12.2K 粉絲

川沐｜Trumoo🐮

228.7K 粉絲