Baseten(@baseten):We serve Qwen3-TTS on vLLM-Omni at $3 per 1M characters. That's 90% lower in cost than comparable closed-source TTS APIs. Our engineers optimized a single-replica serving stack to get there. Details on the optimized stack and cost per concurrent stream here.

注册并分享邀请链接，可获得视频播放与邀请奖励。

立即注册

Baseten

@baseten

Inference is everything.

加入 March 2021

340 正在关注 10.2K 粉丝

Baseten@baseten

2026.05.14 17:26

We serve Qwen3-TTS on vLLM-Omni at $3 per 1M characters. That's 90% lower in cost than comparable closed-source TTS APIs. Our engineers optimized a single-replica serving stack to get there. Details on the optimized stack and cost per concurrent stream here.

显示更多

0

0

3

93

6

转发到社区

热门用户

狗爹和小桃（主页完整)

38.1K 粉丝

869.2K 粉丝

108.8K 粉丝

一劍浣春秋

229K 粉丝

220.7K 粉丝

彭博商業周刊 / 中文版

40.9K 粉丝

李老师不是你老师

@whyyoutouzhele

2.2M 粉丝

1.9M 粉丝

170.9K 粉丝

Fan Bingbing 范冰冰

@realBingbingFan

375.4K 粉丝

东京不太热

286K 粉丝

Natsume✨枣糕

1.2M 粉丝

16.3K 粉丝

绿帽俱乐部

414.8K 粉丝

31.2K 粉丝