GitHubDaily
@GitHub_Daily
💡 挖掘开源的价值 🧑🏻‍💻 坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术 🧐 A list cool, interesting projects of GitHub. ✏️ 公众号:GitHubDaily
Joined May 2023
166 Following    21.8K Followers
一款超逼真的文本转语音生成模型:Dia-1.6B,号称超越 ElevenLabs 和 Sesame。 仅仅只有 1.6B 参数,能直接从文本生成高度逼真的对话,还支持控制情感和语调,甚至可以生成笑声、咳嗽等非语言声音。 GitHub:https://t.co/7zLQ8Mja1J 模型下载:https://t.co/E6B82FYmho 主要特性: - 通过 [S1] 和 [S2] 标签控制生成多角色对话; - 支持生成笑声、清嗓子、叹息等非语言表达; - 提供声音克隆功能,可复制特定声音风格; - 实时生成,A4000 GPU 上约 40 tokens/s。 提供 Gradio UI 界面,操作简单易上手,同时还可以在 Hugging Face 上在线体验。
Show more
0
4
222
54