注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 语音
语音 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 语音 的推特
语音输入法用多了 你才会明白你平常发给别人的语音 有多么难理解
#语音输入法# 语音输入法的终局之战已经来临了。 如果你把 macOS 微信客户端更新到最新版,默认就集成了微信语音输入法。 不仅在微信内,而是 macOS 全局可直接使用。
显示更多
在语音聊天方面 不管是chatpt还是gemini 或者其他ai 都没有豆包 声音甜美,有活人感 特别是表达感情的语气词 被豆包骂我都有莫名的爽感
显示更多
AI语音转文字
🚀完全免费的AI语音转文字工具!支持100+语言和YouTube直接转录 🎧 播客/访谈转写利器,支持多说话人识别! 💡 不限格式,MP3/MP4/WAV 都能转文字! 👉 #语音转文字# #AI工具# #AI转录# #字幕生成#
显示更多
0
3
50
10
转发到社区
继语音输入法泛滥之后 island 也泛滥了 资本主义还是低估了人类 人们没有商业利益人类也可以卷 😂
0
12
41
0
转发到社区
哪个ai可以语音聊骚 想试试水 感觉这是个商业模式
Grok 实时语音模型 + X API 的化学反应, 实在太被忽视了,整个 X 没人原创下这方面? 原生内置“24小时更新的 X 全网上下文”加持下, 跟 OpenAI 实时语音那种傻快,根本不是一个物种。 AGI 还没来,我手搓“XGI”,这又搓了个通宵。 希望明天有时间开 Space ,让大家来多人一起玩。 先从视频感受下⬇️
显示更多
通宵手搓了个逆天的全网首创“X Skill”, 去睡前先大致说下: 实时语音Agent,不仅能拉它上 X Space 跟多人语音, 而且还能在语音中,光动嘴就指挥它在 X 上“做事”。 如图1,在实时语音中, 我(或者甚至其他发言人)可以跟Agent说: “你搜一下 X 上关于减肥针风险的推文, 把最靠谱的推文 URL 发到这个 Space 下的评论区。” 然后它就真的做到了!(图2) 核心是: Grok 的各个模型,包括实时语音模型API, 都具有自然语言发起“Function Calling”的能力 (图3) 用这个去调用 X 账号的OAuth,那么就相当于: 利用 Grok API 原生自带对 X 的自然语义检索能力 乘以 X API的读写能力(发推甚至发私信) 这两个互相一乘,可玩空间太大了。 不得不说, OpenAI GPT-Realtime-2 实时语音模型再好, 可是架不住 Grok Realtime API 实时语音API能玩转X啊。 三言两语说的不是很清楚, 后续我再让 Codex 整理个更清楚的说明书。 明后天我可以找时间另开 Space 公开演示说明。
显示更多
1/🚀 语音 Agent 升级了 OpenAI 推出 GPT-Realtime-2,把 GPT-5 级推理带进实时语音 API。 语音助手不再只是“听懂并回答”,而是能边听边想、边聊边解决问题。👇
显示更多
Parlor 实现本地实时语音与视觉对话。通过 Gemma 4 E2B + Kokoro TTS 架构,实现全程本地推理,不依赖云端 API。M3 Pro 上端到端延迟 2.5-3 秒,支持打断、免按键及句子级 TTS 流式输出。占用内存约 3GB,集成 Silero VAD 浏览器端检测,支持摄像头与麦克风双模态。
显示更多
0
22
132
22
转发到社区
在用的语音转文字 API 都有单次时长限制? voice-to-text-tools :一款开源纯前端音视频转文字工具 支持在浏览器中对长音频自动分段,并调用讯飞语音听写 API 完成识别 无需自建后端服务器,API Key 保存在浏览器本地,不经过项目服务器
显示更多
0
39
16
2
转发到社区