注册并分享邀请链接,可获得视频播放与邀请奖励。

Roland.W
@rwayne
🧑‍⚕️ 医学&经济学全奖PhD 🇦🇺 🚀3 个月 X 涨粉 4w|累计曝光 1.5 亿 💼《中国企业AI转型白皮书》作者|企业AI转型咨询|AI医疗创业者 ⭐ 订阅都是本人精华|优先回复订阅者评论和私信👈
加入 June 2023
803 正在关注    48.6K 粉丝
字节跳动开源了个桌面 AI Agent,直接用自然语言控制你的电脑 你说"帮我打开 VS Code 的自动保存功能",它就真的去点开设置帮你改 说"帮我在 Priceline 订明天去东京的机票",它就真的去操作浏览器完成预订 GitHub: 核心原理很直接: 截屏 → 理解屏幕内容 → 推理下一步动作 → 执行点击/输入/滚动 → 再截屏 → 循环到任务完成 本质上是 Anthropic Computer Use 的开源替代 它交付了两个产品: UI-TARS Desktop:原生应用,支持 macOS 和 Windows Agent TARS:通用框架,支持任意多模态 LLM(Claude、GPT、豆包都行),还能接 MCP 工具服务器 感觉以后连鼠标都不用动了
显示更多