注册并分享邀请链接,可获得视频播放与邀请奖励。

郭宇 guoyu.eth
@turingou
Retired. 只活一次等于没活。
加入 May 2009
540 正在关注    176.4K 粉丝
做 Yuragi FM 的过程中,我发现 AIGC 类产品的难点第一是在乎探索语言空间和结构,第二是难以评估实验成果,总是在 60-80 分之间横跳,没有 90+ 以上的生成产物。第三就是设计实验的成本和测试时间过长。我看到小红书上有不少专业做 AIGC 的,使用现成的工具,human in the loop 来做协调者,创作一首音乐都需要花 1-2 天的时间,更别提 MV 了,一方面,我们依赖模型不断进化来内化一些需要协调的功能和反复试错的实验,另外一方面,不断内化的模型又会趋向生成更加大众化审美的内容,进一步提升探寻语言空间的难度。因此,在做这个产品过程中,感受到最大的启发不是工作流的编排,也不是 agent matrix 的设计,而是人类意图的捕获。换句话说,真正重要的是如何理解意图(目标,岔路,审美,世界观)而非编排,wanman 也好,其他的流行的 harness 工程产品也好,只是完成这一步设计的早期基础设施。
显示更多