我最近重新理解了 AI 对早期产品的价值。
最近在创业的过程中,我越来越感觉到,AI 对产品团队的帮助,不只是提高效率。
我在做一款 AI 陪伴手链。
它不是普通饰品,也不是传统智能硬件。我更希望它是一种很轻的日常陪伴:在用户压力大、疲惫、需要一点情绪支撑的时候,用一种安静、不打扰的方式存在。
但这类产品早期最难的,往往不是“功能怎么写”,而是“感觉怎么表达”。
如果说得太功能化,它会像普通硬件;如果说得太情绪化,又容易空泛;如果表达偏一点,还可能被误解成纯玄学产品。
所以我最近测试 AI 模型时,不太想只问它标准问题。我更想看的是:它能不能理解一个真实产品的微妙边界,并把一个模糊想法推进成可以讨论的东西。
刚好 Ring-2.6-1T
@AntLingAGI 上线 OpenRouter,我就拿自己的产品做了一个小测试。
我给它的任务很简单:生成一个 ZenStellar AI 陪伴手链的产品展示网页,同时加入用户投票和反馈入口。
这个任务其实挺考验模型。因为我不想要一个普通饰品促销页,也不想让它走玄学、占卜、能量、星座那种方向。我想要的是温柔、治愈、克制,有一点未来感,但不能冷冰冰。
最后出来的页面,比我预期更接近我想要的方向。
它没有堆功能点,也没有写成广告,而是把重点放在“陪伴方式”上:微光呼吸、轻柔震动、温热触感、静默存在。页面里还有一个问题:“你希望它在什么时候陪伴你?”
这其实很接近我对 ZenStellar 的理解。
一个 AI 陪伴产品,真正需要验证的,可能不是用户喜不喜欢某个功能,而是用户愿不愿意在某些很日常、很私密、很脆弱的时刻,让它陪在身边。
当然,单次生成一个页面不能说明全部问题。真正让我愿意继续测 Ring-2.6-1T 的,是它在一些复杂任务评测里的表现:从数学推理、专业问答,到代码修复、搜索整合和多轮业务交互,都不是单纯考模型会不会“说得漂亮”,而是在看它能不能处理更长、更复杂、更接近真实工作的任务。
对我来说,这些 benchmark 更像是背景信号:它可能更适合被放进真实工作流里观察,而不是只拿来做普通聊天。
这也是我觉得 Ring-2.6-1T 值得测试的地方。
它的价值不只是生成内容,而是能参与产品早期的成型过程:帮你把抽象定位变成页面,把模糊感受变成用户问题,把脑子里的想法变成可以截图、可以讨论、可以继续修改的版本。
当然,产品判断还是要由人来做。比如 ZenStellar 不能过度承诺疗愈效果,也不能把陪伴说得太满。
但如果一个模型能帮我更快推出第一版表达,我就能更早看到问题,也能更早拿去问用户。
这次测试之后,我对 AI 工具的判断也更清楚了一点:
我不会只看它会不会写漂亮话,而是会看它能不能进入一个真实项目,理解边界,并把事情往前推一小步。
对早期产品来说,这一小步就很有价值。
体验地址 Ling Studio(Ring-2.6-1T Chat 体验现已开放,API 服务即将上线)