注册并分享邀请链接,可获得视频播放与邀请奖励。

艾略特
@elliotchen100
Building @EverMind - memory for self-evolving agents
991 正在关注    25.7K 粉丝
Raycast 刚出了 2.0 beta,语音输入在 beta 期间完全免费,快快体验。 之前说 @raycast 最打动我的地方,不是某个大功能,而是它对 dev 日常 flow 里那些极小动作的尊重。 这次最关注的,其实不是 “Raycast 也做了语音输入”,而是 Raycast + Dictation 这件事在我看来本身几乎是完美组合。 现在大家都在讲 Computer use,讲 AI 直接替人操作电脑。但我越来越觉得,真正好的 AI native 产品,不应该让人失去“手感”,而是把人的 flow 放大。 语音输入也是一样。 如果 Dictation 只是一个悬浮窗、一个输入法、一个 speech-to-text 工具,那它当然有价值,但它仍然是一个外挂。但 Raycast 不一样,它本来就在系统入口、应用切换、剪切板、搜索、命令、快捷键这些最贴近日常 workflow 的位置上。 当语音输入长在这个位置上,它就不只是“把声音转成文字”了。 它可以有 Custom Instructions,告诉系统我的听写应该偏正式还是偏口语,要不要自动分段,怎么处理格式;可以有 App Context,根据当前我是在写代码、写邮件、写文档,去理解不同的专业词和上下文;可以有 Vocabulary,把 Raycast、公司名、同事名字、产品名这些专有名词稳定识别出来。 更重要的是,它可以有 Styles。 同样一段话,在邮件里应该像邮件,在 IM 里应该像消息,在会议纪要里应该像纪要,在 todo 里应该像任务列表。Auto Styling、Create Style、Email / Messaging 这些东西,听起来都是小功能,但实际上都在解决同一个问题:语音输入不应该只是转写,而应该理解“我现在在哪个工作流里”。 这就很 Raycast。
显示更多
Raycast 2.0 (beta) is now publicly available for download. 👉
设计狮狮你好,@EverMind 招 UI/UX 设计实习生 🟡 如果你看过某些 AI 产品,心里默默想过 「这玩意儿明明可以好看十倍」,欢迎来跟我们一起做。 会 Figma,对 AI 好奇,审美在线就行。年限不是门槛,品味才是。 简历 + 作品集 👉 yanbing.li@evermind.ai
显示更多
突然发现在 @raycast 的剪切板里面,选中要粘贴的内容后,用 option + enter 粘贴的话,原剪贴板的窗口不会被关掉,这样即可直接选取另一个剪切内容,太走心了。 这个软件在面向 dev 的使用习惯上打磨得真夸张,各种细节都强到有点可怕。 哎,如果有一天,大家都用 Computer use,而感受不到对于人类 flow 里面的细节之美的走心设计,会失去不少乐趣。
显示更多
锤这篇是我最近看到讲 Agent 记忆讲得最清楚的中文文章。 利益相关,文章里那个 EverOS 就是我们 @EverMind 做的,补三个点: 1. 那个 93.05% 的 LoCoMo 准确率不是论文宣传数字,是开源仓库里就能跑的脚本,谁都能复现。 2. Skill 自进化第一次喂轨迹只出 case,要跑够几次同类任务才会蒸馏出 skill,很多人接进去看不到 skill 以为是坏了。 3. 彩蛋:月底有酷炫产品上线,弱不酷炫,我包红包🧧。
显示更多
0
3
152
24
转发到社区
顺便说下,这个长期记忆用的是 @evermind 😎
终于让我找到了一个AI-native企业协同办公软件了!! 事情是这样的,今年愚人节那天,我朋友的Slack工作区被锁死了!! 几年和客户的聊天记录,大家做决策的过程,公司的知识库,没就没了。 更可怕的是随着这些数字资产消失,企业的 AI 提效将变为空谈。 他开始疯狂找替代品,飞书、钉钉、企微,挨个试遍。 突然他意识到:只要数据还在别人服务器上,就有可能说没就没 他问我:有没有一个能把数据紧紧握在手里协同办公软件? 我推荐他用Tanka AI替代Slack,因为他们承诺:数据完全归用户所有,支持完整导出。 而且,它还我梦寐以求的企业级别的 AI 功能,在我看来简直是一个AI-native 公司操作系统。
显示更多
OpenAI 凌晨上了一个叫 Daybreak 的东西。4 小时 1M 浏览,不过讨论区基本没在讨论这到底是什么。 整体看下来,关键不在 「OpenAI 发了一个新产品」,而在 「OpenAI 在 cyber AI 这个最敏感的话题上,终于跟 Anthropic 划了一条清晰的线」。 1. Daybreak 不是一个产品,是一把伞 Greg Brockman 自己 (@gdb) 在回帖里给出了官方解释,「umbrella effort for defensive acceleration」。 底下放的是 OpenAI 的几个 frontier 模型,Codex,加一票安全合作伙伴的整套防御能力。所以严格说 「Daybreak 是什么」 这个问题答不上来。它是一个 「OpenAI 在 cyber 这一格里的所有动作」 的统称。 这个 umbrella framing 本身值得玩味,留到第 4 点说。 2. Anthropic 和 OpenAI 在 cyber 这件事上走了两条岔路 过去两年 Anthropic 反复强调 cyber 能力的 dual use 风险,是他们 frontier 模型里最克制释放的部分。 OpenAI 这次的回答是 「我打包成一个面向防御方的产品给企业」。 评论区里 @kimmonismus 写了一段戏仿,意思是 「Anthropic 关门做研究说能力太强不能放,OpenAI 已经发布了一整套 verified access 的产品线让你扫 repo 找 bug」。戏仿夸张,但抓得对。 两种处理方式都站得住: Anthropic 派,默认锁死,dual use 没法验意图。 OpenAI 派,默认放出,用 「verified tier」 加监管验身份。 接下来三年的 AI 政策辩论,基本都会在这两个立场之间往复。 3. 「Burning down security backlogs」 这个 framing 戳穿了真实痛点 每个开发团队都有一份 「迟早出事,但现在没人管」 的 security 待办。CVE 一大堆,依赖升级拖了 6 个月,配置漂移没人查,老代码里埋着 5 年前的 SQL injection。 Daybreak 真正在卖的,不是 「我帮你防黑客」,是 「我帮你清这堆破事」。后者比前者实在 10 倍,共鸣也强 10 倍。 每个 security team 的 PM,看到 「burning down backlogs」 这句话的瞬间,预算就开始动了。这是 OpenAI 一贯的本事,用 product manager 的语言写公告,不用 researcher 的语言。 4. 真正的护城河在攻防训练集 回到第 1 点那个 「umbrella」 的设计。它不是一个产品名,是一个收数据的容器。 你把你的 codebase 让 Daybreak 扫,OpenAI 看到的不只是你的代码,是 「这家公司的代码长这样,有这些 vulnerability pattern,patch 成这样就修好了」。 这是世界上最稀缺的训练数据,比所有开源代码加起来都值钱。 Anthropic 用 「不释放」 换安全声誉。OpenAI 用 「释放 + 收数据」 换攻防飞轮。两边都在算大账,只是账的方向不同。 小总结 Daybreak 把 cyber AI 这件事,从一个政策问题变成了一个产品问题。
显示更多
Introducing Daybreak: frontier AI for cyber defenders. Daybreak brings together the most capable OpenAI models, Codex, and our security partners to accelerate cyber defense and continuously secure software. A step toward a future where security teams can move at the speed defense demands.
显示更多
老板急得亲自发帖招人了,伙计们可以接着投递哈 1. 技术型产品经理,Agent 产品经理,C 端 B 端都看看 2. Agent 开发工程师,解决方案架构师,前后端,全栈 3. 运营,增长,开发者关系都需要 现在也考虑招兼职和各种实习
显示更多
EverMind is Hiring: Technical PM (Agent OS & Memory) Based in Silicon Valley | Shanghai | Beijing What we need: Tech + Product: Deeply understand Agent execution mechanics under the hood (OpenClaw/Hermes Agent is a +). AI-Native: Fluent in Vibe Coding. You can spin up working demos yourself to validate concepts. LTM Focus: Intensely driven to build an Agent OS with true Long-Term Memory. Flexible setup: Open to part-time/intern as a trial. DM me to chat!
显示更多
我们在这 4 个地方招人,职位很多,活儿很多,如果你能用 AI 武装自己成为小小全能手,请大胆投递简历。 P.S. 最近事儿比较多,之前投递的简历会陆续安排面试,表急表急。 借用了 @dotey 老师的提示词
显示更多
0
16
64
6
转发到社区
稍微剧透一下 1. @EverMind 的 MSA 论文被 AlphaXiv 选中发表了,流量还非常不错 2. MSA 的 Inference 本周会开源
0
7
82
10
转发到社区
我们昨天在 arXiv 上发了一篇新论文,填补了一个一直没人做的空白:多人、多群组场景下的记忆测试。 简单科普一下为什么这件事重要 之前测 AI 记忆能力的 benchmark,基本都是"两个人聊天"的场景: LoCoMo(2024):最早系统测试多轮对话记忆,但本质上就是两个人对话,上下文约 16K tokens,规模偏小 LongMemEval(2024,ICLR 2025):把规模推到了 115K–1.5M tokens,定义了五个核心记忆能力,但仍然是一对一对话 问题是,现实世界不是这样的。你同时在多个群聊里,跟不同的人聊不同的事,AI 能记住谁在哪个群说了什么吗? 这就是 EverMemBench 要回答的问题。 下图是我用 @claudeai 最新功能生成的,你还别说,挺好看。
显示更多
0
4
96
12
转发到社区