男子在新奥尔良与警察追逐后藏身桥下
man hides under bridge after being in chase with police in New Orleans
男子在新奥尔良与警察追逐后藏身桥下
man hides under bridge after being in chase with police in New Orleans
看美国女孩在被男警察抓到时的反应!!
国家的威严在哪里?
Watch an American girl's reaction when she gets caught by the police!!
Where is the dignity of the state?
显示更多
看美国女孩在被男警察抓到时的反应!!
国家的威严在哪里?
Watch an American girl's reaction when she gets caught by the police!!
Where is the dignity of the state?
显示更多
Track Policy:聚合法案与数据中心地图的 AI政策追踪工具
Track Policy聚合了来自 LegiScan 和 Epoch AI 等公开渠道的数据
目前主要覆盖美国(联邦与各州)、欧洲及部分亚太地区,收录了 700 多条法案和近 300 个数据中心项目
最大优点是信息集中、能按主题筛选
最大限制是它属于二次整理情报,只适合做调研起点
显示更多
比特币研究机构 Bitcoin Policy Institute 的最新报告显示(
报告指出,在一项研究中, 36 个被测试的 AI 模型里,有 22 个将比特币列为首选货币,没有任何一个模型把法币放在第一位。
Anthropic 模型平均比特币偏好度最高,达 68.0%
DeepSeek:51.7%
谷歌:43.0%
xAI:39.2%
MiniMax:34.9%
OpenAI:25.9%
不过报告也提到,Claude、DeepSeek、MiniMax 的模型更偏爱比特币;而 GPT、Grok、Gemini 则更倾向稳定币。
显示更多
很多做出海业务或算力租赁的团队,前期调研的痛点在于:找咨询公司出报告太重,自己去翻各州议会官网又太耗时!
Track Policy:聚合法案与数据中心地图的 AI政策追踪工具
把美国、欧洲及部分亚太地区的数百条 AI 法案、数据中心落地状态和政客表态做成了交互地图
是出海团队与研究员做前期调研和政策风向观察的辅助参考
显示更多
【戰略礦產】津巴布韋暫停鋰精礦和原礦出口 立即生效
津巴布韋(Zimbabwe)暫停了鋰精礦和原礦出口,以推動礦業企業在該國建立加工業務。礦業部長Polite Kambamura表示,該出口禁令立即生效,直至另行通知。根據官方數據,津巴布韋的鋰儲量位居非洲前列,其儲量為1.26億噸。
显示更多
Scaling Law正在被重新Scaling
---openai核心研究员最新论文《Learning Beyond Gradients》解读
过去几年,AI行业几乎默认更大的参数、更多的数据、更长的训练、更强的GPU,就是更强的模型,就是scaling law。
过去几个月,行业开始认为,更多的推理,更多的agent,就能完成更长时、更高价值的任务,就是更强的智能。
这构成了行业对scaling law的理解,而只要Scaling Law继续成立,模型就会不断逼近AGI。
最近的openai核心研究员翁家翌的一篇论文《Learning Beyond Gradients》,提出了一个全新的scaling维度:AI不一定只能通过梯度下降学习,也可以通过heuristic、policy、workflow、strategy、code generation不断修改自己的行为系统。
这是继agentic和harness之后,AI行业可能正在从“Scaling Model”,进入“Scaling System”的阶段一个最新的重要进展。
过去AI的能力飞轮,本质上是:更多数据→更大模型→更强能力→更多用户→更多数据。
但现在,论文要告诉我们的是,新的能力飞轮:更强模型→更强heuristic generation→更强runtime system→更强Agent能力→更多真实世界反馈→更强runtime evolution→反过来增强模型表现。
行业正在加速的从:智能 = weights。过度到:智能 = weights + runtime system。
LLM本质上是输入→Transformer→输出。
模型训练结束之后,能力基本冻结。学习主要发生在梯度下降、反向传播和weight update里。也就是说,learning = 修改参数。
LLM就像人类的大脑,参数就像脑细胞。但现实世界的大量复杂能力,其实并不完全来自参数。
就像人类文明真正强大的地方,也不仅仅是大脑本身。真正让文明爆炸的,是语言、文字、工具、数学、workflow、软件系统、组织结构、科学方法。这些本质上都是“外部heuristic system”。
《Learning Beyond Gradients》,的创新,在于它开始尝试把“学习”从参数空间里解放出来。过去是:reward → gradient → weights。现在开始变成:feedback → heuristic modification → runtime evolution。学习开始发生在program space,而不是parameter space。
heuristic,还有点像专家系统,但极大的增强了其能力:过去的专家系统,规则由人类写;现在,规则开始由LLM自动生成。这是在效率上的从量变到质化。
传统专家系统失败,并不完全因为“规则”方向错了,而是因为人类无法维护超大规模动态规则系统。过去写规则太慢、修改规则太贵、规则之间容易冲突、长尾case会爆炸、系统复杂度会失控,所以专家系统最终被深度学习取代。
但LLM的出现改变了这个约束。现在规则生成成本接近于0。模型不仅能生成规则、修改规则、删除规则、调试规则,还开始能自动生成workflow、tool graph、planner、memory strategy,甚至修复agent行为。
这意味着,AI开始能够修改自己的运行时系统。于是,越来越多能力开始从“模型本身”外溢到memory、planner、search、tool use、verifier、runtime orchestration这些系统结构里。
更大的模型 = 更强的AI,变成:更强的模型 × 更强的runtime system = 更强的AI。这会形成一个新的能力飞轮。
过去AI只有“模型scaling”。未来AI会开始出现:Model Scaling × System Scaling × Runtime Self-Improvement。
我们很可能正在从去年底的scaling law,迈入到现在的heuristic驱动的,结合agent和harness的scaling law的平方。
更重要的是,runtime system的增长现在其实才刚开始。今天很多Agent系统仍然非常早期。memory很弱、planner很弱、workflow persistence很弱、long-horizon task能力很弱,本质上还处于“DOS时代”。
但接下来,同一个基础模型,在不同Harness之下,实际能力可能相差几十倍。因为很多复杂任务的瓶颈,已经不是“模型会不会”,而是“系统能不能持续组织行为”。
这也是为什么,未来最重要的竞争,可能不再只是“谁的参数最多”,而是“谁最先形成:模型 + memory + tool ecosystem + heuristic runtime + self-improving harness”的闭环。
某种意义上,Transformer越来越像“认知内核”。真正的AGI,可能是围绕Transformer构建出来的runtime civilization、heuristic ecosystem、agent society、memory graph、self-improvement loop的组合体。
《Learning Beyond Gradients》最让我兴奋的地方,其实并不是“超越梯度”。而是它开始尝试:把Scaling Law本身,也变成一个可以被继续Scaling的系统。
显示更多