注册并分享邀请链接,可获得视频播放与邀请奖励。

0xTodd ( thinking )
@0xTodd
热衷研究 | 在 @researchnothing 琢磨策略 | 在 @ebunker_eth 打包区块 | Long BTC, Love the World | NFA
加入 September 2016
3K 正在关注    71.6K 粉丝
我觉得做自媒体一定要严谨,不然迟早就被 AI 的幻觉骗地团团转。 这个故事有 N 个 Bug,居然还在传播。 我阅读了 Knuth 老爷子的原文,主要问题如下: 首先,这特么就不是一个困扰学界 N 年的顶级难题,更不是什么哥德巴赫猜想。 它就是老爷子写的教材《计算机程序设计艺术》里的一道练习题,让读者解决有向哈密顿环。 而且老爷子给了 m=3 的情况,让读者自己算算其他情况。 老爷子确实提到了“我算了几个礼拜”。 但是!你要知道,他今年 88 高龄了,他几个礼拜算出一个答案已经很不错了。 试想,你 88 岁的时候还能高强度算数学么?连牛顿都不行,牛顿晚年就不搞物理了,在研究炼金和神学了。😂 而且报道里说 86 岁,也是不负责任,他出生于 1938 年,今年 88,虚岁 89。 而且,接下来,报道给出了最迷惑性的内容: 它仿佛在暗示,好像 AI 自己一下秒杀了这个题目。 实际上,在原文里,奇数是 Filip Stappers、偶数是 Ho Boon Suan 两位数学背景的人士分别解决的,他们确实分别使用了 Claude 和 GPT。 但是这是两位数学背景的人士好么? 这两位已经有了一些想法,让 AI 来助力而已。普通人拿 AI 是不可能破解的。 ----分割线---- 而且,我对这两位的工作也有些顾虑(只是轻微的)。 其一,老爷子原文提到:“Filip 还告诉我,在奇数情况解决后,他让 AI 继续研究偶数情况。但在那之后,过了一会儿它似乎卡住了。最后,它甚至无法正确编写和运行探索程序”。 这才是我们熟悉的 AI 好么?😂——上下文超了。 根据我的经验,上下文快塞满之后,那 AI 的记忆和智商都不剩啥了。 其二,老爷子原文提到:“(AI 生成的 14 页论文) Ho 说这完全是机器完成的;他不需要以任何方式编辑论文。” 这是最恐怖的😨。 我在工作中最怕的就是,有人突然甩过来一个十几页的 AI 写的长篇论文。 你们扪心自问,AI 一下子生成出这种完美论文的概率有多大? 对于这种 AI 长文,我并没有时间仔细去看这些证明,相信你也不会有时间的,恐怕老爷子也同样未必有时间。 AI 它是一个大语言模型,擅长处理语言,它最特别的就是它会圆谎,让你以为这是正确的。 所以对此我存有一定的轻微疑问。 不过,如果说这几位研究人员和学者确实真的,通过 AI 解决了这么一道题目,我也乐于道歉。 我凭借自己经验,感觉这个故事,幻觉含量略高,我内心希望这事更加严谨一点。 ----分割线---- 当然了,即便他们真的解决了这个问题。这也只是一道教材上的、面向读者的开放题目而已,并没有报道中渲染的那么困难。 如果这就得出学术界就是缺算力的结论,恐怕有些武断。
显示更多
86岁的算法大师 Donald Knuth,终于把自己当年挖的一个大坑填上了。 这个困了学界很久的哈密顿分解问题,被解出来了。但这次,不是人硬算出来的。研究员让两套AI一起干活: Claude 负责找路径,GPT-5.4 负责一条条验证、整理逻辑、写成严谨证明。两个AI模型来回拉扯,最后硬是把这道题凿穿了。GPT最后直接交了一篇14页的完整论文,结构、推导、证明都很规范,连专业圈子都挑不出明显问题。Knuth看完,只给了一个评价:没毛病。 看完以后只有感慨,感觉过去很多看起来高大上的科研只是在充算力。。。
显示更多