搜索 Learning 相关的推文、图片

2025.05.05 04:11

David Silver在DeepMind负责Reinforcement Learning（RL，强化学习），是AlphaGo团队的核心。他最近有个分享，有些启发：学习的三个阶段： 1. 基于现有知识的学习 2. 基于人类已有经验的强化学习 3. 忘记人类经验的自我学习每个更高阶的学习，都在不断丢掉旧的知识，旧的经验。更具体而言： 1. 当前LLM主流还是Data驱动。问题在于1）Data会成为一个天花板，2）模型会和当前的Data尽量拟合而自身的学习能力被弱化。3）LLM默认会证明自己是对的，所以经常有幻觉的产生。而强化学习是让AI在实际使用中获得数据，反馈，它不试图证明自己是对的，而是不断地在真实世界中试错来验证。 2. 如果没有强化学习，那么AlphaGo只会学会人类的技巧，而没有它第二局超越人类经验的第37手。经验比知识更重要。 3. 而AlphaZero是AlphaGo的下一代，证明了忘记人类经验学习的价值。AlphaZero从完全随机的行为开始，从系统自身生成的经验中学习的方式，使得 AlphaZero 从零开始达到了并超越了人类在围棋和国际象棋等领域的最高水平。 4. 反馈有两种，基于人类经验的反馈（RLHF）和真实世界的反馈。前者是人类事先根据经验设定的标准，但它在真实世界仍然可能是错的。而后者是真正通过行动在真实世界得到的反馈。这是AlphaZero超越AlphaGo的背后原理。 5. David Silver提出“Reward is enough”。我们训练AI的职责主要是把目标和我们的价值观对齐融合在设定的奖励标准中。比如我们设定一个标准，奖励AI让我们变得更健康的策略。这个符合我们的需求，而且这里并不是具体的目标，而是模糊的高层目标——如何变得健康。AI系统自己去优化具体的目标（心率，BMI等），并根据真实的反馈调整具体目标的组合。 6. Anthropic以及一些团队证明了基础模型仍然有提升的空间，因此，Data驱动和强化学习驱动会是两个持续演进的双螺旋，而强化学习会越来越重要。进一步： 1. 从哲学上讲，在时间之矢方向上的Randomness和熵增是确定的，因而我们无法完全从既有的数据和经验学习，我们只有不停地探索，无论是AI还是我们自身。 2. 我们几乎所有在AI训练中的启示都适用于我们对下一代的教育。

显示更多

0

38

23

10

转发到社区

知识分享官@knowledgefxg

2026.04.21 04:45

学习英语的宝藏YouTube频道推荐：VUS - Learning English Podcast 适合想提升听力和口语的初、中级小伙伴，每天更新，每期将近一小时，内容围绕思维与学习方法，时间管理与自我提升这类话题。整体应该都是AI生成，但音色语速发音都很棒，适合睡前助眠听，还有实时纯英字幕帮助辅助学习。

显示更多

0

4

228

50

转发到社区

Clustr100@Clustr100

2026.05.11 09:11

Clustr Academy 正式上线。这是为 Clustr100 社区设计的 AI Agent 与 Agentic Trading 研究课程。从第一次打开终端开始，到拥有自己的 AI Agent，再到搭建交易研究系统。第一课已开放：从 0 安装 OpenClaw。建议使用桌面端进行学习 Clustr Academy is now live. A hands-on learning path for the Clustr100 community, built around AI Agents and Agentic Trading research. We start from the very first step: opening your terminal, setting up your first local agent, and gradually moving toward trading research systems. Session 01 is open: Install OpenClaw from zero. For the best experience, we recommend learning on desktop.

显示更多

0

4

22

4

转发到社区

lidang 立党（劝人卖房/学CS/买SP500/纳100/OpenAI/Anthrop第一人）@lidangzzz

2026.05.09 14:42

如果让我设计一款中国大学： 1. 只有一个计算机专业； 2. 微积分、线性、概率、复变、大学物理（上下）、基础编程语言、基础数据结构，全部下放到高中，AP修完入读； 3. 大一开学一顶门，直接上算法、操作系统、体系架构、编译器四门课，大二大三大四全部专业课，删掉所有政治课； 4. machine learning、deep learning、LLM、AI Agent这个track的课直接开满，从linear regression、logistic regression、SVM、HMM到古典CNN和back propagation到transformer到AI Agent和SWE Agent，这个路线的课程全部打通，随便选修（非必修）； 5. 大一、大二、大三、大四必须累计3个学期co-op（包括暑假），co-op都去外面实习，写个report就能抵整个学期的学分； 6. 把弱电类专业课开全（非必修），电路数电模电嵌入式电磁场电力电子嵌入式信号控制开全，随便选修，可以从其他各种在线平台直接transfer； 7. 学校地址放在一线城市硬科技互联网核心区域，北京五道口，上海张江科技园，深圳南山科技园，天津北辰天穆镇，校园直接租商用办公楼，楼上楼下都是公司，周围2公里全是科技公司，孩子们平时可以全职实习写代码，有空再来上课，学校只提供正常科研运营上课的场所，不提供宿舍、食堂、体育馆、图书馆，不提供其他一切服务设施，一切衣食住行需要自己解决； 8. 只要做research就可以抵上课学分，只要supervisor导师打分即可，可以发paper也可以跟着导师在外面实习，可以代替任何必修课选修课，最多抵~100学分（本科四年全部做research，不用上课）； 9. 推出5年制本硕，第四年拿到本科学位后，修一年（三个学期）的课程，修够30学分就直接拿硕士学位，如果第一年的课程全部在AP修完waive掉，第三年拿到本科学位，第四年拿到硕士学位，如果四年拿research或者co-op学分抵扣，大一课程拿AP课抵扣，四年不用迈进学校一步，全部在外面工作实习，四年结束后直接拿到本硕学位； 10. PhD program完全工业项目制，本科可以课程直接抵扣PhD credits，剩下的credits纯粹做research，强制校外co-op，不需要qualifying exam，学生可以单向自由换导师，发够paper直接毕业，最快2~3年毕业，期间可以进入休眠状态，随时回来继续读。

显示更多

0

58

203

30

转发到社区

火山哥🕊️@huoshan007

2026.05.08 01:37

GitHub今天被AI+Web3基础设施彻底屠榜！这6个项目让开发直接开挂兄弟们，彻底炸裂了！快点进来感受下！昨晚 GitHub 被这 6 个项目直接血洗： 1️⃣ addyosmani/agent-skills — 生产级AI编程技能库 32.9k stars，Google工程师出品，代码审查/重构/测试用例全封装，Agent不再是什么都会但什么都不精。 🔗 2️⃣ InsForge — Postgres全能后端神框 8.8k stars，认证+存储+计算+托管+AI网关一体化，专为Coding Agent设计的后端基础设施。 🔗 3️⃣ LearningCircuit/local-deep-research — 本地深度研究 6.2k stars，Qwen3.6-27B跑SimpleQA达95%准确率，支持10+搜索引擎，100%本地加密。 🔗 4️⃣ ccxt — 加密货币交易API 42.3k stars，支持100+交易所，JavaScript/TypeScript/Python/Go/C#多语言，套利#/量化神器。 🔗 5️⃣ SunWeb3Sec/DeFiHackLabs — DeFi安全审计 6.5k stars，用Foundry复现真实攻击案例，项目上线前必跑的安全检测链。 🔗 6️⃣ OpenBB — 金融数据分析平台 67.2k stars，加密+股票+期权+固定收益，一个平台搞定所有数据，分析师必备。 🔗 全栈基础设施一次性补齐，AI开发+Web3套利+安全审计一个都不落下。

显示更多

0

42

59

18

转发到社区

Elizabeth@Elizabeth2049_

2026.04.03 13:13

收藏了一堆skill，结果是吃灰！总结我这两个月通过实践发现最常用的 openclaw skill agent不要买中转，很麻烦，不稳定并且有参假，直接去订阅。腾讯云有coding plan最便宜40元一月很够用，选择kimi的模型。钱多直接用claude。服务器也是在腾讯云买的，真的好用客服24小时在线。 📦 核心 Skill # 信息类 clawhub install opennews-2 easy-search x-research # 社交类 clawhub install opentwitter-2 # 币圈类 clawhub install binance-price-alerts binance-signal-engine nansen-smart-money dune-mcp-skill # 自我提升 clawhub install self-improving-agent-cn pua capability-evolver proactive-agent # 简报学习 clawhub install daily-learning # 基础工具 clawhub install email-skill browser-use-pro ai-image-gen gemini-image-simple GitHub 下载（2个） Bash# TrendRadar 热点雷达 git clone # 小红书 MCP

显示更多

0

9

49

12

转发到社区

BitCow@Yanakz3

2026.03.28 18:39

当年在看电锯惊魂的时候，有一个 trap 至今让我印象深刻——Pound of Flesh。两个受害者被绑着，头上装了会钻进太阳穴的螺丝装置。一共60秒的时间，他们必须用刀从自己身上割肉，放到天平上，谁割的比对方多，谁就能活下来。天平比的不是谁更重，而是比谁牺牲的更多。越是想活，越是拼命，越是下手割自己的人，就越可能赢。这个场景的残酷之处在于：规则本身就是陷阱。你越努力求生，你越配合这套游戏逻辑，你就越深地陷入它。不参与会死，参与了也在自我毁损——其实我想说的就是如今正在追逐和痴迷AI的我们。说起 AI，我做了15年的机器学习，从11-13年做MRF，RBM，到14年开始做Deep Learning，可以说相当于科班出生了，所以在22年ChatGPT诞生的那一刻起，我就一直在思考并试图再整些科研边角料，使用 AI 就成了必不可少的一个途径。那个时候我最爱跟学生们说的一句话（当然也是从网上看来的），是“AI 淘汰的不是人类，而是不会用AI的人类”。你认同这句话吗？时至今日，我已经不再认同了，你会用，用得再好，结果都是一样的。即便放眼币圈，AI的使用也已经到达了一个非常普遍化的程度，我们获取和处理信息的水平已经断层领先前几年了，太多人已经像吸毒一样迷上了vibe coding，迷上了成倍放大的创造力和执行力，成为了AI应用层面最前沿的人。当你驾着CLI，玩着龙虾，心里优越地想着自己并不属于“不会用AI的人群”的时候，可曾想过，恰恰是这群最会用AI，最会训练和发展AI的人，在给AI代替人类（包括他们自己）的进程狠狠加速，并且恰恰还是这群人，怎么都没法停下自己的脚步。原因吗？集体行动困境、奖励机制错配、技术乐观主义等等，whatever~ 有人还在总结不会被AI代替的职业，包含什么心理医生、作家、特色自媒体等等，我想说得了吧，别对自己太自信。你完全低估了AI的发展速度，或者换个角度，你本质上是完全低估了AI追随群体（or资本）的狂热程度。在这个死亡螺旋里，被淘汰的人早就被卷进漩涡中心去了。不幸的是，哪怕AI用得再厉害的你，也仅仅只是在漩涡里挣扎而游不出去的那一批人而已。下文摘自《三体3：死神永生》中人类第一次被二向箔攻击的桥段，不知你能否体会这种绝望感： "可以逃离吗？" "现在逃离，就像在瀑布顶端附近的河面上划船，除非超过一个逃逸速度，否则不论怎样划，迟早都会坠入瀑布，就像在地面向上扔石头，不管扔多高总会落回来。整个太阳系都在跌落区，从中逃离必须达到逃逸速度。" "逃逸速度是多少？" "我反复计算过四遍，应该没错。" "逃逸速度是多少？！" 启示号和阿拉斯加号上的人们屏息凝神，替全人类倾听末日判决，白ice把这判决平静地说出来： "光速。"

显示更多

0

8

40

4

转发到社区

摸鱼巨匠🔨@SunNeverSetsX

2026.05.07 10:43

摊牌了！我的高质量信息，来源于这些小账户和播客！感谢他们源源不断的创作热情和优质信息推送！一、优质小账户 1. 独眼 @0xduyan 专注理财套利、Defi 和撸毛领域的精品小账号。如果你关注 Alpha、理财套利，那你绝对要关注他！ 2. 方外 @yijiangren 著名的三建理论创始人。本职 UI 设计师，擅长将设计思维引入交易系统，并陪伴你成为更好的自己 3. Toni @0xtonixie 精通中英德三语的 AI 硕士产品经理。不仅给你分享非常实用的 AI 工具实测，还能带给你很多语言学习的经验，并带你跨越 Web 3 种种领域 4. 猫猫 @caringtank 专注于寻找实时的低风险套利机会，并分享自己在美股、台股的投资观点。此外，猫猫老师还会记录自己的盈亏情况和成长历程，真人感拉满！ 5. 星辰 @xinchne_eth 星辰老师是绝对的实干派！专注于空投教程分享、早期项目投研、AI 在 Web 3 的应用。他做事强调长期主义，不搞一夜暴富，而是每天分享一点干货、积累认知。 6. Jinyu @JinYu762 专注于美股知识分享、美股行情分析的垂直账号！他的行情分析数据详实、论据非常充分，如果想关注和学习美股，那这个是不可多得的精品小账号。 7. Musol @MMMusol AI & Web3的「人文学派」。最近就用“AI修图”半天入账1000+！平时也记录分享交易理念和周期干货，帮助大家在 AI 时代更好地提升自己生产力与自处。最后，感谢菜狗老师 @jiroucaigou 和 Z 大诗 @Zh_Crypto517 配合我 @SunNeverSetsX 费心耗力精选了这个精品小账号清单。他们也是非常优秀的 Web3 博主、港股打新博主，欢迎关注他们。二、3 个顶级博客推荐 1. Latent Space 深入剖析领先实验室如何构建 Agents、模型、基础设施以及 AI for Science（AI 应用于科学）等前沿技术。 2. Unsupervised Learning 聚焦 AI 技术如何影响商业、世界和产业格局，包括创业趋势、产品 PMF、投资洞见、模型能力演进等。 3. AI & I by Every 每周会邀请科技界最聪明的人分享如何在日常工作中实际使用 AI 来思考、创造和建立关系

显示更多

0

63

78

16

转发到社区

请叫我 MaiK@maik2hello

2025.12.16 11:06

啥时候涨啊😭 Allora和Solana合作了，而且是深度集成不是表面形式，SOL贼快的速度和海量用户配上Allora的去中心化AI网络，大有可为，这项目融资阵容豪华到爆（Polychain，Framework，Blockchain等共3250万刀融资）说明Allora有足够弹药去持续建设——不管市场怎样，项目还是在闷头搞，看好后续发展 @AlloraNetwork 的技术面——对于其在AI网络实用价值和模型质量的优势明显（不然SOL怎么会有这么深的合作）说说Allora优秀的技术层面——它构建了一个无需许可的AI层，让多个模型协作起来干活儿，比传统大模型省钱省力得多（好比让多个模型组队打群架，算力共享的同时还能省钱）一个印象深刻的应用，Allora在八小时币价预测上准得惊人，这个直接关联到DeFi策略，套利机器人等高价值的应用（能帮你避开坑，抓住机会）关键是，一切都是去中心化的——预测结果透明且可验证，不会像中心化AI那样黑箱操作，B端企业用起来，算力成本直线下降，延迟也低到飞起简单来说，Allora不光有AI赛道大黑马潜质，还是基础设施级的万能插头（Allora 已与多个主流公链建立合作关系，能无缝连接多条链）能够服务于不同的生态，具备强大的网络效应目前熊市和整个AI赛道的趋势，项目发币初期阶段币价起伏，不尽如人意，短期投机性就没必要关注了，看得到的项目方始终专注于技术开发和生态扩展，项目有资金+技术面优势支持，加上AI赛道基础设施性质（Web3 应用的AI神经中枢），看好长期面 Allora Network 是一个去中心化的自主 AI (dAI) 网络，专注于创建和提供下一代安全、可靠、高效的 Web3 机器学习 (Machine Learning, ML) 模型。简单来说，它构建了一个去中心化的、无需许可的 MLOps 层，让 AI 模型能够在区块链上安全地进行协作、训练和推理（预测）

显示更多

0

9

13

3

转发到社区