注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 Learning
Learning 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 Learning 的推特
David Silver在DeepMind负责Reinforcement Learning(RL,强化学习),是AlphaGo团队的核心。他最近有个分享,有些启发: 学习的三个阶段: 1. 基于现有知识的学习 2. 基于人类已有经验的强化学习 3. 忘记人类经验的自我学习 每个更高阶的学习,都在不断丢掉旧的知识,旧的经验。 更具体而言: 1. 当前LLM主流还是Data驱动。问题在于1)Data会成为一个天花板,2)模型会和当前的Data尽量拟合而自身的学习能力被弱化。3)LLM默认会证明自己是对的,所以经常有幻觉的产生。而强化学习是让AI在实际使用中获得数据,反馈,它不试图证明自己是对的,而是不断地在真实世界中试错来验证。 2. 如果没有强化学习,那么AlphaGo只会学会人类的技巧,而没有它第二局超越人类经验的第37手。经验比知识更重要。 3. 而AlphaZero是AlphaGo的下一代,证明了忘记人类经验学习的价值。AlphaZero从完全随机的行为开始,从系统自身生成的经验中学习的方式,使得 AlphaZero 从零开始达到了并超越了人类在围棋和国际象棋等领域的最高水平。 4. 反馈有两种,基于人类经验的反馈(RLHF)和真实世界的反馈。前者是人类事先根据经验设定的标准,但它在真实世界仍然可能是错的。而后者是真正通过行动在真实世界得到的反馈。这是AlphaZero超越AlphaGo的背后原理。 5. David Silver提出“Reward is enough”。我们训练AI的职责主要是把目标和我们的价值观对齐融合在设定的奖励标准中。比如我们设定一个标准,奖励AI让我们变得更健康的策略。这个符合我们的需求,而且这里并不是具体的目标,而是模糊的高层目标——如何变得健康。AI系统自己去优化具体的目标(心率,BMI等),并根据真实的反馈调整具体目标的组合。 6. Anthropic以及一些团队证明了基础模型仍然有提升的空间,因此,Data驱动和强化学习驱动会是两个持续演进的双螺旋,而强化学习会越来越重要。 进一步: 1. 从哲学上讲,在时间之矢方向上的Randomness和熵增是确定的,因而我们无法完全从既有的数据和经验学习,我们只有不停地探索,无论是AI还是我们自身。 2. 我们几乎所有在AI训练中的启示都适用于我们对下一代的教育。
显示更多
0
38
23
10
转发到社区
学习英语的宝藏YouTube频道推荐:VUS - Learning English Podcast 适合想提升听力和口语的初、中级小伙伴,每天更新,每期将近一小时,内容围绕思维与学习方法,时间管理与自我提升这类话题。整体应该都是AI生成,但音色语速发音都很棒,适合睡前助眠听,还有实时纯英字幕帮助辅助学习。
显示更多
0
4
228
50
转发到社区
Clustr Academy 正式上线。 这是为 Clustr100 社区设计的 AI Agent 与 Agentic Trading 研究课程。 从第一次打开终端开始, 到拥有自己的 AI Agent, 再到搭建交易研究系统。 第一课已开放: 从 0 安装 OpenClaw。 建议使用桌面端进行学习 Clustr Academy is now live. A hands-on learning path for the Clustr100 community, built around AI Agents and Agentic Trading research. We start from the very first step: opening your terminal, setting up your first local agent, and gradually moving toward trading research systems. Session 01 is open: Install OpenClaw from zero. For the best experience, we recommend learning on desktop.
显示更多
如果让我设计一款中国大学: 1. 只有一个计算机专业; 2. 微积分、线性、概率、复变、大学物理(上下)、基础编程语言、基础数据结构,全部下放到高中,AP修完入读; 3. 大一开学一顶门,直接上算法、操作系统、体系架构、编译器四门课,大二大三大四全部专业课,删掉所有政治课; 4. machine learning、deep learning、LLM、AI Agent这个track的课直接开满,从linear regression、logistic regression、SVM、HMM到古典CNN和back propagation到transformer到AI Agent和SWE Agent,这个路线的课程全部打通,随便选修(非必修); 5. 大一、大二、大三、大四必须累计3个学期co-op(包括暑假),co-op都去外面实习,写个report就能抵整个学期的学分; 6. 把弱电类专业课开全(非必修),电路数电模电嵌入式电磁场电力电子嵌入式信号控制开全,随便选修,可以从其他各种在线平台直接transfer; 7. 学校地址放在一线城市硬科技互联网核心区域,北京五道口,上海张江科技园,深圳南山科技园,天津北辰天穆镇, 校园直接租商用办公楼,楼上楼下都是公司,周围2公里全是科技公司,孩子们平时可以全职实习写代码,有空再来上课, 学校只提供正常科研运营上课的场所,不提供宿舍、食堂、体育馆、图书馆,不提供其他一切服务设施,一切衣食住行需要自己解决; 8. 只要做research就可以抵上课学分,只要supervisor导师打分即可,可以发paper也可以跟着导师在外面实习,可以代替任何必修课选修课,最多抵~100学分(本科四年全部做research,不用上课); 9. 推出5年制本硕,第四年拿到本科学位后,修一年(三个学期)的课程,修够30学分就直接拿硕士学位, 如果第一年的课程全部在AP修完waive掉,第三年拿到本科学位,第四年拿到硕士学位, 如果四年拿research或者co-op学分抵扣,大一课程拿AP课抵扣,四年不用迈进学校一步,全部在外面工作实习,四年结束后直接拿到本硕学位; 10. PhD program完全工业项目制,本科可以课程直接抵扣PhD credits,剩下的credits纯粹做research,强制校外co-op,不需要qualifying exam,学生可以单向自由换导师,发够paper直接毕业,最快2~3年毕业,期间可以进入休眠状态,随时回来继续读。
显示更多
0
58
203
30
转发到社区
GitHub今天被AI+Web3基础设施彻底屠榜!这6个项目让开发直接开挂 兄弟们,彻底炸裂了!快点进来感受下! 昨晚 GitHub 被这 6 个项目直接血洗: 1️⃣ addyosmani/agent-skills — 生产级AI编程技能库 32.9k stars,Google工程师出品,代码审查/重构/测试用例全封装,Agent不再是什么都会但什么都不精。 🔗 2️⃣ InsForge — Postgres全能后端神框 8.8k stars,认证+存储+计算+托管+AI网关一体化,专为Coding Agent设计的后端基础设施。 🔗 3️⃣ LearningCircuit/local-deep-research — 本地深度研究 6.2k stars,Qwen3.6-27B跑SimpleQA达95%准确率,支持10+搜索引擎,100%本地加密。 🔗 4️⃣ ccxt — 加密货币交易API 42.3k stars,支持100+交易所,JavaScript/TypeScript/Python/Go/C#多语言,套利#/量化神器。 🔗 5️⃣ SunWeb3Sec/DeFiHackLabs — DeFi安全审计 6.5k stars,用Foundry复现真实攻击案例,项目上线前必跑的安全检测链。 🔗 6️⃣ OpenBB — 金融数据分析平台 67.2k stars,加密+股票+期权+固定收益,一个平台搞定所有数据,分析师必备。 🔗 全栈基础设施一次性补齐,AI开发+Web3套利+安全审计一个都不落下。
显示更多
0
42
59
18
转发到社区
收藏了一堆skill,结果是吃灰!总结我这两个月通过实践发现 最常用的 openclaw skill agent不要买中转,很麻烦,不稳定并且有参假,直接去订阅。腾讯云有coding plan最便宜40元一月很够用,选择kimi的模型。钱多直接用claude。服务器也是在腾讯云买的,真的好用客服24小时在线。 📦 核心 Skill # 信息类 clawhub install opennews-2 easy-search x-research # 社交类 clawhub install opentwitter-2 # 币圈类 clawhub install binance-price-alerts binance-signal-engine nansen-smart-money dune-mcp-skill # 自我提升 clawhub install self-improving-agent-cn pua capability-evolver proactive-agent # 简报学习 clawhub install daily-learning # 基础工具 clawhub install email-skill browser-use-pro ai-image-gen gemini-image-simple GitHub 下载(2个) Bash# TrendRadar 热点雷达 git clone # 小红书 MCP
显示更多
0
9
49
12
转发到社区
当年在看电锯惊魂的时候,有一个 trap 至今让我印象深刻——Pound of Flesh。 两个受害者被绑着,头上装了会钻进太阳穴的螺丝装置。一共60秒的时间,他们必须用刀从自己身上割肉,放到天平上,谁割的比对方多,谁就能活下来。天平比的不是谁更重,而是比谁牺牲的更多。越是想活,越是拼命,越是下手割自己的人,就越可能赢。 这个场景的残酷之处在于:规则本身就是陷阱。你越努力求生,你越配合这套游戏逻辑,你就越深地陷入它。不参与会死,参与了也在自我毁损——其实我想说的就是如今正在追逐和痴迷AI的我们。 说起 AI,我做了15年的机器学习,从11-13年做MRF,RBM,到14年开始做Deep Learning,可以说相当于科班出生了,所以在22年ChatGPT诞生的那一刻起,我就一直在思考并试图再整些科研边角料,使用 AI 就成了必不可少的一个途径。 那个时候我最爱跟学生们说的一句话(当然也是从网上看来的),是“AI 淘汰的不是人类,而是不会用AI的人类”。 你认同这句话吗?时至今日,我已经不再认同了,你会用,用得再好,结果都是一样的。 即便放眼币圈,AI的使用也已经到达了一个非常普遍化的程度,我们获取和处理信息的水平已经断层领先前几年了,太多人已经像吸毒一样迷上了vibe coding,迷上了成倍放大的创造力和执行力,成为了AI应用层面最前沿的人。 当你驾着CLI,玩着龙虾,心里优越地想着自己并不属于“不会用AI的人群”的时候,可曾想过,恰恰是这群最会用AI,最会训练和发展AI的人,在给AI代替人类(包括他们自己)的进程狠狠加速,并且恰恰还是这群人,怎么都没法停下自己的脚步。 原因吗?集体行动困境、奖励机制错配、技术乐观主义等等,whatever~ 有人还在总结不会被AI代替的职业,包含什么心理医生、作家、特色自媒体等等,我想说得了吧,别对自己太自信。你完全低估了AI的发展速度,或者换个角度,你本质上是完全低估了AI追随群体(or资本)的狂热程度。 在这个死亡螺旋里,被淘汰的人早就被卷进漩涡中心去了。不幸的是,哪怕AI用得再厉害的你,也仅仅只是在漩涡里挣扎而游不出去的那一批人而已。 下文摘自《三体3:死神永生》中人类第一次被二向箔攻击的桥段,不知你能否体会这种绝望感: "可以逃离吗?" "现在逃离,就像在瀑布顶端附近的河面上划船,除非超过一个逃逸速度,否则不论怎样划,迟早都会坠入瀑布,就像在地面向上扔石头,不管扔多高总会落回来。整个太阳系都在跌落区,从中逃离必须达到逃逸速度。" "逃逸速度是多少?" "我反复计算过四遍,应该没错。" "逃逸速度是多少?!" 启示号和阿拉斯加号上的人们屏息凝神,替全人类倾听末日判决,白ice把这判决平静地说出来: "光速。"
显示更多
摊牌了!我的高质量信息,来源于这些小账户和播客! 感谢他们源源不断的创作热情和优质信息推送! 一、优质小账户 1. 独眼 @0xduyan 专注理财套利、Defi 和撸毛领域的精品小账号。如果你关注 Alpha、理财套利,那你绝对要关注他! 2. 方外 @yijiangren 著名的三建理论创始人。本职 UI 设计师,擅长将设计思维引入交易系统,并陪伴你成为更好的自己 3. Toni @0xtonixie 精通中英德三语的 AI 硕士产品经理。不仅给你分享非常实用的 AI 工具实测,还能带给你很多语言学习的经验,并带你跨越 Web 3 种种领域 4. 猫猫 @caringtank 专注于寻找实时的低风险套利机会,并分享自己在美股、台股的投资观点。此外,猫猫老师还会记录自己的盈亏情况和成长历程,真人感拉满! 5. 星辰 @xinchne_eth 星辰老师是绝对的实干派!专注于空投教程分享、早期项目投研、AI 在 Web 3 的应用。他做事强调长期主义,不搞一夜暴富,而是每天分享一点干货、积累认知。 6. Jinyu @JinYu762 专注于美股知识分享、美股行情分析的垂直账号!他的行情分析数据详实、论据非常充分,如果想关注和学习美股,那这个是不可多得的精品小账号。 7. Musol @MMMusol AI & Web3的「人文学派」。最近就用“AI修图”半天入账1000+!平时也记录分享交易理念和周期干货,帮助大家在 AI 时代更好地提升自己生产力与自处。 最后,感谢菜狗老师 @jiroucaigou 和 Z 大诗 @Zh_Crypto517 配合我 @SunNeverSetsX 费心耗力精选了这个精品小账号清单。 他们也是非常优秀的 Web3 博主、港股打新博主,欢迎关注他们。 二、3 个顶级博客推荐 1. Latent Space 深入剖析领先实验室如何构建 Agents、模型、基础设施 以及 AI for Science(AI 应用于科学) 等前沿技术。 2. Unsupervised Learning 聚焦 AI 技术如何影响商业、世界和产业格局,包括创业趋势、产品 PMF、投资洞见、模型能力演进等。 3. AI & I by Every 每周会邀请科技界最聪明的人分享如何在日常工作中实际使用 AI 来思考、创造和建立关系
显示更多
0
63
78
16
转发到社区
啥时候涨啊😭 Allora和Solana合作了,而且是深度集成不是表面形式,SOL贼快的速度和海量用户配上Allora的去中心化AI网络,大有可为,这项目融资阵容豪华到爆(Polychain,Framework,Blockchain等共3250万刀融资)说明Allora有足够弹药去持续建设——不管市场怎样,项目还是在闷头搞,看好后续发展 @AlloraNetwork 的技术面——对于其在AI网络实用价值和模型质量的优势明显(不然SOL怎么会有这么深的合作) 说说Allora优秀的技术层面——它构建了一个无需许可的AI层,让多个模型协作起来干活儿,比传统大模型省钱省力得多(好比让多个模型组队打群架,算力共享的同时还能省钱)一个印象深刻的应用,Allora在八小时币价预测上准得惊人,这个直接关联到DeFi策略,套利机器人等高价值的应用(能帮你避开坑,抓住机会)关键是,一切都是去中心化的——预测结果透明且可验证,不会像中心化AI那样黑箱操作,B端企业用起来,算力成本直线下降,延迟也低到飞起 简单来说,Allora不光有AI赛道大黑马潜质,还是基础设施级的万能插头(Allora 已与多个主流公链建立合作关系,能无缝连接多条链)能够服务于不同的生态,具备强大的网络效应 目前熊市和整个AI赛道的趋势,项目发币初期阶段币价起伏,不尽如人意,短期投机性就没必要关注了,看得到的项目方始终专注于技术开发和生态扩展,项目有资金+技术面优势支持,加上AI赛道基础设施性质(Web3 应用的AI神经中枢),看好长期面 Allora Network 是一个去中心化的自主 AI (dAI) 网络,专注于创建和提供下一代安全、可靠、高效的 Web3 机器学习 (Machine Learning, ML) 模型。简单来说,它构建了一个去中心化的、无需许可的 MLOps 层,让 AI 模型能够在区块链上安全地进行协作、训练和推理(预测)
显示更多