註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 強化学習
強化学習 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 強化学習 的搜尋結果
巴菲特卖光了 今晚去参加一对朋友的婚礼了,我已经很久没参加朋友的婚礼,毕竟40多岁的人,同龄的要么已经结了,要么离了,要么不打算婚了。 这次的新郎新娘都是内容行业的大v,男方是公众号平台的小声比比梓泉,女方是微博平台的闪光少女斯斯,各自都有几百万粉丝,两人都开了媒体公司,都很能挣,这样的组合在年轻人里大概是top0.1%级别的。 去之前我就被告知本次婚礼将进行线上直播,初听消息的时候我还愣了一下,但旋即释然,这大概就是年轻人的玩法。他们说这是一场人生并购的发布会,现场还挺有那种范的,前台签到,专人引导,拍照打卡墙,草坪布置了嘉宾发言环节,有专业的转播团队,架了五六个机位拍摄。 你们别看我线上每天对着几十万人逼逼赖赖,到了线下手里没有键盘就是个废物,老老实实领了一个社恐牌,避开镜头默默去墙角边站着。 现场到的嘉宾大都也是各个平台的主播大v,那些出镜的脸熟好认,往来寒暄社交颇为热闹,像我这样写博文的就低调多了,只要不说话站那边就是小透明。现场和我相熟能打上招呼的也就ayawawa,她和我是同龄人,聊天的时候随口提到mop,我笑着说不小心暴露年纪了 北京这边的习俗是早上结婚,中午吃饭,只有二婚才放晚上。但是比比(西安)和斯斯(徐州)都不是本地人,不讲究这个,另外我猜测可能是下午和晚上直播看的人会多一些,哈哈。现场能看出来,斯斯是那种对一个隆重的婚礼有很高期待的女生,比比则是尽力满足和取悦自己的新娘。 我注意到一个情况,就是这次的婚礼男女双方的家人似乎都没有来,来的都是内容行业的朋友,包括斯斯婚纱进场,通常都应该是父亲牵的,但这次现场牵她的是刘润。我寻思他两的婚礼可能有好几场,去老家和亲友们一场,在北京的这一场主要面向媒体。 这也是新时代网红大v的觉悟,愿意和网友分享自己人生的重要时刻,其实我也是,我虽然不拍视频不出镜,但我每天在生活里的喜怒哀乐也习惯在晚上的文章里和你们分享。 我问过梓泉,我现场拍的照片方便发吗,他说没问题,随便发。 话说今天路上坐车的时候,我妹妹也给我发了他和男友刚拍的结婚证件照,整挺好,两人打算年底领证。他两不是公众人物我就不发了哈。 今天真是个好日子,喜庆。 …… 简单捋一捋周末发生的事情。 1、根据CNBC的报道,巴菲特在上半年已经清仓比亚迪,全卖完了。巴菲特最早是在2008年以18亿港币抄底比亚迪,然后过去几年全部卖出累计套现600多亿港币,赚了超过35倍,年化收益超过20%。他对比亚迪的投资主要是好伙计芒格推荐的,不过在芒格去世之前就已经开始减仓比亚迪,至此巴菲特已经不再含有来自中国的仓位。 他历史上还在2002年买过中石油港股,2007年清仓,把分红算上的话赚了6倍。中石油第二年在a股上市,后面的事情你们都知道的。 巴菲特从来没买过a股,之前有人给他推荐茅台,他说自己考虑过,但最终没买。 2、我看了一些券商对国庆中秋假期的白酒销售分析,降速已有改善,下滑预期已经包含在股价里,进一步下修的空间小。说句你们能听懂的就是值博率在快速上升,但要注意牛市行情多半是跑不过科技板块的,比较适合不愿追高且有耐心的股民。 3、苹果17销售大超预期,是近几年来最受市场欢迎的机型,我一开始还以为有什么重大创新,结果看了一下产品介绍,这次受欢迎的原因就是“加量不加价”,配置升级了价格没涨,这不就是内卷嘛,好家伙苹果也放低身段了。 苹果要求代工厂立讯精密将日产量提高约40%,接下来果链可以乐观看高一线。另外立讯精密还有别的好消息,他们搭上了openAI,目前已经获得了至少一款openAI的产品组装合同。 4、始祖鸟(安踏旗下)一波反向营销上了热搜,联合蔡国强在喜马拉雅山搞了一波烟花表演,这几天被骂烂了。他们解释说材料环保并且有审批手续,但这种在神峰头上放烟花的行为就很迷,我说像市场公关和媒体品宣部门一定要找有网感的年轻人,不要让老登瞎胡闹,西贝贾国龙就是惨痛教训。老登们最好有自知之明,不要直接面对互联网,你们的思维已经锈了。 5、韩国核电站发生事故,我昨晚有分析,简单总结就是问题不大,影响可控,对a股核电板块应无大碍。 6、周五多只大盘股尾盘异动,新易盛、中际旭创、药明康德、百济神州拉升,中国核电、中国联通、万花化学大跌。这个是因为富时罗素50指数成分股调整造成的,但不是每一次调整都会有相同的波动,否则就很容易被套利。我盲猜可能就是一些被动基金工作疏忽忘记提前调整,最后卡点调仓,这个世界到处都是草台班子。 7、彭博社一篇报道说中国储户坐拥23万亿美元储蓄,正在小心翼翼重返a股,因为除了股票几乎没有更好的投资选择。这话有一定道理,房地产目前比a股还要磕碜,低利率正把储蓄资金往a股挤,但很多韭菜之前几波行情被伤的太深,轻易也不愿意回来,这是本轮行情一直热度起不来的原因。 我周五ic交割的时候减了3手ic,到目前为止一共减仓4手,还剩27手,后面接着涨就接着减。 就这些,发射。
顯示更多
统计了大家跑通的AI项目: 1. token中转站,海外账号代购 2.闲鱼代写论文,代做图,简历优化 3.做垂类产品,算命,帮捞女吊凯子,AI数字人带货 4.卖AI教程,卖教人用 AI 赚钱的课和知识星球门槛 5.搬运/生成内容,赚各平台流量收益 6. Al Trading 炒币,炒股,polymarket,跟单,数据监控 7. AI 起号崩老头 8. AI 做个性化学习工具(如考研/考公题库生成+错题分析),通过小程序或知识星球变现,复购和口碑传播都很强,比纯内容赛道更抗平台风控 9. AI P图和视频 10. 网盘拉群私域 11. 如图所示 “接软件定制” 🤡 还有其他的吗?
顯示更多
0
90
650
94
轉發到社區
😱有狠人花了2000多个小时,用强化学习训练了一个AI,专门去挑战赛车游戏Trackmania的人类世界纪录! 最绝的是,AI自己瞎跑根本赢不了,作者必须把人类顶尖选手的骚操作和极限技巧强行喂给AI吃,最后AI竟然真的以0.01秒的微弱优势干翻了世界第一! AI到底能不能超越人类创造?😂
顯示更多
扎克伯格为了逃避保镖,竟然跑去学开直升机!😱 小扎自曝被安保团队强行接送了10年,最后实在忍无可忍,直言“我需要自由,必须自己掌控方向盘。 有钱人的任性真的颠覆想象,嫌开车太慢直接上天。
顯示更多
OpenAI 后训练核心成员翁家翌(Jiayi Weng)以个人名义提出了一种名为「启发式学习」的强化学习新范式,并开源了全部实验代码。他用 Codex(GPT-5.4)反复玩 Atari 打砖块游戏,但 GPT-5.4 自始至终没有被重新训练过。真正在进步的,是 GPT-5.4 写出来的那套游戏策略代码。 流程是这样的:GPT-5.4 先写一版打砖块的 Python 策略,跑一局,看录像,找出哪里打丢了球,然后自己改代码再跑。经过几轮迭代,策略代码从 387 分涨到了 864 满分。全程没有任何神经网络被训练,纯靠 AI 反复修改 if-else 规则、调落点预测、加死循环检测。最终那套代码包含球路预测器、卡球检测器、回归测试和实验日志,已经长成了一个完整的软件系统。 这和传统强化学习的核心区别在于「学到的东西存在哪」。传统做法把知识压进神经网络参数里,人看不懂,学新任务还容易把旧的覆盖掉(即灾难性遗忘)。翁家翌的做法反过来:知识就是代码,人能读、能改、能加测试锁住,不会因为学新东西就丢了旧本领。 除了打砖块满分,他还在 MuJoCo Ant(模拟机器蚂蚁走路)上跑出超 6000 分的深度强化学习级成绩,在 Atari57 全套 57 个游戏上逼近了 PPO 基准。但翁家翌也明确画了边界:纯代码搞不定复杂感知任务,比如用 Python 写 if-else 去认图片。 他设想的终局是混合架构:底层用轻量神经网络负责视觉等感知,中层用启发式学习处理实时逻辑和安全规则,顶层由大模型审查日志、改代码,再周期性地用底层积累的高质量数据更新自身。过去手写规则之所以被淘汰,不是因为规则没用,而是人类维护不起。现在 AI 写代码够快够好,这条老路重新走得通了。
顯示更多
0
26
592
89
轉發到社區
英伟达专为支持基于智能体的AI系统而打造的CPU Vera,在沙盒表现性能为x86平台的1.8倍。适配智能体 AI、强化学习、数据处理、代码执行、沙盒运行等。 首款面向AI智能体的定制CPU,基于自研88 个Olympus自研核心,LPDDR5X 内存,带宽最高 1.2TB/s;任务速度为x86的1.8倍,能效与性能大幅提升。 承接Grace CPU成功经验(出货近250万片),面向超大规模AI负载。目前已全面量产,今年秋季上市。 Anthropic正在评估添加Vera以扩展CPU密集型智能体工作负载。
顯示更多
0
55
53
4
轉發到社區
在 w3 我一直很羡慕有技术底子的人,无论创业、看项目,还是把协议交互执行端,都有常人难以复制的优势。 Pantera领投1000 万种子轮的@Gradient_HQ,发布介绍了他们的分布式强化学习系统 Echo-2,仔细看了下除开技术层面不理解外,大概意思是一套分布式强化学习的创新框架,解决 AI 研究中核心成本与效率瓶颈。 Echo-2 把训练成本从几千美元降到几百美元,同样的钱可以多跑 10 次实验,让 AI 研发从赌一次变成“反复优化”。也就是说通过允许多次失败和迭代来实现AI研究的突破。 我一直相信降低成本,才有可能大规模采用。 之前跟他们核心团队交流过,技术人员占了团队的大多数,如果我是投资人我会认为未来潜力很大,值得持续跟踪。
顯示更多
0
14
37
0
轉發到社區
为什么 $digimon 值得购买?胖迪从从叙事以及市值空间上给大家深度解析👇 先上车再说!:👉WEmjxPMGXEW1Nvc4rCgRKiWHj1H1tvhPsKMw2yvpump 1️⃣叙事:AI+GameFi赛道龙一 $DIGIMON 将“虚拟世界+AI”完美融合,通过 LLM 和多智能体强化学习赋予虚拟角色生命力,这是传统链游升级!作为首个结合了“LLM+MARL”的链游,$DIGIMON 不只是炒概念,而是真正实现了技术落地。从 AI Hackathon 冲出的新星到 Solana 生态的重要成员,$DIGIMON 正在构筑“未来链游+AI”的叙事蓝图。 2️⃣团队:顶级开发背景加持 $DIGIMON 的开发团队堪称“Web2顶尖+Web3创新”的黄金组合: @0xethanlolomg:曾任 @PokemonGoApp AI 工程师,拥有 @Square 的 FinTech 背景,并在 Base 平台开发了头部项目 @sofamon_xyz@JerryPan2718:拥有 @databricks 的企业级数据经验,曾就职于顶级 VC @BainCapVC,且具备 @Stanford 学术背景。 两位核心开发者不仅资历深厚,更有对前沿技术的敏锐嗅觉,其履历已媲美 Solana 上的头部 AI 项目。 3️⃣资源和利好点:顶级支持&超高热度 $DIGIMON 不仅获得孵化实验室 @CohumanLabs 的大力支持,背后还有顶级机构 @a16zGames 站台背书,可能吸引大规模机构资金入场。 还有很多海外顶级KOL的支持!A16Z的加持! 同时具备上线一线大所的潜力! 4️⃣当前估值:充满想象的市值空间 目前市值:16M,处于历史新高阶段,但远未达到项目潜力顶点。对市场来讲,10多M已经横盘数周,目前就是第一阶段的共识价格!对比其他头部AI项目,不看100M简直对不起开发团队的努力和市场潜力。 大家拿稳坐好!等待1B🥳
顯示更多
0
24
28
11
轉發到社區