註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 challenge
challenge 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 challenge 的搜尋結果
New heart shape challenge 填空了 信女愿成为你家里的__?
0
19
506
6
轉發到社區
sandbank 东京的机房又被 OpenAI challenge 了,看来我必须得想个根本的办法可以让多用户的 codex 账户都能在云端沙箱中运行而不会触发 OpenAI 风控才行。
我的东京 sandbank 机房 ip 被 cloudflare challenge 了,一天还没好,无法访问任何 codex/cc 相关域名😳导致今天 wanman 一直无法运行,有没有朋友知道遇到此类问题 cf 多久能恢复呢?
顯示更多
我研究了下 @TermMaxFi XP 玩法,这个项目不能只理解成“签到刷 XP”。 纯属个人研究,不构成投资建议。 如果你只是想每天签到混点积分,也不是不能做,但别期待回报特别大。 我个人建议,至少准备 150 USDT,会比较容易把核心任务一起完成。 ——————————————— TermMax 本质上做的是: 固定利率借贷。 大白话说, 普通 DeFi(去中心化金融,像不用银行的链上金融市场)借贷里, 利率是会变的。 你今天看到 5%, 明天可能变成 12%。 TermMax 想解决的是: 借钱、放贷、做收益之前, 先把利率和到期时间说清楚。 这样你至少知道: 这笔钱借到什么时候, 利息大概怎么算, 什么时候必须处理。 所以它不是单纯的任务站。 它是把任务绑在真实产品上。 ——————————————— 现在最核心的活动, 是 Puzzle Challenge。 逻辑很简单: 做完 4 个任务, 集齐 4 块拼图, 最后解锁 Puzzle Master。 全部完成后, 最高可以拿到 1.76M XP(活跃积分)+ 4K MP(社交积分)。 四个任务分别是: · Check-in(签到) · Post(发帖) · Borrow(借贷) · Earn / Vault(金库存款) ——————————————— 第一个任务:签到。 每天去 Leaderboard 页面, 点一下 Check-in(签到)。 累计 10 天起步。 后面 20 天、30 天, 还有额外奖励。 这个基本没资金风险。 新手可以先做。 ——————————————— 第二个任务:发帖。 在 X 上发一条和 TermMax Puzzle Challenge 相关的内容, 带上: #TermMaxPuzzleChallenge# 然后把推文链接提交回 Leaderboard 页面。 这个主要是拿 MP(社交积分)。 简单理解, 就是项目想鼓励你产出内容, 不是只做链上交互。 ——————————————— 第三个任务:Borrow(借贷)。 这个地方新手最容易看不懂。 简单说: 你先拿一部分资产当抵押品, 然后从协议里借出一部分钱。 只要你的借贷仓位价值不低于 50 美元, 并且累计保持 15 天, 就能完成 Borrow(借贷)任务。 但这里一定要注意: 不要借满。 不要梭哈。 不要为了积分把自己搞到快清算。 Borrow(借贷)这个任务, 本质上是让你体验产品, 不是让你重仓赌博。 ——————————————— 我自己理解下来, 如果你想舒服一点做核心任务, 至少准备 150 USDT 会比较合理。 大概这样分: 70~100 USDT 做 Borrow(借贷) 80 USDT 做 Vault(金库存款) 再留一点 Gas(链上手续费,像过路费) 为什么 Borrow(借贷)不建议刚好卡 50U? 因为价格会波动。 如果仓位价值低于任务门槛, 可能会影响任务完成。 所以宁愿多留一点缓冲。 别把自己卡得太死。 ——————————————— 我截图里这个, 就是我的 Borrow(借贷)仓位页面。 新手看这类页面, 别被一堆英文吓到。 重点只看几个数字。 Collateral(抵押品): 我这里抵押的是 0.150 WBNB。 简单说,就是我拿 BNB 当押金。 Debt(债务): 我这里借了 51.464 USDT。 这就是我欠协议的钱,到期前要还。 Maturity(到期日): 我这个仓位到期日是 2026 年 7 月 31 日。 到期前要 repay(还款)或者 close(关闭仓位)。 Health Factor(健康因子): 我这里是 1.47。 这个数字可以理解成仓位安全垫。 越高越安全,越接近 1 越危险。 Liquidation Threshold(清算阈值): 我这里显示 457.46。 这不是说我亏了 457U。 它更接近于: 如果 BNB 跌到 457U 附近, 我的抵押品价值可能不够, 仓位就会进入危险区, 系统可能会强制清算。 ——————————————— 截图里还有一个按钮: Remove Collateral(解除抵押)。 新手不要乱点。 它的意思是, 把一部分抵押品拿出来。 听起来像是提高资金效率, 但代价是: 你的 Health Factor(健康因子)会下降, 清算风险会变高。 所以我的做法很简单: 抵押多一点, 借少一点, 只做任务门槛。 做满 15 天后, 记得还款或者关闭仓位。 ——————————————— 第四个任务:Earn / Vault(金库存款)。 这个任务相对简单。 进入 Vault(金库)页面, 选一个 Vault(金库), 存入不低于 80 美元的资产, 然后连续放满 15 天。 注意: 中途取出, 时间会重新计算。 所以放进去之后, 最好先别乱动。 但 Vault(金库)也不是银行存款。 它更像是把钱放进一个策略池, 收益依赖策略管理人, 极端情况下也可能亏。 ——————————————— 所以我对 TermMax 的理解是: 签到和发帖, 基本没什么资金风险。 Borrow(借贷)和 Vault(金库), 是真实链上操作, 不是白嫖按钮。 Borrow(借贷)有清算风险。 Vault(金库)有策略风险。 Alpha(交易区)更不适合新手乱点。 ——————————————— TermMax 现在也不只有 XP(活跃积分)。 几个东西要分清: XP(活跃积分): 更像日常使用分。 AP(Alpha 交易积分): 更偏交易活跃分。 MP(社交积分): 更偏内容和社交分。 Pre-mine(预挖奖励): 可以理解成发币前, 先给早期参与用户记一笔账。 所以真正想参与未来空投, 不是只刷签到。 而是尽量覆盖: · 签到 · 发帖 · Vault(金库) · Borrow(借贷) · 小额 Alpha(交易区)交互 · 徽章任务 想签到的直达链接: ——————————————— 但别搞错了。 积分不等于确定空投。 任务奖励不等于最终代币。 高 XP(活跃积分)也不代表一定能赚。 如果做任务的过程中, 能顺便让我理解一个产品, 我愿意小资金参与学习一下。 ——————————————— TermMax 这波, 我自己的定位很简单: 小资金试水。 顺便学习固定利率借贷。 不要上头。 不要重仓。 不要为了积分把本金赔进去。 新手记住一句话就够了: 能白嫖的先白嫖; 要押钱的只做最低门槛; #TermMaxPuzzleChallenge#
顯示更多
BNBCHAIN网络上限为16m gas,人数太多远超预期,导致烧图后无法获得代币。 加之过早的弃权合约及锁定池子,后续无法更改。 现已全部迁移至新合约:0xDbCf533123Ca4D3F826206E3a870B9A76fEDbcc1 旧合约持仓已全部1:1空投。 之前进行过以图换币的地址,已全部于新合约自动兑现,请查看钱包。 代币池已1:1全部迁移。 BNBCHAIN开发的难度重重,经过不懈努力,现已解决全部问题,池子已锁,请查看合约。 尽全力进行开发,奈何BNB网络原生受到的支持太少,问题重重,不过依然在全力以赴。 —— The BNB Chain network has a gas limit of 16 million. Due to the number of participants far exceeding expectations, users were unable to receive tokens after burning their images. Additionally, the contract ownership was renounced and the liquidity pool was locked too early, making any subsequent changes impossible. Everything has now been fully migrated to the new contract: 0xDbCf533123Ca4D3F826206E3a870B9A76fEDbcc1 All holdings from the old contract have been airdropped 1:1. Addresses that previously exchanged images for tokens have all been automatically redeemed in the new contract. Please check your wallet.The token pool has been fully migrated at a 1:1 ratio. Developing on BNB Chain presented numerous challenges. After relentless efforts, all issues have now been resolved. The liquidity pool has been locked. Please check the contract.
顯示更多
日读论文: From Context to Skills: Can Language Models Learn from Context Skillfully? (Ctx2Skill) 互斗写书,越斗越偏 ──────── 医生想用一份刚出的临床指南调整治疗方案。50 页文档,密密麻麻全是术语,规则之间还交叉引用。他真正需要的是把"什么病合什么药"变成几条能照着走的步骤。直接把整份指南扔给 GPT-5.1 让它答题,全 benchmark 平均对率 21%——大模型读完了,用不出来。这不是它"长上下文"不行,是 *它没把规则提炼成可以反复调用的小手册*。 老办法是把人类标注员请来给文档画重点:把规则、流程、注意事项提炼成自然语言"技能",附在 prompt 前面给模型用。但这条路有两个死结:一是*标注成本爆炸*——50 页技术文档,标注员要把整套领域逻辑读到能复述,几小时才标一份;500 份这么搞,人累死也搞不完。二是*没有外部反馈*——如果想让 AI 自动写技能,怎么验证它提炼对了?没有 ground truth、没有执行结果、没有标准答案,它瞎写你都不知道。已有的"自动写技能"方法(AutoSkill、SkillX 等)都需要环境给反馈信号——比如"代码跑出来对不对""任务完成没"——可面对一份纯文档,没人替你判对错。 作者说不需要外人。让模型自己跟自己打——一个出题,一个解题,第三方判 pass/fail。每一回合,错题让解题方反省"我漏了什么知识",过得太轻松的题让出题方反省"我出题不够刁"。两边各自维护一份自然语言的"技能手册",回合结束之后改写各自的手册。这套循环不依赖人类标注,也不依赖任务本身的对错反馈—— *只用模型互相之间的胜负就能把技能写出来*。 ──────── 按常识,5 个回合互相磨练完,第 5 回合的 Reasoner 手册应该最强吧? 错。论文做了固定回合的对照实验(GPT-4.1):*单调下降*。越练越差。 为什么?作者起了个名字: *adversarial collapse*——对抗坍缩。Challenger 越来越凶,开始出"考钻牛角尖"的题;Reasoner 为了应付这些极端题,把手册改得越来越歪——专为对付怪题而存在的条目挤掉了通用知识。两边都在围着一个不代表真实任务分布的"病态点"打转。 更阴险的是, *这种崩塌在循环内部察觉不到*——Judge 每一回合只看当前题,没有信号告诉你"之前学会的事是不是被新条目挤丢了"。 ** 怎么找回早期的好手册:Cross-Time Replay 既然不能信"最后一版",得回头挑。但凭什么挑? 办法:在 5 个回合里偷偷攒两套小探针—— - *Hard probe*:每回合败得最惨(评分点通过率最低)的那道题 - *Easy probe*:每回合解得最轻松(评分点最少)的那道题 循环跑完,把 5 个版本的 Reasoner 手册*回去重做*这两套探针。每个版本算两个分:在难题集上的解题率 ρ_h、在易题集上的解题率 ρ_e。 *选哪一版?* 让 ρ_h × ρ_e 最大的那一版赢。 为什么是乘积不是相加?*乘积惩罚"舍弱保强"*——一个版本如果为了多解几道难题、把易题做塌了,乘积立刻塌(一个 0 拉低全场);加法只算总分,掩盖短板。消融:换成加法 → -0.6%。 ──────── *你的对手如果只服你一个人,他会变成你的镜子,不是你的镜鉴*。 Self-play 跑久了,Challenger 出的题不再代表真实世界,只代表 Reasoner 当下还不会的边角;Reasoner 的手册也不再是知识,只是这场私局的应试手册。两个人在屋里关久了,一起走进自己造的回音壁。 破解的办法不在循环里——*在循环之外保留一份"代表性参照"*,回头挑哪一版没飘走。Cross-Time Replay 是这个论文真正的灵魂,不是某个技术细节。它在说:*对抗优化必须配一个不参与对抗的判别器*,否则一定会塌。这个判别器不一定是人,可以是从对抗自己内部偷出来的、有代表性的小样本——但它必须独立于"当下这一刻在追什么"。
顯示更多
聚焦在现有工作上用coding Agent去解决,是一条错误道路,人类已经把能吃的红利吃差不多了, 接下来就是无尽的人指令-agent执行-人指令-agent执行的iteration中逐渐迭代工作,很难把人从这种小幅度高强度反复的iteration中解放出来。 因为现有codebase不仅高度复杂,而且人的大部分命令都是高度模糊、 高度开放、高度自由、无法验证的命令, 场景也是高度开放、高度自由、无法在containers中直接测试跑一跑,必须在真实世界中获得反馈才能继续修改工作。 所以我最近半年一直坚持反复告诉大家: 1. 在现有所有大型科技互联网软硬件移动外包平台coding agent的红利很快就吃完,现有人类像唱山歌一样和claude code高强度一问一答的模式,就是短期内的最优解——像full self coding一样大量agent并行完成coding工作,不会带来更多的收益; 2. 在coding agent很快增长和红利消失的大前提下,人类如果想继续把AI Agent和multi agent的红利吃干抹净,必须持续找到有价值的新领域、新方向、新问题: A. 同时满足问题定义简单干净、环境封闭、非常非常易于verify、问题解决方案搜索空间巨大的复杂问题,让goal-driven( 前提是易于verify,必须用很低的成本去verify最终输出是否正确,保持持续验证这个criteria,给予正确的反馈和无限工作循环的核心条件,直到完整完成工作; B. 能够把multi agent的并行度吃干抹净,一次性1000个agent大批量初始化和启动,在一些setup中持续活跃,保持multi agent的可观测性, 除了openclaw时代就臭大街的各种爬虫以外,还有行为经济学、社会学、心理学、教育学、法学等等大规模试验,不由分说充足token,先初始化1000个agent模拟跑几天,观察一些初步结论; C. 就像我半年前说的价值10万刀的策略:把一切人类社会中遇到的所有问题,整理成文档、表格、图片、文字、structured data,让一些富有经验、富有memory的coding agent(就是claude code和codex本人)进行一步步解决, 你始终要明白,现阶段的头部coding agent已经足够复杂、 足够高级、机制足够完善,AI Agent已经经历了4~5轮工业革命,完善到整个industry其他任何生态和框架继续手搓的任何agent都像一个玩具,只要一个claude code/codex一个文件夹+一个docker/kubernete,就是未来一切企业和流程中的general agent; 3. 有一点几乎被所有人忽略,也是我近几个月意识到的问题。 在经典deep learning时代,一些产业对于经典neural network和baysian model有天然的不信任感和敌意,他们会非常激进、偏执地要求一切machine learning的模型尽可能地跟随可解释性、AI伦理、因果推断等等方向。 在AI Agent时代,越是激进使用的人,越是对AI Agent产出的代码、报告、分析、数据、结论产生严重的怀疑, 因此不只是GPT model需要superalignment,LLM Agent本身更需要superalignment,在Agent时代,superalignment的重要性会越来越高, 而且AI Agent产出和workflow的可解释性需求也会越来越高,最最基础浅表的就是各种问答chatbot的来源引用,今后其他越来越复杂的工作,包括coding本身,都会有可解释性的大量问题涌现, 一种方式是尽可能用formal verification或者prover的形式来自动化验证, 一种是用agentical的验证方式,就像人一样去用一个或者多个agent来反复review和challenge一项工作; 4. 还有一点很多人没想到,就是AI Agent会对人施加反过来的影响。 比如office出现后,普通人要求用office三件套来完成工作,office重塑了人类办公的基本流程和规范, 比如出现了google之后的早期,普通人要学会正确输入搜索关键词,把想问的问题拆分成正确的关键词,以获得正确query的结果(后来google反复做了优化,这个技能也逐渐不重要), 比如social network出现之后,人们学会了全新的交友方式、social network的交友礼仪、聊天方式, 所以在AI Agent时代,人最重要的技能,没有之一,就是如何正确使用AI Agent、挑选正确的模型、使用正确的工具、组建正确的prompt、描述正确的问题、输入充足完备的信息、如何用goal-driven去构建一套dual-agent的简单无休止infinite-loop workflow, 一个不会正确定义问题、不会正确输入足够多的信息、不能让AI Agent在一个边界清晰的闭包问题中正确工作、持续工作的人,天天拿AI Agent当成无所不知的万能神、百宝箱、随机神、超人,除了问弱智问题,就是玩猜猜看、问宏大开放的无异议问题, 这种人大概率会被这个时代逐渐淘汰掉。
顯示更多
0
12
128
21
轉發到社區
我的 sandbank 东京服务器终于被 cf 解除 challage 了,做云端沙箱的 agent matrix 真的好麻烦,相比而言 local first 产品就没有这些复杂的网络问题。