TwiScan
熱門
社區
登入
註冊
English
日本語
한국의
简体中文
繁体中文
註冊並分享邀請連結,可獲得影片播放與邀請獎勵。
立即註冊
檢索結果
互关,漏fo请私信。
互关,漏fo请私信。 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含
互关,漏fo请私信。
的搜尋結果
Kithe
@kuk47377341
2026.05.11 00:29
GM~ 新的一周继续冲! 主打一个有关必回, 没及时回关的老师抱歉,关注太快平台会限制不让关注, 一直在慢慢补关 漏了的直接评论区@我, 看到秒回 2w就在眼前,冲冲冲! #
蓝v互关
#
顯示更多
0
0
188
165
3
轉發到社區
寻宝记录官
@clexas_raccoon
2026.05.15 06:13
#
蓝V互关
# 永不取消, 漏了的评论下 互关互动走起! 你关注我必回关你。
0
0
2
3
0
轉發到社區
凤九歌🔶BNB
@liuwan9898
2026.04.19 22:49
#
蓝V互关
# 推特关注限制速度, 漏了的评论区走一波。 陆陆续续都会关注上的 大家也可以在评论区互关。
0
0
1
1
0
轉發到社區
沐光钱行 | TMT
@pprgb888
2026.05.13 05:27
第2⃣季 #
蓝V互关
# 想 #
互关的
# 宝儿们 评论区留言 ,挨个回关 昨天如果有漏的 及时提醒一下🫶 先冲个万粉 努力做内容 ──────────── 📊 目前进度 3740 / 1000 ██████████░░░░░░░░░░] 37.4% ──────────── #
FollowBack
# #
follow
# #
蓝V
#
顯示更多
0
0
211
104
3
轉發到社區
李继刚
@lijigang
2026.05.05 03:22
日读论文: From Context to Skills: Can Language Models Learn from Context Skillfully? (Ctx2Skill) 互斗写书,越斗越偏 ──────── 医生想用一份刚出的临床指南调整治疗方案。50 页文档,密密麻麻全是术语,规则之间还交叉引用。他真正需要的是把"什么病合什么药"变成几条能照着走的步骤。直接把整份指南扔给 GPT-5.1 让它答题,全 benchmark 平均对率 21%——大模型读完了,用不出来。这不是它"长上下文"不行,是 *它没把规则提炼成可以反复调用的小手册*。 老办法是把人类标注员请来给文档画重点:把规则、流程、注意事项提炼成自然语言"技能",附在 prompt 前面给模型用。但这条路有两个死结:一是*标注成本爆炸*——50 页技术文档,标注员要把整套领域逻辑读到能复述,几小时才标一份;500 份这么搞,人累死也搞不完。二是*没有外部反馈*——如果想让 AI 自动写技能,怎么验证它提炼对了?没有 ground truth、没有执行结果、没有标准答案,它瞎写你都不知道。已有的"自动写技能"方法(AutoSkill、SkillX 等)都需要环境给反馈信号——比如"代码跑出来对不对""任务完成没"——可面对一份纯文档,没人替你判对错。 作者说不需要外人。让模型自己跟自己打——一个出题,一个解题,第三方判 pass/fail。每一回合,错题让解题方反省"我漏了什么知识",过得太轻松的题让出题方反省"我出题不够刁"。两边各自维护一份自然语言的"技能手册",回合结束之后改写各自的手册。这套循环不依赖人类标注,也不依赖任务本身的对错反馈—— *只用模型互相之间的胜负就能把技能写出来*。 ──────── 按常识,5 个回合互相磨练完,第 5 回合的 Reasoner 手册应该最强吧? 错。论文做了固定回合的对照实验(GPT-4.1):*单调下降*。越练越差。 为什么?作者起了个名字: *adversarial collapse*——对抗坍缩。Challenger 越来越凶,开始出"考钻牛角尖"的题;Reasoner 为了应付这些极端题,把手册改得越来越歪——专为对付怪题而存在的条目挤掉了通用知识。两边都在围着一个不代表真实任务分布的"病态点"打转。 更阴险的是, *这种崩塌在循环内部察觉不到*——Judge 每一回合只看当前题,没有信号告诉你"之前学会的事是不是被新条目挤丢了"。 ** 怎么找回早期的好手册:Cross-Time Replay 既然不能信"最后一版",得回头挑。但凭什么挑? 办法:在 5 个回合里偷偷攒两套小探针—— - *Hard probe*:每回合败得最惨(评分点通过率最低)的那道题 - *Easy probe*:每回合解得最轻松(评分点最少)的那道题 循环跑完,把 5 个版本的 Reasoner 手册*回去重做*这两套探针。每个版本算两个分:在难题集上的解题率 ρ_h、在易题集上的解题率 ρ_e。 *选哪一版?* 让 ρ_h × ρ_e 最大的那一版赢。 为什么是乘积不是相加?*乘积惩罚"舍弱保强"*——一个版本如果为了多解几道难题、把易题做塌了,乘积立刻塌(一个 0 拉低全场);加法只算总分,掩盖短板。消融:换成加法 → -0.6%。 ──────── *你的对手如果只服你一个人,他会变成你的镜子,不是你的镜鉴*。 Self-play 跑久了,Challenger 出的题不再代表真实世界,只代表 Reasoner 当下还不会的边角;Reasoner 的手册也不再是知识,只是这场私局的应试手册。两个人在屋里关久了,一起走进自己造的回音壁。 破解的办法不在循环里——*在循环之外保留一份"代表性参照"*,回头挑哪一版没飘走。Cross-Time Replay 是这个论文真正的灵魂,不是某个技术细节。它在说:*对抗优化必须配一个不参与对抗的判别器*,否则一定会塌。这个判别器不一定是人,可以是从对抗自己内部偷出来的、有代表性的小样本——但它必须独立于"当下这一刻在追什么"。
顯示更多
0
0
1
39
1
轉發到社區
Justin|MGBX
@Listing_MGBX
2026.05.15 05:28
互关我们新同事
@Yiyi_VIP
她可以在线秒回关! 华语X 还有我没关注的人? 那是不可能的吧? 所有X上的朋友都被关注了 继续互关,今日搞起来 提一嘴 MGBX队长正在招募 席位不多了 抓紧,截止本月20号前 推上我就你的永远朋友
顯示更多
0
0
73
47
0
轉發到社區
happy
@happy5757428804
2026.05.14 01:44
互关互赞1、主动关注别人 2、评论、点赞、转发,有曝光才有更多互粉 3、互粉留言,每个人我都会关注#
互粉
# #
互关必回
# #
互关#
#
0
0
0
1
0
轉發到社區
yitong(互fo)
@yinyinxcb314
2026.05.14 01:38
互关互助呀!我要冲破20000粉!#
互关
#
0
0
1
2
0
轉發到社區
女娲补胎
@wenhao6016
2026.05.12 00:48
互关,有关必定会回。被限制了,限制解除慢慢回。 #
蓝v互关
#
0
0
0
1
0
轉發到社區
幸运小财神
@bigbig_liu
2025.02.24 08:03
#
互关贴
# 冲5000粉 1、主动关注别人 2、评论、点赞、转发,有曝光才有更多互粉 3、互粉留言,每个人我都会关注💯 #
互关
# #
互粉
# #
互关必回
# #
Bitcoin📷
#<📷
顯示更多
0
0
7
9
0
轉發到社區
載入中...