TwiScan
Hot
Communities
Account collections
Login
Register
English
日本語
한국의
简体中文
繁体中文
Register and share your invite link to earn from video plays and referrals.
Register now
阑夕
@foxshuo
说什么是你的自由,做什么是我的权利,如果我做的得不到你的赞同,那就对了,否则我将与你一样平淡无奇。
Joined August 2009
774
Following
172.9K
Followers
阑夕
@foxshuo
2025.03.05 01:56
此时就需要补充一个推理模型的特点了,那就是推理模型的训练过程特别注重奖惩机制,通过思维链的暴露我们也能看出它通常都会想得缜密、生怕自己没有摸清用户意图,以致于经常到了「谄媚」的程度。 这种训练模式的好处在于,可以让推理模型拥有举一反三的能力,能够更加灵活和完善的去完成任务,但是相对的,为了完成任务,推理模型也会在「不自知」的情况下,同时表现出欺骗性,当用户要求它写一篇作文时,哪怕缺少论据,它也会为了不辜负用户的指令,去自行编造一些材料出来,以便于自圆其说。 这就是大模型行业至今仍在致力于解决的「幻觉」现象。 下图就是一个经典用例,用户为DeepSeek-R1设立了阿里估值逻辑改变的靶心,于是DeepSeek-R1就逼迫自己去对着靶心射箭——它不会也不能反驳用户,或是质疑阿里的估值逻辑到底变没变——于是就「情不得已」的编造出了可以用来证明用户观点的数据。(4/n)
Show more
0
0
5
47
2
Forward to community
Most Popular Users
Serenity
@aleabitoreddit
568.4K Followers
New York Post
@nypost
3.9M Followers
billboard
@billboard
15.4M Followers
TEAM JAY PARK
@Team_JayPark
12.2K Followers
甜怡 ヤンイ댱이🐹✨
@DyangYi
153.6K Followers
DAESUNG
@d_lable
88.8K Followers
麻衣𝐌𝐚𝐢💖
@mai_chan_cos
28.9K Followers
미료 Miryo
@MIRYOakaJOHONEY
98.7K Followers
AKB48公式
@AKB48_staff
247.1K Followers
gugudan(구구단)
@gu9udan
119K Followers
Girls' Generation
@GirlsGeneration
3.3M Followers
JO KWON
@2AMkwon
981.2K Followers
ENHYPEN OFFICIAL
@ENHYPEN
8.2M Followers
Sandara Park
@krungy21
5M Followers
Snow Man / MENT RECORDING
@SN__20200122
1.4M Followers