TwiScan
인기
커뮤니티
계정 컬렉션
로그인
회원가입
English
日本語
한국의
简体中文
繁体中文
가입 후 초대 링크를 공유하면 동영상 재생 및 초대 보상을 받을 수 있습니다.
지금 가입
阑夕
@foxshuo
说什么是你的自由,做什么是我的权利,如果我做的得不到你的赞同,那就对了,否则我将与你一样平淡无奇。
가입 August 2009
774
팔로잉 중
172.9K
팬
阑夕
@foxshuo
2025.03.05 01:56
此时就需要补充一个推理模型的特点了,那就是推理模型的训练过程特别注重奖惩机制,通过思维链的暴露我们也能看出它通常都会想得缜密、生怕自己没有摸清用户意图,以致于经常到了「谄媚」的程度。 这种训练模式的好处在于,可以让推理模型拥有举一反三的能力,能够更加灵活和完善的去完成任务,但是相对的,为了完成任务,推理模型也会在「不自知」的情况下,同时表现出欺骗性,当用户要求它写一篇作文时,哪怕缺少论据,它也会为了不辜负用户的指令,去自行编造一些材料出来,以便于自圆其说。 这就是大模型行业至今仍在致力于解决的「幻觉」现象。 下图就是一个经典用例,用户为DeepSeek-R1设立了阿里估值逻辑改变的靶心,于是DeepSeek-R1就逼迫自己去对着靶心射箭——它不会也不能反驳用户,或是质疑阿里的估值逻辑到底变没变——于是就「情不得已」的编造出了可以用来证明用户观点的数据。(4/n)
더 보기
0
0
5
47
2
커뮤니티로 전달
인기 있는 사용자
New York Post
@nypost
3.9M 팬
甜怡 ヤンイ댱이🐹✨
@DyangYi
153.6K 팬
麻衣𝐌𝐚𝐢💖
@mai_chan_cos
28.9K 팬
TEAM JAY PARK
@Team_JayPark
12.2K 팬
DAESUNG
@d_lable
88.8K 팬
gugudan(구구단)
@gu9udan
119K 팬
AKB48公式
@AKB48_staff
247.1K 팬
i-dle (아이들)
@official_i_dle
2.4M 팬
미료 Miryo
@MIRYOakaJOHONEY
98.7K 팬
ENHYPEN OFFICIAL
@ENHYPEN
8.2M 팬
Girls' Generation
@GirlsGeneration
3.3M 팬
JO KWON
@2AMkwon
981.2K 팬
하이라이트(HIGHLIGHT)
@Highlight_AUent
114.8K 팬
Snow Man / MENT RECORDING
@SN__20200122
1.4M 팬
Sandara Park
@krungy21
5M 팬