TwiScan
人気
コミュニティ
アカウントコレクション
ログイン
登録
English
日本語
한국의
简体中文
繁体中文
登録して招待リンクを共有すると、動画再生報酬と紹介報酬を獲得できます。
今すぐ登録
阑夕
@foxshuo
说什么是你的自由,做什么是我的权利,如果我做的得不到你的赞同,那就对了,否则我将与你一样平淡无奇。
参加 August 2009
774
フォロー中
172.9K
ファン
阑夕
@foxshuo
2025.03.05 01:56
此时就需要补充一个推理模型的特点了,那就是推理模型的训练过程特别注重奖惩机制,通过思维链的暴露我们也能看出它通常都会想得缜密、生怕自己没有摸清用户意图,以致于经常到了「谄媚」的程度。 这种训练模式的好处在于,可以让推理模型拥有举一反三的能力,能够更加灵活和完善的去完成任务,但是相对的,为了完成任务,推理模型也会在「不自知」的情况下,同时表现出欺骗性,当用户要求它写一篇作文时,哪怕缺少论据,它也会为了不辜负用户的指令,去自行编造一些材料出来,以便于自圆其说。 这就是大模型行业至今仍在致力于解决的「幻觉」现象。 下图就是一个经典用例,用户为DeepSeek-R1设立了阿里估值逻辑改变的靶心,于是DeepSeek-R1就逼迫自己去对着靶心射箭——它不会也不能反驳用户,或是质疑阿里的估值逻辑到底变没变——于是就「情不得已」的编造出了可以用来证明用户观点的数据。(4/n)
もっと見る
0
0
5
47
2
コミュニティへ転送
人気のあるユーザー
sacha。
@amichamiru
253.4K ファン
New York Post
@nypost
3.9M ファン
AKB48公式
@AKB48_staff
247.1K ファン
ケイン・ヤリスギ「♂」
@kein_yarisugi
543.8K ファン
22/7(ナナブンノニジュウニ)
@227_staff
64.2K ファン
Snow Man / MENT RECORDING
@SN__20200122
1.4M ファン
Hane Ame 雨波
@haneame_cos
1.4M ファン
TEAM JAY PARK
@Team_JayPark
12.2K ファン
麻衣𝐌𝐚𝐢💖
@mai_chan_cos
28.9K ファン
甜怡 ヤンイ댱이🐹✨
@DyangYi
153.6K ファン
浜浦彩乃(ayano hamaura)
@hamaura_0426
26.4K ファン
i-dle (아이들)
@official_i_dle
2.4M ファン
DAESUNG
@d_lable
88.8K ファン
gugudan(구구단)
@gu9udan
119K ファン
GFRIEND JAPAN OFFICIAL
@GFRDofficialJP
168K ファン