李继刚(@lijigang):日读论文 Prompt 技巧中的「角色扮演法」，有效，但为啥会有效呢？这篇论文给了一个解释，有意思。 ──────── https://t.co/CmevfwCM0b The Granularity Axis: A Micro-to-Macro Latent Direction for Social Roles in LLMs 扮演非格，实是刻度 ──────── 你跟 GPT 说「你是一位忧心的家长，孩子最近沉迷手机怎么办」，它给你的答案带着具体家长的那股焦虑——「试试把手机放客厅」「和孩子聊聊他刷的都是啥」。然后你换一句：「你是世界银行行长，怎么看青少年屏幕成瘾这个全球公共健康问题」——同一个模型，瞬间换了一套口吻：跨国数据、政策杠杆、长期 GDP 影响。这个换台的丝滑感，所有用过大模型的人都体会过。但模型脑子里究竟发生了什么？过去研究者的默认假设是：模型记住了"家长该怎么说""行长该怎么说"——每个角色对应一组语言风格的模板。如果你打开模型，应该能看到几百个角色，对应几百个独立的小堆。「扮演」就是个表面活儿——本质是模板匹配。但 Qin 这群人翻出来的发现完全不一样。他们让模型分别"扮演"75 个角色（从最微观的"忧心的家长"到最宏观的"世界银行行长"），把每次回答时模型内部的隐藏向量都记下来，再做几何分析。结果：这 75 个角色不是几百个孤立的点——*它们排在一根直线上*。从微观到宏观，每个角色都是这根线上的一个刻度。换角色不是换一套风格模板，是沿着一把"视野远近"的尺子挪一个位置。 ──────── *"角色"不是模型的属性，是这根轴上的一个坐标。所谓"扮演谁"，本质是"挪到哪一格刻度"。* 这个洞见超出 LLM。你在生活里"扮演角色"——CEO、父亲、咨询顾问、学生家长——之间的切换，可能也不是几百个独立模板，而是同一个你沿着几根类似的轴（粒度、时间尺度、利他度、风险偏好）调位置。模型把这件事做得这么干净，可能不是因为它特别简单，是因为它继承了人类语言里就编码了的这种结构—

2026.05.08 04:20

日读论文 Prompt 技巧中的「角色扮演法」，有效，但为啥会有效呢？这篇论文给了一个解释，有意思。 ──────── The Granularity Axis: A Micro-to-Macro Latent Direction for Social Roles in LLMs 扮演非格，实是刻度 ──────── 你跟 GPT 说「你是一位忧心的家长，孩子最近沉迷手机怎么办」，它给你的答案带着具体家长的那股焦虑——「试试把手机放客厅」「和孩子聊聊他刷的都是啥」。然后你换一句：「你是世界银行行长，怎么看青少年屏幕成瘾这个全球公共健康问题」——同一个模型，瞬间换了一套口吻：跨国数据、政策杠杆、长期 GDP 影响。这个换台的丝滑感，所有用过大模型的人都体会过。但模型脑子里究竟发生了什么？过去研究者的默认假设是：模型记住了"家长该怎么说""行长该怎么说"——每个角色对应一组语言风格的模板。如果你打开模型，应该能看到几百个角色，对应几百个独立的小堆。「扮演」就是个表面活儿——本质是模板匹配。但 Qin 这群人翻出来的发现完全不一样。他们让模型分别"扮演"75 个角色（从最微观的"忧心的家长"到最宏观的"世界银行行长"），把每次回答时模型内部的隐藏向量都记下来，再做几何分析。结果：这 75 个角色不是几百个孤立的点——*它们排在一根直线上*。从微观到宏观，每个角色都是这根线上的一个刻度。换角色不是换一套风格模板，是沿着一把"视野远近"的尺子挪一个位置。 ──────── *"角色"不是模型的属性，是这根轴上的一个坐标。所谓"扮演谁"，本质是"挪到哪一格刻度"。* 这个洞见超出 LLM。你在生活里"扮演角色"——CEO、父亲、咨询顾问、学生家长——之间的切换，可能也不是几百个独立模板，而是同一个你沿着几根类似的轴（粒度、时间尺度、利他度、风险偏好）调位置。模型把这件事做得这么干净，可能不是因为它特别简单，是因为它继承了人类语言里就编码了的这种结构——*我们的语言对"视野远近"这件事，本身就是个连续刻度*。

커뮤니티로 전달