搜索 r1グランプリ相关的推文

2025.02.02 12:00

Powered By DeepSeek-R1 提示词由以下两篇文章提供《致所有关心Web3未来的从业者、投资者与行业观察者》《一些关于Labs的澄清与反思》 ========== 从公关和沟通策略的角度来看，何一的回应展现了较高的专业水平，但在关键争议点的处理上仍存在明显不足。以下从不同维度分析其回应水平：一、值得肯定的策略框架转移：切割责任，强调独立性将 Binance Labs 与币安主站切割（更名为Yzi Labs、独立运营），试图淡化二者在利益输送指控中的关联性，避免交易所品牌直接受损。强调上币流程存在「层层防火墙」，暗示腐败仅是个体行为，而非系统性风险。情绪共鸣：以个人经历唤起共情通过回顾个人被谣言攻击的经历（如“送内裤”事件），将自身置于「受害者」角色，暗示匿名指控可能是恶意造谣，同时强化「女性领导者面对偏见」的叙事，争取舆论同情。价值观输出：锚定行业理想多次提及「用户至上」「价值创造」「逆人性坚守」等宏观叙事，将币安与行业长期愿景绑定，转移对具体指控的注意力，塑造道德高度。二、明显的短板与回避关键指控未正面回应对匿名信中列举的具体项目案例（如Hooked、Sleepless AI）和利益链操作细节（如顾问代币分配、上币押金）避而不谈，仅以「欢迎举报」笼统回应，缺乏实质性反驳。未解释为何多个被点名的涉事员工（如Dana、Nicola等）仍在币安体系内担任要职，也未公布任何内部调查进展。逻辑矛盾：独立性与利益关联并存一方面声称Labs与币安独立决策，另一方面承认「项目给币安用户的空投比例会影响上币评估」，变相坐实了「资源置换」的可能，削弱了防火墙的可信度。对行业症结的简化归因将市场乱象归咎于「创业者套现欲望」和「政策限制」，回避交易所作为资源垄断方在项目筛选、流量分配中的核心责任，显得避重就轻。三、潜在风险与舆论反弹证据悬置削弱公信力「欢迎举证」的表态若缺乏后续行动（如启动独立调查、公布涉事人员处理结果），可能被解读为敷衍，加剧「官官相护」的质疑。性别叙事的反噬匿名信刻意强调涉事者均为女性，可能隐含性别偏见；但何一将自身困境与「女性不上桌」的传统歧视类比，虽能引发共情，却也容易模糊焦点，让性别议题覆盖对腐败本身的讨论。价值观与商业现实的割裂呼吁「创造价值」的同时，币安作为最大交易所仍依赖上币费、交易手续费等短期利益模式，这种矛盾可能被批评者视为「言行不一」。四、总结：危机公关的「安全牌」何一的回应整体符合「不承认、不深入、转移矛盾」的危机公关常规策略，成功将复杂的企业治理问题转化为对行业理想和个人韧性的宏大叙事，短期内可能稳住核心用户群体（尤其是BNB持有者）。然而，对实质指控的回避和证据悬置，可能进一步激化社区对中心化交易所的不信任，尤其是在Web3行业强调「透明与去中心化」的语境下，此类回应显得保守且缺乏革新诚意。若想真正挽回声誉，币安需要更具体的行动：如引入第三方审计、公开争议项目审查记录、建立社区监督机制等。否则，匿名信中揭示的「劣币驱逐良币」困局，或将伴随行业周期持续发酵。

显示更多

0

13

22

1

转发到社区

阑夕@foxshuo

2025.02.11 10:53

在技术专家看来，DeepSeek-R1-Zero要比R1更加漂亮，因为人工干预的成分更低，纯粹是模型自己摸索出了在推理几千步里寻找到最优解的流程，对先验知识的依赖没那么高，但因为没有做对齐处理，R1-Zero基本上没法交付给用户使用，比如它会各种语言夹杂着输出，所以实际上DeepSeek在大众市场得到认同的R1，还是用了蒸馏、微调甚至预先植入思维链这些旧手段； - 这里涉及到一个能力和表现并不同步的问题，能力最好的模型未必是表现最好的，反之亦然，R1表现出色很大程度上还是因为人工使劲的方向到位，在训练语料上R1没有独占的，大家的语料库里都会包含古典诗词那些，不存在R1懂得更多，真正的原因可能在于数据标注这块，据说DeepSeek找了北大中文系的学生来做标注，这会显著提高文采表达的奖励函数，一般行业里不会太喜欢用文科生，包括梁文锋自己有时也会做标注的说法不只是说明他的热情，而是标注工程早就到了需要专业做题家去辅导AI的地步，OpenAI也是付100-200美金的时薪去请博士生为o1做标注； - 数据、算力、算法是大模型行业的三个飞轮，这一波的主要突破来自算法，DeepSeek-R1发现了一个误区，就是传统算法里对于价值函数的重视可能是陷阱，价值函数倾向于对推理过程的每一步去做判断，由此事无巨细的把模型向正确的道路上引导，比如模型在解答1+1等于几的时候，当它产生1+1=3的幻觉了，就开始惩罚它，有点像电击疗法，不许它犯错； - 这种算法理论上没毛病，但也非常完美主义，不是每道题目都是1+1这样简单的，尤其是在长思维链里动辄推理几千个Token序列的情况下，要对每一步都进行监督，投入产出比会变得非常低，所以DeepSeek做出了一个违背祖训的决定，不再用价值函数去满足研究时的强迫症，只对答案进行打分，让模型自己去解决怎么用正确的步骤得到答案，即便它存在1+1=3的解题思路，也不去过度纠正，它反而会在推理过程里意识到不对劲，发现这么算下去得不出正确答案，然后做出自我纠正； - 算法是DeepSeek之于整个行业的最大创新，包括要怎么分辨模型是在模仿还是推理，我记得o1出来后有很多人声称通过提示词让通用模型也能输出思维链，但那些模型都没有推理能力，实际上就是模仿，它还是按照常规模式给出了答案，但是因为要满足用户要求，又回过头基于答案给出思路，这就是模仿，是先射箭后画靶的无意义动作，而DeepSeek在对抗模型破解奖励方面也做了很多努力，主要就是针对模型变得鸡贼的问题，它逐渐猜到怎么思考会得到奖励，却没有真的理解为什么要这么思考；（3/n）

显示更多

0

1

24

4

转发到社区

猫笔刀的备忘录@mooomoocat

2025.08.22 14:49

夺舍昨晚还真巧呢，我吐槽deepseek R1计算技能慢，该升级了，结果deepseek昨晚官宣了v3.1版本。官方介绍这是一个混合架构模型，不是R2或者纯推理模型。我之前吐槽R1效率慢，这次新出的V3.1版本在思考减少20-50%的情况下，维持了之前的能力，也就是说提速了20-50%。另外还有很重要的一点，新出的v3.1模型专门为国产芯片（如华为昇腾、寒武纪等）定制参数精度，能最大化释放国产芯片的性能。于是a股的芯片板块今天被引爆，国证芯片指数暴涨9.82%，芯片ETF（512760）罕见封涨停，中芯国际+14%，寒武纪+20%、海光信息+20%，整个半导体板块涨疯了。这算是继年初之后deepseek又一次点爆了a股，上一次是熊市困顿之际，这次是牛市火上浇油，效果都很明显，资本市场现在特别吃ai的叙事，就愿意为ai买单。但是今天的行情并非人人满意，说出来很多人会意外，今天指数都涨飞了，a股的中位数只有+0.16%，不用想，肯定是小微盘表现很不好。我去看了一眼指数，果然，微盘股今天是绿的。肉都让权重股吃到了，科创因为含芯量高今天涨炸了，500和1000还能喝口汤，从2000再往下的上市公司基本就没剩了。其实这也挺公平，上半年微盘股、小盘股涨的多，领先权重股15-20%，现在权重股发力补涨也是理直气壮。统计2025年的涨幅，依然是小盘股大幅领先：上证50 +9.1%沪深300 +11.2%科创50 +26.2%创业板指 +25.2%中证500 +19.2%中证1000 +23.6%中证2000 +33.1%微盘股 +60.4%临时加一个上证指数 +14.14% 需要注意的是，近期确实有权重股连续补涨的趋势，如果这个风格延续的话，像上证50、沪深300可能还有补涨空间，而一旦权重股开始发力，上证指数向上的速度就会加快。今天已经站上3800，4000不远了。这一波最让人感慨的是a股控盘太稳，过去4个月上证指数日涨幅最高没有超过1.5%，日跌幅超过1%的只有7月31日那一天（-1.18%）。这一点我到现在也没想明白，自从4月初被特朗普关税战重拳爆头后，a股就像被千年老狗夺舍，彻底换了心性。这就像家里那个调皮贪玩的孩子有一天从楼上摔下来，磕到头晕过去，第二天醒来突然懂事听话，努力自律学习，半年内就考到了全校前10，这算科幻片、喜剧片还是恐怖片以前炒a股的经验突然不管用了，那些喜欢零碎交易，小框架高抛低吸的这波都被洗惨了。倒是之前炒惯了美股，喜欢低频长持的无缝衔接，就是板块概念来回切换有点拿不准，不过没关系，持有宽基指数就很好。你们看我上面列的指数涨幅，除了上证50和沪深300不给力，剩下的都不错，要是个股炒的不得劲，补票指数etf，从此躺平不操心。这个夏天真是惬意，在外面浪了两个月，每天平平无奇打开账户，看一眼数字，哦，又涨了。没想到a股投资者也能凡尔赛，以前那么多年炒房的都在嘲笑炒股的，终于在2025年反转了，河东河西，周期轮回。给你们分享下午和孩子们玩的视频，崇礼的夏天真凉快，根本原因这里是高山地区，我住的酒店海拔1700米，出门要穿薄外套。我交代老婆在后面拍我陪孩子玩，要拍出夏天的清凉感，还要拍出度假的松弛感其实这个草坪坡度大，红色的海绵球挺沉的，我陪着孩子上上下下跑了几趟就累的够呛，很快就去坐到椅子上喝茶纳凉。中登me这次假期结束回北京要健身运动安排起来，最起码要把暑假长的肥肉，喝高的血脂都给打回去。总而言之，言而总之，投资和健康两手都要抓，两手都要硬。

显示更多

0

6

2

0

转发到社区

阑夕@foxshuo

2025.03.05 01:58

根据Vectara发布的大模型幻觉排行榜，DeepSeek-R1的幻觉率达到了14.3%，远高于Deepseek-V3的3.9%，也在所有主流模型里属于较差的一档。按理来说，R1是比V3更新、更强大的模型版本，之所以反而表现得更加拉垮，还是因为推理模型比普通模型先天就更加具有「创造力」，其实在AI研究领域，幻觉本身并不是单纯的缺点，甚至可以说，幻觉就是科学家们希望在AI身上看到的所谓意识，只是我们还没有把AI调教得当，让它在该天马行空的时候自由创作，在该遵守事实的时候有理有据。所以我的这篇文章也不是在说DeepSeek-R1有问题，而是滥用它来批量化生成真假难辨的信息、并海量投放到公网的这种行为，问题很大。越是公共讨论聚集的地方，比如时政、历史、文化、娱乐等领域，越是重灾区，这和自媒体的商业模式有关，有流量就有收入，流量取决于内容的吸引力，同时内容又受到生产成本的限制，而当DeepSeek-R1这种降维打击的武器被交到了每一个人手里，失控就是不可避免的了。第二个例子里的作者大概是察觉到流量太高也容易出事，已经会在新的文章里——依然都还是DeepSeek-R1写的——加上一条下面这样的声明，不过只能说聊胜于无，很少有人会注意到并理解这句话的意思——上面的内容有一半是我编的，但我不告诉你们是哪一半。事实上作者也确实不知道DeepSeek-R1交稿的内容里哪些是真哪些是假，他可能会提供一些参考资料，以及开放全网搜索的权限，但就像我说的，推理模型的运作模式，决定了它不是简单的洗稿，而是会自行完善故事的骨架和细节，最后的结果就是真假参杂，迷惑性反而更大了。（5/n）

显示更多

0

1

39

1

转发到社区

唐华斑竹🦅@uniswap12

2026.05.29 02:53

怎么低成本搭建自己的AI助手？ deepseek R1模型发布以来，各种AI应有又有了一波大的爆发，但是数据保密成了一个不容忽视的问题。如果想较低成本地搭建一个私人应用的AI助手，可以自己调试生成限制，调试输出文本内容，数据不外传，成本尽可能低，不知道是不是可行。本文详细介绍如何通过Dify和Chrome MCP的结合，在3分钟内搭建一个能操作网页的AI助手。文章提供了从环境准备、Dify部署、Chrome MCP安装到配置的完整步骤，展示了AI助手在自动网页搜索、表单填写、数据抓取等场景的应用，并解释了工作原理、问题排查及进阶技巧，让读者能够零代码实现网页自动化任务。你是否想过让AI不仅能回答问题，还能直接操作浏览器帮你做事？比如自动填写网页表单、抓取特定数据、或者点击按钮？现在，通过Dify和Chrome MCP的结合，你可以在3分钟内搭建一个能真正"动手"操作网页的AI助手。本文将手把手教你如何在本地部署Dify并配置Chrome MCP服务器，打造你的私人网页自动化助手。准备工作：确保你的环境就绪在开始前，请确保你的系统已安装： •Docker 和 Docker Compose（用于快速部署Dify） •**Node.js 18+**（用于运行Chrome MCP服务器） •Git（用于克隆项目仓库）第一步：快速部署Dify（仅需1分钟） Dify是一个强大的LLM应用开发平台，我们通过Docker快速部署： # 创建项目目录 mkdir dify-chrome-mcp && cd dify-chrome-mcp # 下载Docker部署配置 curl -o docker-compose.yml # 启动Dify服务 docker-compose up -d 等待1分钟左右，访问 http://localhost:80 就能看到Dify管理界面。首次使用需要创建账号并完成初始化设置。第二步：安装Chrome MCP服务器（1分钟）打开新的终端窗口，安装并启动Chrome MCP服务器： # 安装Chrome MCP服务器 npm install -g @modelcontextprotocol/server-chrome # 启动Chrome MCP服务（会自动打开Chrome浏览器） server-chrome 服务启动后，你会看到类似下面的输出，表示MCP服务器正在9999端口监听： Server running on http://localhost:9999 Chrome browser launched and connected successfully 第三步：在Dify中配置Chrome MCP（1分钟）现在回到Dify管理界面，进行关键配置： 1.进入设置 > 模型供应商 > MCP服务器 2. 点击添加MCP服务器 3. 填写配置信息： •服务器名称: Chrome-Automation •服务器URL: http://localhost:9999 4. 点击验证并保存，看到绿色成功提示效果验证：让AI帮你操作网页配置完成后，你就可以在Dify的Playground中测试你的网页自动化AI助手了。试试这些实用场景：场景1：自动网页搜索请打开百度首页，在搜索框中输入"最新AI技术发展"，点击搜索按钮，然后告诉我第一页的搜索结果标题。场景2：自动填写表单请打开"张三"，邮箱栏填写"zhangsan@email.com"，在留言区填写"咨询产品信息"，然后点击提交按钮。场景3：数据抓取与分析请打开工作原理：为什么这很厉害？这个组合的厉害之处在于分工明确： •Dify：负责与LLM对话，理解你的自然语言指令，并将其分解成具体的浏览器操作步骤 •Chrome MCP服务器：负责实际控制Chrome浏览器，执行具体的网页操作命令 •LLM（大语言模型）：作为大脑，理解你的意图并规划操作流程常见问题排查 server-chrome 2.连接失败：检查Dify和Chrome MCP服务器是否在同一个网络环境下，防火墙是否允许9999端口通信 3.操作超时：复杂网页加载需要时间，可以增加超时设置：server-chrome --timeout=60000 4.权限问题：在MacOS/Linux上可能需要权限：sudo npm install -g @modelcontextprotocol/server-chrome 进阶使用技巧掌握了基础用法后，你还可以尝试这些高级功能： •多页面管理：同时控制多个浏览器标签页，完成更复杂的任务 •用户身份保存：让AI记住登录状态，下次直接操作无需重新登录 •定时任务：结合Dify的工作流功能，设置定时自动化任务 •异常处理：教会AI识别操作失败的情况并自动尝试替代方案如何学习大模型 AI ？由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。但是具体到个人，只能说是：最先掌握AI的人，将会比较晚掌握AI的人有竞争优势。这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。 #AI# #AIAgent# @grok @xai

显示更多

0

转发到社区

阑夕@foxshuo

2025.03.05 01:51

讲个恐怖的，DeepSeek的胡编乱造，正在淹没中文互联网。虽然DeepSeek-R1确实好用，但它在爆火之后，成了人手一个的AI工具，也对中文互联网的信息环境造成了严重的污染情况，这是一个固然难以避免但也理应得到重视的问题。最近一个星期以来，就我看到的刷屏文章，至少有三例都是DeepSeek-R1生成出来的、充满了事实错误的内容，却因其以假乱真的迷惑性，让很多朋友信以为真，情绪激动的分享传播。第一例，是知乎的这条高赞回答：（1/n）

显示更多

0

62

475

98

转发到社区

ahhhhfs@abskoop

2026.05.15 07:38

新入职的公司有没有拖欠工资的劳动纠纷？刚加微信的供应商是不是个空壳公司？ 88查：一款阿里系免费企业信息查询工具接入 DeepSeek-R1 普通用户无需充值 VIP 即可查询工商注册、经营风险、涉诉记录与股东高管等关键数据适合求职前排雷、合作前摸底和小微团队做基础企业核查

显示更多

0

6

104

16

转发到社区

LotusDecoder@LotusDecoder

2026.05.14 09:29

一个猜想： gemini-3.1-pro 的后训练上的方向或风格出了重大偏差，不是方法上的因素， deepseek-R1的大词味属于方法上的局限。估计google是为了点击率和完读率，在里面掺了太多的迎合讨好，过度对齐用户的单次满意度，显得回答非常油腻。这种不顾现实一味迎合，猜测会极大削弱model的现实检验能力，也就是长程 agent 和 coding 能力。

显示更多

0

1

9

0

转发到社区

阑夕@foxshuo

2026.04.02 10:11

就在DeepSeek V4山雨欲来的前夜，晚点LatePost的更新爆了不少料： - 最近半年，DeepSeek的核心员工，包括DeepSeek第一代模型作者王炳宣、DeepSeek-OCR系列作者魏浩然、DeepSeek-R1作者郭达雅、Janus-Pro贡献者阮翀等人，都被各家大厂给挖走了，更不用说已经在小米做出了成果的前研究员罗福莉； - 尽管如此，DeepSeek依然不怎么卷，同行的每周工作时间都奔着80小时去了，DeepSeek的大多数员工还是遵循着早上不打卡、下午6-7点走人的规律，因为老板梁文锋相信一个人每天高质量输出的时间不会超过8小时，员工加班疲劳引起的昏庸工作质量，反而会浪费宝贵的算力资源，给公司造成损失； - 搞AI和做量化之间的关系其实相当紧密，2016年，DeepMind的创始人哈萨比斯就组建过量化团队，希望能为刚刚脱离Google的公司创收，结果没赚到钱，而幻方则是倒过来的，也是在同一年开始用GPU的深度学习算力去干实盘交易，成功让梁文锋以30岁的年纪实现财富自由，再才组建了DeepSeek； - 2023年的时候，梁文锋小范围见过一些投资人，但提出的构想类似OpenAI和微软的投资协议，投资方需要接受一个回报上限，这在投资者看来是没道理的，所以见完一轮之后，没有任何机构愿意投DeepSeek，而在大模型火了之后，梁文锋把和投资人建联的通道直接关闭了； - 在公司里，梁文锋参与最多的是基模架构工作，然后就是充当不同团队之间的粘合剂，DeepSeek内部鼓励交叉协作，一个团队的周会也会向其他团队开放，这种开放组织很容易被规模扩张给破坏，所以DeepSeek对于核心团队的增加相当谨慎； - 去年以来，外部世界发生巨变，既有DeepSeek-V3/R1的一炮走红，也有竞争烈度的大幅升级，DeepSeek没有加入任何战局，依然在自己重视的效率优化（注意力机制）、架构改进（mHC）和非主流探索（OCR）上面努力，梁文锋甚至招进了一些神经科学和脑科学背景的顾问，对人脑原理兴趣大增； - 这也意味着DeepSeek错过了去年最重要的两条主线，一个是AI Coding，这里不只有商业价值的爆发，还引发了以龙虾为代表的Agentic应用形态，DeepSeek-V3.2完全被其他国产模型盖过了风头，另一个是多模态生成，从GPT-4o到Nano Banana再到Seedance 2.0，全都颠覆性的创造了海量增长，但梁文锋认为多模态「不是智能的主线」； - 外界期待DeepSeek每次出手都能像去年年初那样石破天惊，这可能有些强人所难，也未必是梁文锋的目标，而他也需要稳定团队抗拒财富诱惑的心力，猎头给DeepSeek员工开出2-3倍的薪水，而且这还是建立在DeepSeek本身工资就不低的前提下，确实也有员工做出了跳槽去参与更确定性的、持续参与业界最强模型工作的选择； - 留下的人当然还是占了大多数，他们习惯了相对宽松的研究氛围，也愿意做非竞争驱动的探索，在DeepSeek的价值体系里，原创的排序是要比最强更靠前的，它们本质上并不冲突，有时候实现了原创也就自然实现了最强，但在进入Agentic版本后，工程能力变得更重要了，而这正好进入了DeepSeek没有过多投入的地方； - 于是梁文锋也比较少见的做出了应变回应，最近一段时间，他开始启动了对公司的估值，这意味着可以给团队更有刺激性的财富预期，同时也开始招揽模型策略产品经理，明确要求深度使用过Claude Code、OpenClaw、Manus； - 坚持该坚持的，改变该改变的，至于什么是该坚持的、什么是该改变的，这个判断还是得由梁文锋来拿捏，「奇迹之所以是奇迹，就是因为它不常发生，是小概率事件。在中国这个崇尚竞争和结果说话的环境里，敢于追求独特目标的 DeepSeek 的存在本身，是一个令人惊喜的小概率事件。」

显示更多

0

20

436

46

转发到社区

阑夕@foxshuo

2025.03.05 01:55

继续查证也能发现，关于「哪吒」的制片方给员工分成都房子、攻克水下流体特效之类的描述，全都是DeepSeek-R1为了完成这篇命题作文自己脑补的。第二个例子，就更离谱了，因为有些胆子够粗的自媒体，已经在拿DeepSeek去写涉军涉政的东西了。其中有一篇写军工打虎谭瑞松的选题，标题是《军工虎谭瑞松，从“道德标兵”到“猎艳狂魔”，“国之重器”沦为私人金库》，原文现在已经被删了，应该是被被转得太广作者害怕了，但很多「金句」的截图还在到处传，什么直升机的设计图纸在暗网里开价200比特币出售、收受金条贿赂时要求熔成发动机叶片形状、某总师离职时留言这里不是造飞机的地方而是造孽的工厂等等，如果你能记得这些细节，就一定知道我说的是哪篇文章。不好意思，这也全都是DeepSeek-R1自己编的。为什么我能确信是DeepSeek-R1的手笔呢？为什么不能是ChatGPT、Claude、文心一言？因为DeepSeek-R1是当前唯一能用的免费推理模型，且对中文的支持度足够高，这本来是DeepSeek-R1的优势，只是没被用在正道上。（3/n）

显示更多

0

1

42

1

转发到社区