注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 DeepSeekV4
DeepSeekV4 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 DeepSeekV4 的推特
王者归来?#DeepSeekV4# 已上架 HuggingFace,支持 1M 上下文窗口。 #DeepSeek#
又干没了! codex跟着我混可是一分钟都没闲着。 😌😌😌 最近又加上了deepseek, 最近两天烧了将近200块。 发现deepseekv4 pro也很好用, 特别是在跑ai交易上~~
显示更多
0
31
19
0
转发到社区
DeepSeek V4 没有缩小差距——它正在悄悄落后 主流叙事是"中国 AI 已经追上美国"。但美国 NIST 旗下 CAISI 5 月独立评估,把这个故事打得粉碎。 问题 1:与前沿模型差距从 3 个月扩大到 8 个月。 DeepSeek 自己的报告说 V4-Pro 与 GPT-5.4、Claude Opus 4.6 相当(差 2 个月)。但 CAISI 用非公开基准测试得出结论——V4 实际只相当于 8 个月前的 GPT-5。差距没缩小,是拉大了。 问题 2:参数堆到 1.6 万亿,仍然追不上闭源。 DeepSeek 把参数从 V3.2 的 6710 亿堆到 V4-Pro 的 1.6 万亿(4900 亿激活),成为全球最大开源模型——还是只在编码竞赛上"与 GPT-5.4 相当",世界知识、推理、多模态全面落后。 问题 3:训练框架在英伟达和华为之间反复横跳。 DeepSeek 2025 年中曾把训练迁移到华为昇腾,结果出现"严重训练失败",R2 被迫退回 NVIDIA GPU。现在的解法是——训练用 NVIDIA,推理用华为。这恰恰证明国产 AI 芯片还撑不起前沿模型训练。 DeepSeek 内部的真实困境? V4 推迟 6 个月才上线,定价砍到 GPT-5.4 的 1/9(每百万 tokens 3.48 美元 vs 30 美元),但这不是技术优势——是利润换市占率。Anthropic 单用户月营收 211 美元,DeepSeek 拿什么对手? 中国 AI 不是没进步,是别人跑得更快。CAISI 的 8 个月差距不是技术差距,是体系差距——GPU 禁令、人才流失、训练框架本土化全部失败叠加的结果。
显示更多
0
13
12
1
转发到社区
DeepSeek V4.1 下个月发布 Agent+MCP+多模态 现在MCP生态三家都上了桌 Claude发明的 OpenAI跟进了 DeepSeek也来了 但只有一家是开源免费的 同样的能力 一个收你200刀 一个收你20刀 一个不收钱 你选哪个
显示更多
0
76
906
66
转发到社区
DeepSeek V4 Flash 5毛钱就可以免费下载高清电影,吊打GPT-5.5
每天晚上睡觉前都让AI自动帮我下载音乐 想要这个牛逼的skill,评论区打1,免费送
0
11
69
4
转发到社区
DeepSeek 多模态大语言模型的论文《Thinking with Visual Primitives》已经公开 底座是 DeepSeek-V4-Flash,MoE架构,总参数量 284B,激活参数量 13B。 自研 DeepSeek‑ViT 视觉编码模型,14×14 patch,输出后 3×3 空间压缩,再接入 LLM。 模型在回答时不仅进行文字推理,还会同时通过画框、打点等“视觉原语”进行思考。 在极低的 Token 成本下,其效果能和 GPT-5.4、Claude 以及 Gemini 在一些前沿指标上对齐,甚至有的指标能反超。
显示更多
0
25
414
36
转发到社区
DeepSeek v4 Pro 优惠,延长到了 5 月底 小米 MiMo,要在 30 天送 100 万亿 Token 终于到绝对价格战阶段了
0
58
186
8
转发到社区
#DeepSeek# V4 Pro 限时优惠:调用价格从 0.1 元起下调到 0.025 元起,无论是否命中缓存以及输出价全部为 2.5 折。 此次折扣活动截止时间为 5 月 5 日,提供折扣或许是因为 Flash 能力并不突出,至少从目前社交网站上的用户反馈来看,Flash 与旧模型相比没有太大优势。 查看详情:
显示更多
DeepSeek V4 出来了,生产力不好评估,但我必须得说,它绝对是当前版本角色扮演的第一名。 上下文提高到 1M,记性变好了。 而且文风,我实测也得到巨大提升, 不再是以前 D 指导那套 AI 八股文,颇有早期哈基米 3.1 或者 Sonnet 4.6 的小灵性。 我玩酒馆 AI 角色卡的朋友都喜迎过年了。
显示更多
DeepSeek-V4 来了 还开源 GPT-5.5 也来了 还有啥😳