搜索 huggingface 相关的推文

蓝点网@landiantech

2026.04.24 03:09

王者归来？#DeepSeekV4# 已上架 HuggingFace，支持 1M 上下文窗口。 #DeepSeek#

0

17

0

转发到社区

作业借你抄@chaozuoye

2026.04.09 10:42

Meme 骗局提个醒在群里在传 DeepSeek-V3.2 源码里有个钱包私钥，并且有人用这个地址创建了 "DK4COIN"代币听起来很有噱头，但去 HuggingFace 查了一下发现不对劲 DeepSeek-V3.2 是25年12月1日开源的，文件里确实附带了一个测试钱包私钥对应地址是 0x27327c754b5ee4df315f7cc74c2dc4358690d2a8 但这个 meme 代币是4月7号才创建的也就是说，这是有人拿到了四个月前就公开的私钥，最近才去创建代币，然后包装成"DeepSeek官方钱包"的叙事来炒作和 DeepSeek 本身没有任何关系，所以这个meme 没有任何意义，纯纯的叙事套壳

显示更多

0

6

9

2

转发到社区

黄小木@ai_xiaomu

2026.05.16 13:14

GitHub本周中文圈/AI圈上升趋势： cline/cline ⭐ 21K+ 开源VSCode AI编程插件，本周star +2.3K 亮点：完全本地化，可接任意API crawl4ai/crawl4ai ⭐ 30K+ LLM专用爬虫框架，网页→markdown 亮点：原生适配Claude Code + Cursor block/goose ⭐ 8K+ Block（Square母公司）开源的AI agent框架亮点：可视化设计agent工作流 open-r1/open-r1 ⭐ 16K+ DeepSeek-R1的开源复刻，HuggingFace背书亮点：训练流程完全可复现 browser-use/browser-use ⭐ 50K+ 让LLM直接操作浏览器的开源框架亮点：本周star增长最快的爬虫类项目

显示更多

0

5

14

2

转发到社区

HIGER@0xhiger

2026.05.11 14:58

随着 $VVV 和 $POD 的暴涨，越来越多的人开始关注到关于 AI 使用过程中的隐私权和数据所有权的问题，我觉得这是比特币、区块链、去中心化思想带给这个世界最大的价值，当我们的信息在互联网，在 AI 上裸奔的时候，区块链提供了一种保护的途径。这也是为什么 Venice 能出现在 OpenClaw 的推荐列表，能出现在 OpenRouter 的 Provider 列表中，Dolphin 也是 HuggingFace 上非常受欢迎的原因。随着中心化 AI 的快速发展，我觉得 AI 在区块链领域的价值也会不断被挖掘出来。

显示更多

0

2

7

0

转发到社区

鸟哥 | 蓝鸟会🕊️@NFTCPS

2026.05.17 01:33

说真的，GitHub上藏着一堆宝贝，大多数人根本不知道。我整理了35个仓库，分四类给你，建议截图收藏，以后用得上。一、学习类（打基础用的） 1️⃣ public-apis — 免费API大合集，做项目直接拿来用，不用自己造轮子 2️⃣ build-your-own-x — 边做边学，比看书强十倍 3️⃣ developer-roadmap — 不知道学什么方向？进去看一眼，路线图全给你画好了 4️⃣ free-programming-books — 免费编程书，能省不少钱 5️⃣ coding-interview-university — 自学计算机科班内容，有人靠这个进了大厂 6️⃣ the-art-of-command-line — 终端用得溜，效率直接翻倍 7️⃣ project-based-learning — 项目驱动学习，学完就能上手 8️⃣ you-dont-know-js — 你以为你懂JavaScript？进去看看再说 9️⃣ freeCodeCamp — 免费编程课，从零开始也能跟上二、工具类（干活用的） 1️⃣ system-design-primer — 系统设计必读，面试聊架构全靠它 2️⃣ tech-interview-handbook — 面试准备手册，刷完通过率肉眼可见地高 3️⃣ javascript-algorithms — 算法可视化，看得懂，记得住 4️⃣ 30-seconds-of-code — 实用代码片段，复制粘贴直接用 5️⃣ gitignore — 各语言.gitignore模板，别再手写了 6️⃣ the-book-of-secret-knowledge — 黑客资源合集，懂的人懂 7️⃣ awesome-selfhosted — 想自建应用？这里全是开源替代品 8️⃣ markitdown — 各种文件一键转Markdown，省事 9️⃣ maigret — 3000多个网站OSINT查询，信息收集神器三、AI基础设施类（现在最值钱的方向） 1️⃣ ollama — 本地跑AI模型，不花一分钱API费 2️⃣ langchain — 构建AI应用的基础框架，绕不开 3️⃣ n8n — AI自动化工作流，能替你干很多重复活 4️⃣ dify — 可视化创建AI代理，不会代码也能玩 5️⃣ langflow — 拖拽式搭AI管道，门槛极低 6️⃣ mem0 — 给AI代理加记忆层，让它记住你说过的话 7️⃣ open-webui — 自建ChatGPT界面，数据留在本地 8️⃣ aider — 终端里的AI编程助手，写代码快很多 9️⃣ huggingface-transformers — 现代AI的地基，绕不开这个四、多代理AI类（下一波红利在这） 1️⃣ browser-use — AI直接控制浏览器帮你干活 2️⃣ crewai — 多个AI代理组团协作，像个虚拟团队 3️⃣ autogen — 微软出的多代理框架，稳 4️⃣ metagpt — AI代理模拟整个软件公司，细思极恐 5️⃣ tradingagents — 交易多代理框架，量化方向的人注意了 6️⃣ lobe-hub — 可视化多代理平台，管理起来方便 7️⃣ cocoindex — 长文本代理引擎，处理大文档用得上 8️⃣ agency-agents — 完整AI代理机构框架，直接拿来二开这35个仓库，光是AI这块就够你研究半年。现在不收藏，等你想用的时候根本找不到。

显示更多

0

27

7

转发到社区

AI Dance@AI_Whisper_X

2026.05.05 11:42

让前沿 AI 自己训模型，结局有点意思假期看到一个实验，很有意思。给定与人类研究者相同的 base model、训练 API 和时间预算，一个前沿 agent 能不能端到端地跑完整个 modelcrafting 循环？具体设定是这样：让 Claude 4.6 Opus 和 GPT-5.4 自己当researcher，用 Tinker API 从头写 pipeline，训练 Qwen3-8B 学会解青蛙放置游戏（N×N 网格放 N 只青蛙，行列对角线颜色都不能冲突）。预算分两档，8 小时和 20 小时。从生成训练数据、定义 reward signal、到通过 Tinker API 在远程 GPU 上跑训练、评估、迭代，全程没有人类监督。省流版结果：20 个 agent 里只有 4 个 pass@4 超过 25%。那差距到底来自哪？是原始能力不够，还是缺的是上下文？看下来反复出现的就那么几个问题。一是过度依赖朴素 SFT，agent 经常一上来就在弱 base model 上做监督微调，结果模型在输出格式上过拟合，并没有真正提升任务表现。二是过早终止和算力浪费，Codex agent 尤其明显，做完计划好的流水线就提前停，预算根本没用完。三是输出无效或者根本没法 parse。中间有一次失败暴露了 Tinker API 一个挺微妙的点（我觉得这是整个实验里最好玩的部分）：Tinker 的 get_tokenizer() 底层走的是 HuggingFace 的 AutoTokenizer.from_pretrained()，但沙箱里 HuggingFace 是被屏蔽的。这就导致 agent 拿到了base model 却没有 tokenizer，没法把训练 prompt 转成 token id，等于卡死在第一步。面对这个困境，绝大多数 Opus 4.6 的 agent 没放弃，反而把缺失的 tokenizer 当成了一个研究问题，认认真真花时间从零手搓一个出来。但Agents 的时间感是错乱的。Claude 和 Codex 用预算的方式还不一样：Opus 4.6 一直工作到时间耗尽，Codex 做完了计划好的流水线就提前歇了。GPT 类 agent 更绝，把计时器当成开局一次性的“了解一下我有多少预算”步骤，后面完全不 tracking。而且 agents 几乎不会从耗时的灾难性流程里恢复。一旦投入到一个流程里，agent 很少停下来反思…其中一次 20 小时 Opus 4.6 的成功实验，把 61% 的预算花在评估阶段，只把 3.6% 花在 RL 训练上。花钱的习惯也很有意思。GPT 5.4 早早提交，几乎不训练，最终花费低表现也低（ps .gpt 5.5 系列升级很大，但这个实验没测到）；Claude Opus 用的预算多得多，但方差很大。最有意思的一个数据：最好的 8 小时实验大致打平最好的 20 小时实验，价格只有三分之一。多花钱并不能买到更高的天花板。但很赞同论文最后说的：研究这件事，最稀缺的从来就不是能力，而是直觉。说到底，前沿模型确实能找到新颖的方法、干净地执行、快速学会一个新 API，Tinker API 本身也成了一个适合 agentic modelcrafting 的优雅接口。但跨多次实验，有一个 pattern 反复浮现：agents 优化的是好看的指标，而不是真正能用的系统。它们写完 eval 然后盲目相信，凭着自己代码产出的数字就宣告成功。几乎没人去问一个老练研究员会问的那种基础问题：什么会让这个指标失真？这个阶段我们到底应该测什么？ #AI# #Agent# #机器学习# #RL#

显示更多

0

7

39

5

转发到社区

Eric Xu (e/Mettā)@xleaps

2026.03.26 14:47

#BuildInPublic# 开源了一个 AI 模拟引擎 SGO (语义梯度优化引擎）在 AI 世界迭代产品或者功能，目前最最缺少的就是现实世界现实用户的反馈；这些反馈意见序列实际上构成了产品的演化路径。然而用户（真人）反馈周期较长，且不能覆盖所有的情景。当下，我们常常让 LLM "假装"某一类用户得到一个近似的反馈，但这种反馈都是一个一个的数据点，完全取决于事先规划好了的角色。 SGO 采用的思路是：用和人口普查对齐的合成数据来模拟真人用户。NVIDIA 开源了多个主权数据集，比如对于美国，Nemotron-Personas-USA 数据集里有一百万个基于美国人口普查数据生成的合成人物。不是那种 LLM 随便编的"有着三十年经验的工程师"，而是有完整背景的人——伊利诺伊郊区的建筑工人、德州农村的手工艺人、纽约的单亲妈妈等等。他们有各自的爱好、习惯、关注点。这些人的年龄、学历、职业、收入分布都跟真实人口一致。 SGO 的采样，模拟和梯度计算框架可以让你直接从这些人里拿到反馈，周期大约 30 秒，LLM API 花费大约 $0.10。使用方法也很简单：把要优化的东西贴进去，比如产品描述、融资 pitch、一则爆款文章等等（有一个用户甚至把他的约会 profile 放进去优化）。总之什么都行。 SGO 会很科学的帮你自动选择优化目标和目标受众。确定好以后，从这 100 万个有机数据人群中科学采样 (stratified sampling)、分类聚类、逐一询问反馈(contrafactual inquiry)、对照目标，逐一构建所谓的"语义梯度" （相当于目标对于各个变量的 Jacobian 矩阵），以及最终的汇总反馈和迭代方向。代码开源，目前部署在 HuggingFace Spaces 上可以直接试用。你可以把 SGO 作为 Skill 单独使用，也可以把它放在一个内循环里，和 auto-research 联合使用。 HF Space: 希望 SGO 和 auto-resesarch 结合，帮助大家优化那些跨越数字世界和现实世界的许多场景。 PS：现有的跑通的场景 * 简历优化 * 商业计划 * App UX 设计 * 广告牌设计 * LOGO * 网页的版式和颜色 * 约会档案 * 一个甜点屋的名字

显示更多

0

8

103

20

转发到社区

Berryxia.AI@berryxia

2026.05.07 08:49

刚刚刷到Hugging Face上这个gpt-oss-20b-tq3，真的有点爽啊！ OpenAI自己开源的20B参数MoE模型，被社区用TurboQuant 3-bit量化 + MLX优化后，竟然能直接在普通MacBook上本地丝滑跑起来。完全不用联网、不用交月费，还支持131K超长上下文。日常聊天、写作、写代码这些日常需求，现在都能在自己笔记本上搞定。非常适合公司的一些部门使用啊！以前本地跑大模型还得配高端显卡，现在一台M系列Mac就够了。模型直达👉

显示更多

0

20

540

87

转发到社区

23pds (山哥)@im23pds

2026.05.08 11:37

攻击者利用 13 个账户，向 Hugging Face 和 ClawHub（OpenClaw）植入 575 个恶意 Skills。

0

4

8

1

转发到社区

Huan@Huanusa

2026.05.13 15:18

华尔街砸300万美金训练的金融AI，现在普通人0成本就能白嫖了！ FinGPT来了——AI4Finance基金会又一个重磅开源项目！它和BloombergGPT的区别简单粗暴：一个从零训模型烧300万刀， FinGPT只在开源大模型上用LoRA轻量微调，每次迭代成本不到300美元，还能每周更新最新金融数据！目前GitHub 20k+ Star，已被NeurIPS 2023正式收录，硬核背书拉满。最爽的几个能力：情绪分析：一张RTX 3090就能跑，准确率干翻GPT-4微调版 FinGPT-Forecaster：输入股票代码+时间，直接给出新闻+行情预测（Hugging Face有在线Demo）支持Llama-2、Qwen等基座，还能RLHF训出只属于你投资风格的私人AI投顾金融情绪分析、新闻分类、报告摘要、考试评测……全都能干。 76K+条开源金融数据集随便练手。它把华尔街级别的金融大模型，真正塞到了普通人手里！想在AI时代不被市场信息碾压的赶紧去星标+收藏：

显示更多

0

2

149

48

转发到社区