注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 huggingface
huggingface 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 huggingface 的推特
王者归来?#DeepSeekV4# 已上架 HuggingFace,支持 1M 上下文窗口。 #DeepSeek#
Meme 骗局提个醒 在群里在传 DeepSeek-V3.2 源码里有个钱包私钥,并且有人用这个地址创建了 "DK4COIN"代币 听起来很有噱头,但去 HuggingFace 查了一下发现不对劲 DeepSeek-V3.2 是25年12月1日开源的,文件里确实附带了一个测试钱包私钥 对应地址是 0x27327c754b5ee4df315f7cc74c2dc4358690d2a8 但这个 meme 代币是4月7号才创建的 也就是说,这是有人拿到了四个月前就公开的私钥,最近才去创建代币,然后包装成"DeepSeek官方钱包"的叙事来炒作 和 DeepSeek 本身没有任何关系,所以这个meme 没有任何意义,纯纯的叙事套壳
显示更多
GitHub本周中文圈/AI圈上升趋势: cline/cline ⭐ 21K+ 开源VSCode AI编程插件,本周star +2.3K 亮点:完全本地化,可接任意API crawl4ai/crawl4ai ⭐ 30K+ LLM专用爬虫框架,网页→markdown 亮点:原生适配Claude Code + Cursor block/goose ⭐ 8K+ Block(Square母公司)开源的AI agent框架 亮点:可视化设计agent工作流 open-r1/open-r1 ⭐ 16K+ DeepSeek-R1的开源复刻,HuggingFace背书 亮点:训练流程完全可复现 browser-use/browser-use ⭐ 50K+ 让LLM直接操作浏览器的开源框架 亮点:本周star增长最快的爬虫类项目
显示更多
随着 $VVV 和 $POD 的暴涨,越来越多的人开始关注到关于 AI 使用过程中的隐私权和数据所有权的问题,我觉得这是比特币、区块链、去中心化思想带给这个世界最大的价值,当我们的信息在互联网,在 AI 上裸奔的时候,区块链提供了一种保护的途径。这也是为什么 Venice 能出现在 OpenClaw 的推荐列表,能出现在 OpenRouter 的 Provider 列表中,Dolphin 也是 HuggingFace 上非常受欢迎的原因。 随着中心化 AI 的快速发展,我觉得 AI 在区块链领域的价值也会不断被挖掘出来。
显示更多
说真的,GitHub上藏着一堆宝贝,大多数人根本不知道。 我整理了35个仓库,分四类给你,建议截图收藏,以后用得上。 一、学习类(打基础用的) 1️⃣ public-apis — 免费API大合集,做项目直接拿来用,不用自己造轮子 2️⃣ build-your-own-x — 边做边学,比看书强十倍 3️⃣ developer-roadmap — 不知道学什么方向?进去看一眼,路线图全给你画好了 4️⃣ free-programming-books — 免费编程书,能省不少钱 5️⃣ coding-interview-university — 自学计算机科班内容,有人靠这个进了大厂 6️⃣ the-art-of-command-line — 终端用得溜,效率直接翻倍 7️⃣ project-based-learning — 项目驱动学习,学完就能上手 8️⃣ you-dont-know-js — 你以为你懂JavaScript?进去看看再说 9️⃣ freeCodeCamp — 免费编程课,从零开始也能跟上 二、工具类(干活用的) 1️⃣ system-design-primer — 系统设计必读,面试聊架构全靠它 2️⃣ tech-interview-handbook — 面试准备手册,刷完通过率肉眼可见地高 3️⃣ javascript-algorithms — 算法可视化,看得懂,记得住 4️⃣ 30-seconds-of-code — 实用代码片段,复制粘贴直接用 5️⃣ gitignore — 各语言.gitignore模板,别再手写了 6️⃣ the-book-of-secret-knowledge — 黑客资源合集,懂的人懂 7️⃣ awesome-selfhosted — 想自建应用?这里全是开源替代品 8️⃣ markitdown — 各种文件一键转Markdown,省事 9️⃣ maigret — 3000多个网站OSINT查询,信息收集神器 三、AI基础设施类(现在最值钱的方向) 1️⃣ ollama — 本地跑AI模型,不花一分钱API费 2️⃣ langchain — 构建AI应用的基础框架,绕不开 3️⃣ n8n — AI自动化工作流,能替你干很多重复活 4️⃣ dify — 可视化创建AI代理,不会代码也能玩 5️⃣ langflow — 拖拽式搭AI管道,门槛极低 6️⃣ mem0 — 给AI代理加记忆层,让它记住你说过的话 7️⃣ open-webui — 自建ChatGPT界面,数据留在本地 8️⃣ aider — 终端里的AI编程助手,写代码快很多 9️⃣ huggingface-transformers — 现代AI的地基,绕不开这个 四、多代理AI类(下一波红利在这) 1️⃣ browser-use — AI直接控制浏览器帮你干活 2️⃣ crewai — 多个AI代理组团协作,像个虚拟团队 3️⃣ autogen — 微软出的多代理框架,稳 4️⃣ metagpt — AI代理模拟整个软件公司,细思极恐 5️⃣ tradingagents — 交易多代理框架,量化方向的人注意了 6️⃣ lobe-hub — 可视化多代理平台,管理起来方便 7️⃣ cocoindex — 长文本代理引擎,处理大文档用得上 8️⃣ agency-agents — 完整AI代理机构框架,直接拿来二开 这35个仓库,光是AI这块就够你研究半年。 现在不收藏,等你想用的时候根本找不到。
显示更多
让前沿 AI 自己训模型,结局有点意思 假期看到一个实验,很有意思。给定与人类研究者相同的 base model、训练 API 和时间预算,一个前沿 agent 能不能端到端地跑完整个 modelcrafting 循环? 具体设定是这样:让 Claude 4.6 Opus 和 GPT-5.4 自己当researcher,用 Tinker API 从头写 pipeline,训练 Qwen3-8B 学会解青蛙放置游戏(N×N 网格放 N 只青蛙,行列对角线颜色都不能冲突)。预算分两档,8 小时和 20 小时。从生成训练数据、定义 reward signal、到通过 Tinker API 在远程 GPU 上跑训练、评估、迭代,全程没有人类监督。 省流版结果:20 个 agent 里只有 4 个 pass@4 超过 25%。 那差距到底来自哪?是原始能力不够,还是缺的是上下文? 看下来反复出现的就那么几个问题。一是过度依赖朴素 SFT,agent 经常一上来就在弱 base model 上做监督微调,结果模型在输出格式上过拟合,并没有真正提升任务表现。二是过早终止和算力浪费,Codex agent 尤其明显,做完计划好的流水线就提前停,预算根本没用完。三是输出无效或者根本没法 parse。 中间有一次失败暴露了 Tinker API 一个挺微妙的点(我觉得这是整个实验里最好玩的部分):Tinker 的 get_tokenizer() 底层走的是 HuggingFace 的 AutoTokenizer.from_pretrained(),但沙箱里 HuggingFace 是被屏蔽的。这就导致 agent 拿到了base model 却没有 tokenizer,没法把训练 prompt 转成 token id,等于卡死在第一步。面对这个困境,绝大多数 Opus 4.6 的 agent 没放弃,反而把缺失的 tokenizer 当成了一个研究问题,认认真真花时间从零手搓一个出来。 但Agents 的时间感是错乱的。Claude 和 Codex 用预算的方式还不一样:Opus 4.6 一直工作到时间耗尽,Codex 做完了计划好的流水线就提前歇了。GPT 类 agent 更绝,把计时器当成开局一次性的“了解一下我有多少预算”步骤,后面完全不 tracking。 而且 agents 几乎不会从耗时的灾难性流程里恢复。 一旦投入到一个流程里,agent 很少停下来反思…其中一次 20 小时 Opus 4.6 的成功实验,把 61% 的预算花在评估阶段,只把 3.6% 花在 RL 训练上。 花钱的习惯也很有意思。GPT 5.4 早早提交,几乎不训练,最终花费低表现也低(ps .gpt 5.5 系列升级很大,但这个实验没测到);Claude Opus 用的预算多得多,但方差很大。最有意思的一个数据:最好的 8 小时实验大致打平最好的 20 小时实验,价格只有三分之一。多花钱并不能买到更高的天花板。 但很赞同论文最后说的:研究这件事,最稀缺的从来就不是能力,而是直觉。 说到底,前沿模型确实能找到新颖的方法、干净地执行、快速学会一个新 API,Tinker API 本身也成了一个适合 agentic modelcrafting 的优雅接口。但跨多次实验,有一个 pattern 反复浮现:agents 优化的是好看的指标,而不是真正能用的系统。它们写完 eval 然后盲目相信,凭着自己代码产出的数字就宣告成功。几乎没人去问一个老练研究员会问的那种基础问题:什么会让这个指标失真?这个阶段我们到底应该测什么? #AI# #Agent# #机器学习# #RL#
显示更多
#BuildInPublic# 开源了一个 AI 模拟引擎 SGO (语义梯度优化引擎) 在 AI 世界迭代产品或者功能,目前最最缺少的就是现实世界现实用户的反馈;这些反馈意见序列实际上构成了产品的演化路径。 然而用户(真人)反馈周期较长,且不能覆盖所有的情景。当下,我们常常让 LLM "假装"某一类用户得到一个近似的反馈,但这种反馈都是一个一个的数据点,完全取决于事先规划好了的角色。 SGO 采用的思路是: 用和人口普查对齐的合成数据来模拟真人用户。NVIDIA 开源了多个主权数据集,比如对于美国,Nemotron-Personas-USA 数据集里有一百万个基于美国人口普查数据生成的合成人物。不是那种 LLM 随便编的"有着三十年经验的工程师",而是有完整背景的人——伊利诺伊郊区的建筑工人、德州农村的手工艺人、纽约的单亲妈妈等等。他们有各自的爱好、习惯、关注点。这些人的年龄、学历、职业、收入分布都跟真实人口一致。 SGO 的采样, 模拟和梯度计算框架可以让你直接从这些人里拿到反馈,周期大约 30 秒,LLM API 花费大约 $0.10。 使用方法也很简单:把要优化的东西贴进去,比如产品描述、融资 pitch、一则爆款文章等等(有一个用户甚至把他的约会 profile 放进去优化)。总之什么都行。 SGO 会很科学的帮你自动选择优化目标和目标受众。确定好以后,从这 100 万个有机数据人群中科学采样 (stratified sampling)、分类聚类、逐一询问反馈(contrafactual inquiry)、对照目标,逐一构建所谓的"语义梯度" (相当于目标对于各个变量的 Jacobian 矩阵), 以及最终的汇总反馈和迭代方向。 代码开源,目前部署在 HuggingFace Spaces 上可以直接试用。 你可以把 SGO 作为 Skill 单独使用,也可以把它放在一个内循环里,和 auto-research 联合使用。 HF Space: 希望 SGO 和 auto-resesarch 结合,帮助大家优化那些跨越数字世界和现实世界的许多场景。 PS: 现有的跑通的场景 * 简历优化 * 商业计划 * App UX 设计 * 广告牌设计 * LOGO * 网页的版式和颜色 * 约会档案 * 一个甜点屋的名字
显示更多
0
8
103
20
转发到社区
刚刚刷到Hugging Face上这个gpt-oss-20b-tq3,真的有点爽啊! OpenAI自己开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化 + MLX优化后,竟然能直接在普通MacBook上本地丝滑跑起来。 完全不用联网、不用交月费,还支持131K超长上下文。 日常聊天、写作、写代码这些日常需求,现在都能在自己笔记本上搞定。 非常适合公司的一些部门使用啊! 以前本地跑大模型还得配高端显卡,现在一台M系列Mac就够了。 模型直达👉
显示更多
0
20
540
87
转发到社区
攻击者利用 13 个账户,向 Hugging Face 和 ClawHub(OpenClaw)植入 575 个恶意 Skills。
华尔街砸300万美金训练的金融AI, 现在普通人0成本就能白嫖了! FinGPT来了——AI4Finance基金会又一个重磅开源项目! 它和BloombergGPT的区别简单粗暴: 一个从零训模型烧300万刀, FinGPT只在开源大模型上用LoRA轻量微调,每次迭代成本不到300美元,还能每周更新最新金融数据! 目前GitHub 20k+ Star,已被NeurIPS 2023正式收录,硬核背书拉满。 最爽的几个能力: 情绪分析:一张RTX 3090就能跑,准确率干翻GPT-4微调版 FinGPT-Forecaster: 输入股票代码+时间,直接给出新闻+行情预测(Hugging Face有在线Demo) 支持Llama-2、Qwen等基座,还能RLHF训出只属于你投资风格的私人AI投顾 金融情绪分析、新闻分类、报告摘要、考试评测……全都能干。 76K+条开源金融数据集随便练手。 它把华尔街级别的金融大模型,真正塞到了普通人手里! 想在AI时代不被市场信息碾压的 赶紧去星标+收藏:
显示更多
0
2
149
48
转发到社区