看来我必须再晒一下罗老师的「走出半生 注塑出来 仍是少年」系列盲盒手办了😍
哈哈,鉴定为真人
为了海外的工作...... 当然也方便顺便日你妈。
$BNB 的全称原来是 Build and Build,难道只有我直到现在才知道?
卧槽无敌,秒杀 RTX Pro 6000
Don’t just scale AI. Scale ROI.
AMD Instinct MI350P PCIe cards deliver 144 GB of HBM3E memory and up to 2299 teraFLOPS (at MXFP4) in a drop-in, air-cooled card built for standard servers.
That’s how you scale AI at maximum ROI without redesigning your data center.
Interested in drop-in AMD Instinct MI350P PCIe cards? See the specs at the link:
顯示更多
15 年前我也在免流量上网,那时还在上高中,我装了个 Wi-Fi 路由器藏在讲桌里的机箱后面,在教室后排用 PSP 上网冲浪。破解后安装 Java 模拟器可以玩手机网游,在淘宝买了 3 块品胜的电池续航一整天。后来又买了个智器 MID,可以装三种操作系统 Android、Linux、Win CE,伪装成电子词典摆到桌上玩
顯示更多
15年前我就在免流量上网了,那时候还是5元30M的年代,也是中国年轻一代技术极客疯狂的年代,各种免流上网,建站面板,下载站,卡盟刷钻,网赚私服。
最早的时候,中国移动有CMWAP,CMNET两种上网方式,中间出现过CMMM上网方式,访问139移动梦网的社交空间的时候是免流量的,于是衍生了一种很奇葩的免流量下载方案:
1. 把一个50M的电影文件和一张图片用“组合器”组合在一起,图片能够正常读出,只是看起来有50M大小而已。
2. 在139移动梦网的交友社区板块发一个带图片的帖子,上传也免流量,网页上默认显示缩略图,也没什么问题
3. 让你的好友去交友社区打开帖子,选择“下载原图”,这样子就可以免流量下载50M的图片
4. 再用“解组器”把电影和图片分离,就实现了最原始的免流量传递大文件。
再到后来就衍生了各种本地网络劫持Host信息,伪装成你一直在访问中国移动官网,实际上你在网络冲浪的软件,后面随着运营商将资费标准调低,研究这些就不再具有经济意义。
所以规则漏洞必定是随着时代发展而出现的,新规旧规交替的时候,总有被遗漏的点,但是所谓的靠漏洞吃稳定收益是不可能长期存在的,只有不断提高自己找规则优势的能力。
所以也不必再懊恼自己没有赶上国企改制、房地产放水时代,我们有自己的时代,研究规则,把握机会,顺Beta而上。
顯示更多
在 pi-coding-agent 中使用 gpt-5.5 时可以发现它所有的思考都带一个标题,在其他模型上均未发现此类行为👀
给 KTransformers 提的 PR 合并了!
跑本地大模型真令人上瘾,从最开始的用 LM Studio,Ollama,改为使用 llama.cpp,使用 Unsloth 量化的 GGUF。再到 vLLM,SGLang,KTransformers 都摸索了一遍,然后发现目前的工具其实对于 RTX 5090 (sm120) 的 FP4 支持的都不太好,虽然能运行 4bit 量化模型省显存,但都还无法利用原生 FP4 硬件加速。虽然都是 Blackwell 架构,但服务器上的 B200 和家用的 RTX 5090 区别很大,最终走向了自己修改编译 SGLang 的道路。
顯示更多
完全搞错了,套利者只会使市场更有效,收租的是交易所。
基础费率和套利资金是限制币圈天花板的核心。经常有人说做多无限、做空有限,实际上做多是有上限的,指数上涨末期全世界的资金加起来也推不动,而下跌是无限的,比如luna的无限归零。你会发现币圈真正的大牛市是在17年,那时候合约不是主力,甚至usdt还不是主力的时候。而链上的繁荣也是上线合约和现货就基本上到顶。所以币圈如果期待新一轮牛市,除了之前ETF的叙事、养老金的买入等,下一轮或许需要币圈内部共识的规则改变。这也是首席说的一堆原理,做空波动率和套利的太多了,这些成本最后都分摊到真实的买家和玩家上。现在币圈玩家和买盘不足,玩币的人数加起来可能比token的个数还少,那做空波动率和套利企图收租的最后一定会一地鸡毛。倾巢之下,焉有完卵?
顯示更多
有没有可能未来的趋势是 dense + dflash,而不是 sparse moe
AAVE流动性这就恢复了?能不能让我再多享受几天😅
终于!
🚀 Meet Qwen3.6-27B, our latest dense, open-source model, packing flagship-level coding power!
Yes, 27B, and Qwen3.6-27B punches way above its weight. 👇
What's new:
🧠 Outstanding agentic coding — surpasses Qwen3.5-397B-A17B across all major coding benchmarks
💡 Strong reasoning across text & multimodal tasks
🔄 Supports thinking & non-thinking modes
✅ Apache 2.0 — fully open, fully yours
Smaller model. Bigger results. Community's favorite. ❤️
We can't wait to see what you build with Qwen3.6-27B! 👀
🔗👇
Blog:
Qwen Studio:
Github:
Hugging Face:
ModelScope:
顯示更多
看到不少用 AI 做“量化”的,整一个小团队分析来分析去的,太有意思了,真热闹,像过家家一样。
跑本地大模型真令人上瘾,从最开始的用 LM Studio,Ollama,改为使用 llama.cpp,使用 Unsloth 量化的 GGUF。再到 vLLM,SGLang,KTransformers 都摸索了一遍,然后发现目前的工具其实对于 RTX 5090 (sm120) 的 FP4 支持的都不太好,虽然能运行 4bit 量化模型省显存,但都还无法利用原生 FP4 硬件加速。虽然都是 Blackwell 架构,但服务器上的 B200 和家用的 RTX 5090 区别很大,最终走向了自己修改编译 SGLang 的道路。
顯示更多
当老虎机胜率大于 50% 的时候,就变成了印钞机。Vibe coding 也是一样的道理