Aliez Ren (@aliez_ren) — 推特瀏覽器

Don’t just scale AI. Scale ROI. AMD Instinct MI350P PCIe cards deliver 144 GB of HBM3E memory and up to 2299 teraFLOPS (at MXFP4) in a drop-in, air-cooled card built for standard servers. That’s how you scale AI at maximum ROI without redesigning your data center. Interested in drop-in AMD Instinct MI350P PCIe cards? See the specs at the link:

0

13

85

5

轉發到社區

Aliez Ren@aliez_ren

2026.05.05 06:30

15 年前我也在免流量上网，那时还在上高中，我装了个 Wi-Fi 路由器藏在讲桌里的机箱后面，在教室后排用 PSP 上网冲浪。破解后安装 Java 模拟器可以玩手机网游，在淘宝买了 3 块品胜的电池续航一整天。后来又买了个智器 MID，可以装三种操作系统 Android、Linux、Win CE，伪装成电子词典摆到桌上玩

Boywus@Boywus

2026.05.05 05:36

15年前我就在免流量上网了，那时候还是5元30M的年代，也是中国年轻一代技术极客疯狂的年代，各种免流上网，建站面板，下载站，卡盟刷钻，网赚私服。最早的时候，中国移动有CMWAP,CMNET两种上网方式，中间出现过CMMM上网方式，访问139移动梦网的社交空间的时候是免流量的，于是衍生了一种很奇葩的免流量下载方案： 1. 把一个50M的电影文件和一张图片用“组合器”组合在一起，图片能够正常读出，只是看起来有50M大小而已。 2. 在139移动梦网的交友社区板块发一个带图片的帖子，上传也免流量，网页上默认显示缩略图，也没什么问题 3. 让你的好友去交友社区打开帖子，选择“下载原图”，这样子就可以免流量下载50M的图片 4. 再用“解组器”把电影和图片分离，就实现了最原始的免流量传递大文件。再到后来就衍生了各种本地网络劫持Host信息，伪装成你一直在访问中国移动官网，实际上你在网络冲浪的软件，后面随着运营商将资费标准调低，研究这些就不再具有经济意义。所以规则漏洞必定是随着时代发展而出现的，新规旧规交替的时候，总有被遗漏的点，但是所谓的靠漏洞吃稳定收益是不可能长期存在的，只有不断提高自己找规则优势的能力。所以也不必再懊恼自己没有赶上国企改制、房地产放水时代，我们有自己的时代，研究规则，把握机会，顺Beta而上。

0

4

20

0

轉發到社區

Aliez Ren@aliez_ren

2026.05.04 10:52

在 pi-coding-agent 中使用 gpt-5.5 时可以发现它所有的思考都带一个标题，在其他模型上均未发现此类行为👀

0

1

6

0

轉發到社區

Aliez Ren@aliez_ren

2026.04.30 09:30

给 KTransformers 提的 PR 合并了！

Aliez Ren@aliez_ren

2026.03.05 16:03

跑本地大模型真令人上瘾，从最开始的用 LM Studio，Ollama，改为使用 llama.cpp，使用 Unsloth 量化的 GGUF。再到 vLLM，SGLang，KTransformers 都摸索了一遍，然后发现目前的工具其实对于 RTX 5090 (sm120) 的 FP4 支持的都不太好，虽然能运行 4bit 量化模型省显存，但都还无法利用原生 FP4 硬件加速。虽然都是 Blackwell 架构，但服务器上的 B200 和家用的 RTX 5090 区别很大，最终走向了自己修改编译 SGLang 的道路。

0

3

38

2

轉發到社區

Aliez Ren@aliez_ren

2026.04.28 18:15

完全搞错了，套利者只会使市场更有效，收租的是交易所。

𝙃𝘼𝙕𝙀𝙉𝙇𝙀𝙀@hazenlee

2026.04.27 20:35

基础费率和套利资金是限制币圈天花板的核心。经常有人说做多无限、做空有限，实际上做多是有上限的，指数上涨末期全世界的资金加起来也推不动，而下跌是无限的，比如luna的无限归零。你会发现币圈真正的大牛市是在17年，那时候合约不是主力，甚至usdt还不是主力的时候。而链上的繁荣也是上线合约和现货就基本上到顶。所以币圈如果期待新一轮牛市，除了之前ETF的叙事、养老金的买入等，下一轮或许需要币圈内部共识的规则改变。这也是首席说的一堆原理，做空波动率和套利的太多了，这些成本最后都分摊到真实的买家和玩家上。现在币圈玩家和买盘不足，玩币的人数加起来可能比token的个数还少，那做空波动率和套利企图收租的最后一定会一地鸡毛。倾巢之下，焉有完卵？

0

3

29

0

轉發到社區

Aliez Ren@aliez_ren

2026.04.28 18:02

有没有可能未来的趋势是 dense + dflash，而不是 sparse moe

0

10

19

0

轉發到社區

Aliez Ren@aliez_ren

2026.04.24 05:08

AAVE流动性这就恢复了？能不能让我再多享受几天😅

0

4

8

0

轉發到社區

Aliez Ren@aliez_ren

2026.04.22 13:11

终于！

Qwen@Alibaba_Qwen

2026.04.22 13:10

🚀 Meet Qwen3.6-27B, our latest dense, open-source model, packing flagship-level coding power! Yes, 27B, and Qwen3.6-27B punches way above its weight. 👇 What's new: 🧠 Outstanding agentic coding — surpasses Qwen3.5-397B-A17B across all major coding benchmarks 💡 Strong reasoning across text & multimodal tasks 🔄 Supports thinking & non-thinking modes ✅ Apache 2.0 — fully open, fully yours Smaller model. Bigger results. Community's favorite. ❤️ We can't wait to see what you build with Qwen3.6-27B! 👀 🔗👇 Blog: Qwen Studio: Github: Hugging Face: ModelScope:

0

1

13

0

轉發到社區

Aliez Ren@aliez_ren

2026.03.23 05:33

看到不少用 AI 做“量化”的，整一个小团队分析来分析去的，太有意思了，真热闹，像过家家一样。

0

22

155

2

轉發到社區

Aliez Ren@aliez_ren

2026.03.05 16:03

跑本地大模型真令人上瘾，从最开始的用 LM Studio，Ollama，改为使用 llama.cpp，使用 Unsloth 量化的 GGUF。再到 vLLM，SGLang，KTransformers 都摸索了一遍，然后发现目前的工具其实对于 RTX 5090 (sm120) 的 FP4 支持的都不太好，虽然能运行 4bit 量化模型省显存，但都还无法利用原生 FP4 硬件加速。虽然都是 Blackwell 架构，但服务器上的 B200 和家用的 RTX 5090 区别很大，最终走向了自己修改编译 SGLang 的道路。

0

34

389

41

轉發到社區

Aliez Ren@aliez_ren

2026.02.27 08:42

当老虎机胜率大于 50% 的时候，就变成了印钞机。Vibe coding 也是一样的道理

0

88

2.3K

262

轉發到社區