Register and share your invite link to earn from video plays and referrals.

Aliez Ren
@aliez_ren
独立开发者 菜鸡架构师 我的产品 @taoli_tools
1.7K Following    16.3K Followers
Imagine if codex existed in 1982
Imagine if codex existed in 1998
almost same case but server edition with 11 pcie slots. and 14 fans
最先端のAIワークステーションを支える電源とは、何か。 「十分」では、もう足りない。 重要なAIワークロードが求めるのは、 圧倒的な安定性と、揺るぎない信頼性。 Seasonic PRIMEシリーズは、 新たなAI時代の最前線で、 次世代の高性能コンピューティング環境を支え続けます。
Show more
Great work! tested on my 4x RTX Pro 6000 (workstation edition but limit power to 300W each) with PCIe 4.0: tp=2, pp=2: prefill 1570, decode 34 tp=4, pp=1: prefill 967, decode 49 my dockerfile:
Show more
GLM-5.1-478B-NVFP4 Running on: - 4x RTX Pro 6000 - Sglang - 370,000 max tokens (1.75x full context) - p10 27.7 | p90 45.6 tok/s decode (gen) - 1340 tok/s prefill I could get 2x decode if I limit to 64k context (100 tok/s) In this video it operates Figma (:
Show more