英伟达DGX Spark 3万多一台
官方吹的是 1P FLOPS FP4精度很唬人
我自己实测了一下
Qwen3.5-27B 模型 FP8精度:10多 token/s
Qwen3.5-35B-A3B:50 token/s 左右
算力这么强,速度怎么这么一般?
因为它是 ARM 架构 内存和显存共用 用的是 LPDDR5 属于low power DDR
跟 4090、A100 上的 HBM 根本不是一个量级,显存带宽差距几十倍
计算快有什么用,数据都堵在传输上了
3万多买了个人办公玩具 哎😌......
希望今年能推出新的版本 把旧的挂咸鱼换新一代
实在不行就寄托中国的长鑫把AI高性能HBM内存价格打下来
顯示更多