TwiScan
인기
커뮤니티
로그인
회원가입
English
日本語
한국의
简体中文
繁体中文
가입 후 초대 링크를 공유하면 동영상 재생 및 초대 보상을 받을 수 있습니다.
지금 가입
思维怪怪
@0xLogicrw
写关于 AI 的一切 Shit Post AI 信息流:
가입 May 2018
2.1K
팔로잉 중
4.3K
팬
思维怪怪
@0xLogicrw
2026.05.11 11:19
Avarok Cybersecurity 开源了 Atlas,一个用 Rust + CUDA 从零写的大模型推理引擎。它不依赖 Python 和 PyTorch,项目方称 Docker 镜像约 2.5GB,冷启动不到 2 分钟,目前主要面向 NVIDIA DGX Spark 的 GB10 平台优化。 官网模型矩阵显示,Atlas 在单台 DGX Spark 上跑 Qwen3.5-35B-A3B 可到约 130 tok/s,跑 Qwen3.6-35B-A3B 约 71 tok/s。Atlas 官网和 Hugging Face 页面称,在同硬件下,Qwen3.5-35B 平均约 111 tok/s、峰值 130 tok/s,vLLM 约 37 至 38 tok/s。 这组「3 倍 vLLM」数据来自项目方公开基准。GitHub README 写明,测试使用的是「法国首都是哪」这类短 prompt,生成上限不超过 30 个 token,temperature 为 0.1。这个口径更接近短请求、低并发、快速响应场景,也正好对应 Atlas 想打的卖点:用更小镜像、更少依赖和更快冷启动,把本地大模型服务变得更轻。 Atlas 现在仍是早期项目,真实生产场景还要看后续长文本、高并发和复杂工具调用测试。GitHub 上已有用户反馈输出质量和工具调用稳定性问题,相关 Issue 截至 2026 年 5 月 11 日仍处于 Open 状态。对开发者来说,它更像一个值得关注的新推理底座,而不是已经能全面替代 vLLM 的成熟方案。
더 보기
0
0
1
23
3
커뮤니티로 전달
인기 있는 사용자
야살 / Yasal
@Yasal_170
869.9K 팬
一劍浣春秋
@chee828
229K 팬
乐老爺AV選
@HappyLok1157
103.5K 팬
彭博商業周刊 / 中文版
@BloombergBWCN
40.9K 팬
有村架純's staff
@Kasumistaff
559.1K 팬
New York Post
@nypost
3.8M 팬
浜辺美波
@MINAMI373HAMABE
2.4M 팬
小牛
@Xiaoniu6161
170.9K 팬
billboard
@billboard
15.2M 팬
橋本環奈
@H_KANNA_0203
5M 팬
绯夜晚棠
@saurabhwork
31.2K 팬
凤九歌🔶BNB
@liuwan9898
5K 팬
유경
@joj_838
82.8K 팬
安宇泽
@DFHDJZY
16.3K 팬
夜郎奔(精品资源搬运工)
@yelangben
69.4K 팬
연령 확인
이 사이트에는 성인 대상 콘텐츠가 포함될 수 있습니다. 만 18세 이상만 이용할 수 있습니다.
만 18세 이상입니다 — 계속