註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 interfm
interfm 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 interfm 的搜尋結果
Solana全栈开发指南系列视频【7】构建托管应用 一个使用Anchor在Solana上实现的无需信任代币交换 (Escrow) 程序。它演示了如何把PDA用作托管金库,如何使用 `transfer_checked` 做 CPI,以及如何使用token interface,从而同时兼容传统SPL Token与Token-2022 mint。
顯示更多
如何每天赚 $500,只需要你有这三样: 1. 一台电脑 2. Wi-Fi 3. 时间 下面是 10 个超级实用的 Claude 提示词,直接复制就能用,帮你把任意技能快速转化为被动收入产品(数字产品、课程、模板等)。 Prompt 1:从一个技能中挖掘可盈利的被动收入点 「扮演一名数字产品策略师。我的技能是 [skill],我的经验水平是 [beginner/intermediate/expert],目标受众是 [audience]。给我 15 个可以基于这个技能打造的被动收入产品点子。每个点子需要包含:产品是什么、谁会买、解决什么问题、制作难度、上线速度、最适合的销售平台。并按『最容易赚钱 → 长期潜力最高』排序。」 Prompt 2:把一个技能转化为适合新手的数字产品 「帮我把 [skill] 转化为简单易做的数字产品,目标用户是 [audience]。给我 10 个不需要复杂技术的产品方案,优先使用 Google Docs、Canva、Notion 或表格等工具完成。每个方案包含:产品名称、形式、价格区间、制作步骤,以及为什么有人会买。」 Prompt 3:设计从低价到高价的产品阶梯 「扮演产品体系专家。我的技能是 [skill],受众是 [audience]。帮我设计一个 4 层产品阶梯:低价、中价、高价数字产品和持续订阅。每一层都要自然承接下一层。每层需要说明:卖什么、价格区间、交付形式、用户类型,以及如何引导到下一个产品。」 Prompt 4:7 天内可以上线的最快产品 「我想用 [skill] 在 7 天内做一个被动收入产品。我每天能投入 [X] 小时,目标用户是 [audience]。给我 7 个可以快速完成的产品方案。每个方案包含:每日制作计划、所需工具、预计售价、难度评估,并标出最适合快速出单的最佳方案。」 Prompt 5:把技能匹配到真实需求 「我具备 [skill],目标用户是 [audience]。列出这个人群正在主动解决的 15 个真实问题,并基于这些问题转化为被动收入产品点子。每个点子需包含:问题、产品方案、承诺的改变结果,以及用户购买动机。」 Prompt 6:验证哪些产品真的能卖钱 「扮演市场验证研究员。我想基于 [skill] 向 [audience] 售卖被动收入产品。给我 10 个产品点子,并从需求、紧迫性、制作难度、差异化、购买可能性这 5 个维度打分(1–10 分)。最后指出最有可能最快变现的 3 个产品,并解释原因。」 Prompt 7:从已有经验中挖掘产品 「我不想从 0 开始。帮我把已有的 [skill] 经验转化为产品。分析我经常做的事情、经常解释的问题、常用捷径、常见错误,以及已有的方法论。然后转化为 10 个被动收入产品,并附上产品形式、标题思路和目标用户。」 Prompt 8:生成完整产品大纲 「我想为 [audience] 做一个关于 [topic] 的 [product type]。帮我生成完整大纲,包括:产品标题、核心承诺、模块结构、每一部分内容、附加赠品、快速见效设计,以及最终交付形式。要求简单实用、值得付费,避免学术化。」 Prompt 9:给产品定一个合理价格 「我有一个产品点子:[product idea],目标用户是 [audience]。对比低价、中价、高价三种定价策略。分别说明每个价格应该包含什么、吸引哪类用户、转化逻辑,以及优缺点。最后给出一个适合前期快速出单的推荐价格。」 Prompt 10:选择最适合的销售平台 「我想卖一个与 [skill] 相关的被动收入产品。请对比 Gumroad、Etsy、Payhip、Shopify、Notion 市场或自建网站等平台。结合我的产品类型 [product type]、用户 [audience] 和目标 [goal],推荐最适合的平台,并说明原因,包括手续费、搭建难度、流量潜力和新手友好度。」
顯示更多
0
7
154
40
轉發到社區
GTC 2026 preview: 从Groq生态位看AI异构推理(Heterogeneous Inference)新时代 Groq的SRAM路线的生态位在哪里?SRAM会不会替代HBM路线? Nvidia如何整合groq到现有的产品线?是技术整合还是产品线整合?收购之后会给groq LPU产品带来怎样的升级? 这里尝试从基本原理出发去拼凑一个逻辑链 —-------------------------------------------- 先从first principal说说groq的设计哲学开始:groq本质上是一个compiler first走到极致的路线而不是SRAM first路线,SRAM路线只是副产品 相对于CPU针对通用workload的设计不同,AI 推理workload的特征在于确定性(deterministic)更高,基本没有data-dependent branching,tensor shape固定,memory access pattern确定 当Groq带着这个新特征重新审视 hardware-software interface,去问"什么应该在编译时做,什么应该在运行时做"。对于 AI 推理这个 workload,答案是:几乎一切都可以在编译时做 这就是Groq最疯狂而独特的地方:完全确定性编译器(fully deterministic compiler),compile精确到每个时钟周期,完全精确带来极致的效率。在编译的时候就需要考虑到硬件在运行的每个时刻的所有状态,扮演一个全知全能的上帝,就可以避免硬件资源的浪费,而要做到这一点,必须要做到极致的确定性,也就是说,LPU里每一个计算,访问存储,通信的延迟,都需要精确到clock cycle,这对compiler来说是非常复杂的 AI workload更高的确定性,以及groq的完全确定性编译器优先路线很自然的避免了VLIW的弱点(内存行为以及branch行为不可预测),放大了VLIW的优点。那么下一步要提高效率和并行度,VLIW 式的编码格式就是一个自然推论—既然编译器要控制每个功能单元每个 cycle 做什么,那指令格式当然就是一个宽指令里打包多个 指令会得到更高效率,这就是 VLIW 在groq的芯片里,不做乱序执行/speculation,大幅简化硬件(instruction dispatch仅占<3%面积),把复杂度移到静态compiler上,这正是VLIW思想的精髓 既然要让编译器做确定性的 cycle-accurate 调度,那么硬件里所有不确定的因素都要消除,比如arbiter,crossbar, replay,这些有自主算法在运行时决策的部分都砍掉 memory latency 也必须是确定的,所以一切 cache 和 DRAM都是要砍掉的,cache也要换成scratchpad SRAM,因为cache replacement 策略是runtime决策的,不确定,必须换成软件控制的scratchpad,地址映射完全由compiler控制,保证确定性 通信也必须精确到cycle,发送和接收指令就是软件协调好执行的时刻,并没有传统的“我要发一个包给你,请分配好内存”这类操作,而是同步地根据一份时间表严格执行SRAM 的分配和收发操作,这个时间表是compiler已经决定好的,硬件只需要执行就行了 完全确定性compiler也带来了芯片节点之间互联通信overhead的极低延迟,这可能是groq确定性架构最被忽视的最大优势,毕竟传统互联架构里Packet Routing、Arbiter Contention 和 Buffer Queuing,这些是延迟波动的重灾区 这就是为什么说,groq其实并不是一个native SRAM first的技术路线,也不完全算是VLIW first的技术路线,而是compiler first的技术路线,更准确的说,完全确定性compiler是整个groq架构的核心 只是因为确定性compiler的原因,所以在核心decode阶段无法使用HBM/DRAM带来的不确定性,SRAM only成为了必然的选择。这也是为什么说Groq更像是compiler first路线。 —-------------------------------------------- groq被收购之后最直觉的第一反应: groq确定性compiler技术路线有没有可能用在Nvidia现在的GPU+HBM体系上? 不能 原因有两个: 1. HBM/DRAM的物理特性和带宽优化决定了它天生带有不可预测的延迟,无法和deterministic compiler兼容 2. Nvidia的SIMT路线和Groq的VLIW/compiler first的哲学本质是有冲突的 DRAM为什么充满了不确定性 1.refresh操作每隔一段时间tREFI就会刷新一次cell上的电量,阻断bank访问,这是由DRAM cell物理特性决定的。而这个操作会随着温度的变化,refresh的频率也会变化 2. 为了最大化利用DRAM带宽,controller会做很多优化,最典型的是batch scheduling:把同一个page的traffic都放在一起减少page miss,同时让读写尽可能接触更多的bank,以及尽可能减少read和write switching 这些动态优化都是real time发生的,基本不具备可预测性 3. system上对DRAM的优化,比如bank address hashing,让compiler静态提前定位某段data难度太大,落实cycle确定性的复杂度太高 其实这些不确定性也是能解决的,代价就是放弃大部分的优化策略,大幅降低DRAM的efficiency和利用率。groq自己其实也对这方面做过探索,他们曾经做过一个确定性DRAM的专利,但工程上的实现是不现实的,这也是groq选择SRAM-only的核心原因之一。 所以确定性compiler技术路线用在DRAM上不是一个yes or no的问题,而是这不是一个好的选择,因为这意味着HBM的efficiency和BW都要大打折扣,而且是结构性无法避免的损失。 这几乎意味着要用compiler去重写一个完整的memory controller,因为确定性dram本质上是compiler software defined memory controller,这个SW controller会非常难做,复杂度极高,而且每一代memory迭代都要大幅更新compiler里的结构,在工程资源上是不现实的。而且每一代DRAM,每一家DRAM 供货商都需要调试 ,这在验证和validation上是一个nightmare --------- 为什么Nvidia的SIMT路线和Groq的VLIW/compiler first的哲学本质是有冲突的 这两套体系对同一个问题给出了相反的回答:运行时的不确定性,Groq是compiler阶段直接消灭所有不确定性,Nvidia选择了用warp switching去隐藏不可预测的延迟 Nvidia GPU 建立在 SIMT(单指令多线程)和硬件层线程调度器(Warp Scheduler)上。当一个warp因为访存而stall的时候,硬件warp scheduler立刻切换到另一个ready的warp继续执行,把stall的延迟藏在其他warp的计算里。这整套机制的前提恰恰是:延迟是不可预测的,所以需要足够多的并发线程来统计性地填满pipeline 如果要用确定性的编译器去接管,等于把 Nvidia GPU 里面最核心的硬件调度单元全盘废弃:如果你不需要多warp轮转,你也不需要那么大的register file 实际在历史上,AMD从TeraScale(VLIW)到GCN(scalar SIMT)的架构转型,正是GPU领域一次大规模的VLIW→SIMT迁移:当workload变得不够可预测时,VLIW的compiler负担太重,应该把调度权还给硬件 所以在原架构上引入确定性compiler应用到Nvidia现有的技术路线,是很难融合。这不是compiler能不能改的问题,是两套架构从第一性原理上就走了相反的方向。 所以说,Groq在Nvidia的唯一出路,就是独立的面向low latency decode的专用产品。 —-------------------------------------------- Nvidia收购Groq之后,就引出了第二个问题: Nvidia会给Groq带来什么样的新提升? 那么首先看看groq的瓶颈在哪里,简单的说 1. SRAM容量太小,无法容下大模型的参数量+kv cache 2. 推理decode主要瓶颈不在SRAM 80T/s的速度而在于interconnect延迟(占80%) 3. 对于Prefill这样的compute bound task速度较慢 groq的主要架构基本上是17~18年就完成了,那是CNN的时代,架构也是以CNN/LSTM为主要的target,当时测试benchmark都是ResNet50,SRAM容量是绰绰有余的 但是进入LLM时代,单个TSP计算卡230MB SRAM就显得不够看了,一个LLAMA 70B模型的参数量占内存就相当于3000个ResNet50,再加上因为上下文long context日益膨胀的KV cache,scale out就成了唯一的出路 于是一个70B模型的推理就需要576卡的集群,采用16个Pipeline并行 (PP)和36个tensor 并行 (TP),80层的大模型切成16级流水pipeline串行,每级横向5层MLP分给36个卡并行推理 16级流水pipeline串行(PP),每级流水到下级流水的通信overhead延迟就要 X16。实测中PP和TP之间的通信延迟占据了80%以上的总延迟,特别是PP延迟,占据了50%以上的总延迟,通信延迟成为了主要瓶颈 Groq计算卡对decode阶段的memory bound很友好,但是片上巨大的SRAM也挤压了compute的面积,导致prefill阶段耗时很高。融入Nvidia产品线之后,Groq产品完全可以扬长避短,只做自己擅长的decode部分,避免prefill阶段的短板 Nvidia带来的最重要的提升,可能是通过工艺的提升,以及hybrid bonding技术(类似AMD 3D V-Cache),扩大Groq LPU SRAM的容量,比如光是14nm到3nm的工艺提升,SRAM就能从230MB扩大到500MB,如果以后引入3D SRAM,容量还能翻倍 SRAM变大之后,原来576个LPU能完成的70B模型推理,现在只需要256个LPU了。猜测也许可以用32个tensor并行 X 8 个流水pipeline串行,pipeline interconnect延迟能直接减半。 所以Nvidia能带来的主要提升可能是,通过扩大SRAM的容量,减少scale out卡数,从而减少通信延迟时间,提高token速度 —-------------------------------------------- Groq的SRAM路线专用产品进入Nvidia产品线,引出了第三个问题: SRAM路线会颠覆HBM路线吗? 不会。 SRAM路线本质上是用十倍的成本换几倍的速度,只能适用于一部分愿意为低延迟付出高额溢价的市场。AI硬件市场的主旋律仍然是比拼TCO(total cost ownership)成本 做一个简单的成本核算就清楚了 以LLAMA 70B模型为例,算上KV cache,Groq需要576张计算卡组成集群。Groq计算卡零售价大约是每颗2万美元(groq CEO说实际售价远低于,那就按2000美元算),576卡就是超过110万美元的硬件成本。而2张H100就能跑同样的模型,成本不到10万美元。成本差距是一个数量级。 Groq于是转而卖token服务,Groq的API定价确实便宜,但这是因为两个原因叠加: 第一,Nvidia的GPU云服务商通常在硬件成本上加倍的margin卖出去; 第二,Groq自己是在亏钱运营的。2025年全年,Groq用LPU做大模型推理、对外卖API的业务,营收大约4000万美元,成本却是6000万美元,毛利-50%。Groq的便宜token价格不是因为SRAM的经济性更好,而是因为VC在补贴。 那么有人愿意为速度付溢价吗? 有。 Claude Opus 4.6 Fast模式就是一个很好的市场信号:输出速度提升2.5倍,定价直接从$5/$25涨到$30/$150 per million tokens,6倍的价格,估计是牺牲了batch带来的速度提升。 所以这部分市场是真实存在的,SRAM路线在这里有它的生态位。 但这个生态位有多大?要看ML workload的分类。不同的workload对硬件的侧重点要求差距巨大: 推理的Prefill阶段对带宽要求低但算力要求高,推理decode阶段则是反过来。R&R(Ranking & Recommendation)对算力和带宽要求都不高但对存储的容量要求巨高 (见附图) 对延迟敏感的推理workload,decode阶段对Memory bandwidth要求高,是SRAM路线的优势领域(图中红色线),主要是real time/interactive LLM:chat、copilot、agent这类需要实时响应的场景。 特别是reasoning model,SRAM路线带来的极致体验是很夸张的:H100要两三分钟跑完一reasoning,cerebras十秒就搞定了 这部分注重极致推理速度的市场有多大,我暂时没有找到一个详尽的调研,看到一个Hyperscaler的说法目前是10%左右 但是agentic flow workload,常用的agentic框架做profiling,比如SWE-Agent, LangChain, Toolformer,CPU最长可以占到90%的E2E端到端延迟,throughput瓶颈也更多的卡在CPU, 这些加起来通常远大于单次decode的延迟,SRAM路线速度优势被削弱。 而更大体量的workload:batch inference、offline processing、ranking、recommendation对延迟没有那么敏感,throughput和cost per token才是唯一的指标。这部分市场SRAM路线完全没有成本上的竞争力 H100/B200相当于大巴车,装的人多(batch processing),每个人的车票钱很便宜,但是慢悠悠。 Groq/cerebras相当于是法拉利,极致的速度体验,但是装的人少,人均票价是大巴车十倍甚至以上。 长期来看,SRAM的成本劣势是结构性的,不会随时间收敛。6T SRAM cell天然比1T1C DRAM cell贵,这是物理决定的,和工艺无关。而且SRAM scaling已经慢了下来,从N5到N3E,SRAM单元面积几乎没有缩小 即便是速度优势,SRAM路线的缺陷在于访问速度已经接近工艺极限,很难跨代提升。特别是HBM的速度每代都在指数上升的情况下,SRAM 80T/s的速度优势很难长久维持。十年前这个路线刚刚兴起的时候,SRAM速度比HBM快了两个数量级简直是降维打击,但现在的速度差已经不到一个数量级(Rubin HBM4 22TB/s),再过十年,两者的速度可能拉不开差距了。 所以结论很清楚:SRAM不会颠覆HBM,但它在低延迟、低batch、实时推理这个细分市场里有不可替代的价值。但长远来看,随着HBM速度指数上升的背景下,SRAM优势也会逐渐慢慢越小。 —-------------------------------------------- 写到这里,也许我们可以把这些碎片拼凑出Nvidia收购Groq之后计划的下一步雏形: 异构推理的新时代开启了 以后的推理workload本身已经分化,无法再用单一架构的最优点覆盖,体系结构最重要的是tradeoff,是尺度范围。一个架构形态在合理的tradeoff以及特定workload下可能惊为天人,用多个架构形态去迎合不同种类的workload,就是异构计算的思想 2026 GTC的最大主题,就是异构推理的系统化。推理不会由单一硬件统一完成,而会被拆成 几个部分: 控制和调度/agent runtime层交给Vera CPU 针对long context的prefill交给CPX (Content Phase aXcelerator,一个专门为prefill的compute bound特性设计的计算模块) 小模型/低延迟/low batch decode交给SRAM路线的Groq LPU,256块LPU集群 高吞吐/高并发batch decode,HBM GPU仍然是主力 以及可能会被忽略的ICMS:inference context memory storage, kv cache已经是核心基础设施,以前的异构更多是计算异构,现在的异构已然延申到了缓存异构memory hierachy heterogenity(似乎改名成了CMX: context memory storage) LPU和GPU的分工,更可能成为 inference stack 里两个不同的tier,小模型/低延迟/low batch都交给LPU,长context/high batch交给HBM GPU 目前CPX什么方式和LPU/GPU连接还尚不清楚,整个工作流程大概是,CPU做控制和调度,CPX Prefill 跑完得到几十 GB 的 KV Cache, 分配到 Groq LPU阵列SRAM,或者分配到HBM GPU,开启Decode流程 其实还有一种更大胆的猜想:如果引入speculative decoding,那么LPU完全可以跑通常尺寸较小的草稿模型,在LPU上速度极快,HBM GPU作为主力去验证草稿模型即可,这样的异构推理结构,可以让token rate大大加速,在某些场景下翻倍也是没问题的(比如代码任务模式固定,小模型很容易猜对语法,所以加速效果很好) 当 Nvidia 的眼光越过GPU,走向整个 Agentic 流程的系统级优化时,追赶它的难度已经不在一个单一维度了。以前 Nvidia 步子迈得大,靠的是 GPU 架构和参数的单点暴力跃升;而现在,随着CPX,LPU,ICMS加入异构推理,它是从“数据中心即一台计算系统”的系统视角出发,从Agentic flow的角度做底层的异构编排。 无论是系统的复杂度,还是软件栈的工作量(Dynamo/ICMS/CMX),Nvidia 迈出的这一大步,直接把竞争门槛从“做出一颗好芯片”拉高到了“定义一整套异构系统来做普适加速计算解决方案“ —------------------------------------------------------- 不由得感慨,每一次计算范式的改变,半导体都会带来一波新的startup热潮,但当软件/应用形态逐渐收敛,最后还是变成了大厂通过收购把功能做大做全,参数做的更高,系统深度整合的更好更全面,成本更低,功耗和跑分更优秀,让startup慢慢失去独立生存的空间 比如移动互联网时代早期,也是群雄并起,有做AP应用处理器,独立基带芯片的,ISP的,GPU的各种小公司。但最后的赢家,都是从到后来把GPU,ISP,modem全都做进SoC,并且完成系统级整合的异构计算平台。 苹果收购PA semi的CPU,英飞凌的modem,掏空Imagination的GPU;高通收购ATI的mGPU,Atheros的Wifi,Nuvia的CPU,CSR的蓝牙/DSP,都是典型例子 异构推理的复杂度越来越高,能做系统级整合的公司会更有优势,这和移动SoC时代的逻辑一模一样。AI时代nvidia收购arm(失败),收购Mellanox,收购groq,只是这个新历史轮回的开始
顯示更多
0
31
292
78
轉發到社區
RGB动态(04-30) 明天就放假了,要出去带娃了,赶紧更新一下 1️⃣ @BitlightLabs 发布了新的更新公告 ▪️钱包 更新至 v1.2.8,修复了频繁唤起产生的重复接收问题,对于rgb资产的接收记录增加了utxo展示 ▪️RGB Lightning Node 更新至 v0.0.2,有若干更新,这里就不赘述了,可以看官方公告。有兴趣的可以尝试服务器来运行一下,准确来说Node的这一套配置是to dev的,但是在当下的ai时代,稍加学习应该都能够配置的起来 2️⃣ @Rgb__Market 做了若干更新,响应社区建议 ▪️卖家挂单增加了绑定tg的功能,一旦有人吃单,可以及时提醒 ▪️减少了卖家发货的过期时间,优化买家体验 ▪️针对多次恶意不发货的卖家,直接封禁其后续挂单的功能,减少卖家待价而沽,对于买家产生不公平的现象 ▪️计划引入之前开发的买单系统,通过买单卖单的双重模式让资产逐步达到公允价格,提升流动性 ▪️刚看推特他们要举办一个活动来提升大家交易的欲望,有货的可以多看看 3️⃣早期用户注意检查资产 如果之前有mint过水龙头的用户,请及时检查自己的资产,社区有好几个成员说自己助记词都忘记了...... 4️⃣如果要转移资产,请注意以下事项 ▪️请确认钱包是最新版本,新版本钱包和旧版本钱包在前端上的功能和限制是不同的 ▪️请不要使用同一个发票多次接收rgb资产,这可能会造成烧资产 ▪️请不要在接收/发送资产pending的同时进行反向操作,这会造成烧资产。虽然目前钱包已经在社区建议下限制了这两种情况,但是不排除有人会利用脚本或者后端程序等能做出这种操作,请不要尝试,按照正常用户的操作方式操作不会出问题 ▪️最好的归集方式是我当时的操作方式:2个为一组,等待转移完成确认数量无误后,再2个为一组 ▪️请了解rgb资产的转移方式,这是一个全新的方式 5️⃣针对资产是否可以增发的问题 ▪️0.12版本采用的是 interface 标识,目前是FNA(不可增发)模式,具体如下 6️⃣关于 $RGB 流通 ▪️原则上我们只能看到总流通量是多少 ▪️单个地址持有多少只有自己知道,其他人是看不到的,也没有公开的区块浏览器可查这个东西 ▪️考虑到燃烧、丢失等问题,实际的流通量是计算不了的,一般来说,参考 $BTC 的处理模式就可以了,默认是总量就行 7️⃣关于RLN ▪️肯定还需要时间,我等了快3年了,不着急 ▪️RLN主网上线,肯定也是要大规模测试的,发现可能的问题,这样才能有稳定的产品 ▪️如果到时候要想早一点参与其中,学会使用 RGB Lightning Node 是一个基本门槛 ▪️RLN swap需要在RLN主网稳定后才能发挥作用 请注意:我不为任何提到的项目背书,请自行研究 #BTC# #RGB#
顯示更多
先进封装的”耗材接棒”叙事最近很热,逻辑链也确实成立。但要理解为什么材料战场会从underfill转向CMP slurry,得先搞清楚一个更底层的技术拐点。 Micro bump方案同时撞上了三面墙。第一,bump pitch缩到25μm以下时solder bridging风险飙升,良率断崖。第二,JEDEC对HBM封装高度有硬限制,每层die加上micro bump加上underfill要吃掉40-50μm,堆到16层已经是物理极限,往20层走厚度预算根本不够。第三,underfill的thermal conductivity只有0.2-0.5 W/m·K,铜是401 W/m·K,差了三个数量级。每多堆一层die,中心层的junction temperature就更难控制。三个约束的共同解指向同一件事:取消solder和underfill,让copper直接做diffusion bonding。 Hybrid bonding解决了pitch、高度、散热三个问题,但代价是把容错率压到了atomic level。Micro bump时代表面粗糙度几十纳米就能工作,hybrid bonding要求Ra降到sub-0.5nm,任何一颗纳米级的particle都会在bonding interface形成void,后续thermal cycling会把void扩展成crack。这就是CMP slurry和Cu plating additives变成新咽喉的根本原因,配方质量直接等于bonding yield,bonding yield直接等于HBM产能。 但问题是,这条耗材链上谁真正有定价权。台厂的强项一直在设备和通路端。弘塑做ECP设备、辛耘做wet process清洗、中砂做pad和diamond disc,全部围绕化学品消耗量做文章,本身不掌握配方。崇越和华立是代理通路,帮信越、Fujimi把材料送进产线。真正自研CMP slurry配方的只有达兴和长兴,体量跟Fujimi、Entegris完全不在一个量级。化学配方的壁垒跟设备不一样,设备可以逆向工程迭代追赶,配方是几十年经验数据的堆叠,一款slurry打进台积电标准制程通常五到十年不会被替换。达兴说它的CMP slurry已经应用于N2并供货Arizona,如果属实,至少过了初步验证。但”应用于”和”规模化供货”之间的距离,有时候比技术本身还远。 资金从CoWoS设备capex转向耗材opex,方向没问题。但耗材链上真正有定价权的那一段在谁手里,市场似乎还没想清楚。
顯示更多
0
18
132
28
轉發到社區
这是一场没有硝烟的战争。 而我们必须打赢、终将打赢。 追根溯源,Permit 的本意是好的。而现在,利用它便利性的钓鱼,成为了链上噩梦之一。 ScamSniffer @realScamSniffer 公布了几次报告,所有网络中, 90% 的被钓鱼资产为 ERC-20 类代币。而这其中主要的钓鱼方式就是 Permit / Permit2 钓鱼签名。惨不忍睹。 不开玩笑,今年绝大部分你听说过的个人用户巨额钓鱼,都是 Permit 钓鱼。 一、恐怖片 实话说,早期以太坊玩家过着烧钱的苦日子。 每次和不同的合约交互,都需要付 Gas 去授权代币, Swap 或者 NFT 买卖需要两笔交易才能完成。 而现在,Permit 的使用已经完全普及各个 Defi 项目。你只需要将代币授权给 Permit/Permit2 这个「中介」合约一次。 之后,合约需要调用代币,只需要你的一个签名,节省了 Gas 和时间。 坏消息是,这个便利性变成了「借刀杀人」的恐怖片。 假官网、假空投、假土狗泛滥猖獗、张牙舞爪。其绝大部分都在打开网站的第一时间,就会很着急地弹出钱包、让你「签名登录,从而骗取 Permit 离线签名。 假如软件钱包/硬件钱包没有任何提醒,或者你忽视了潜在的风险,代币权限就被一键钓走了。 黑客得手后,便可以随时用这个签名转走对应的资产。很多时候被盗之后,你甚至没发现是因为这个小小的签名。 各种质押代币是重灾区,经常一钓就是大的,大到震惊全网。 这一切本可以被避免,只要用户得到足够的信息和警告。 二、核心的矛与盾 这个问题的本质就是「盲签(Blind Singing)」。Permit 钓鱼,仅仅只是其带来的风险的一个子集。 「盲签」意味着,你在签名与智能合约交互的时候,看到的是一堆二进制或十六进制乱码的「天书」,而不是清晰地告诉你签名目的和资产可能的变动情况——如转账金额、接收地址、调用的合约和方法等。 这种情况下签名,你可能会被误导,从而被诈骗。 要读懂「天书」,需要字典。而这个字典就是 ABI(Application Binary Interface,应用二进制接口)。它告诉钱包如何解释分析合约中的方法和参数,从一大串字符中提取有用的信息。 硬件钱包的好处在于,即使手机电脑被黑,黑客也无法拿到你的私钥权限,无法物理操作你的资金。但这也导致其受到性能、断网隔离等限制,在解析「盲签」上面临更大的挑战。 三、开诚布公:OneKey 如何推进? 「盲签」的问题我们必须解决,终将解决。 (1)现在完成时 ✨ 我们先从最大的祸害,现在绝大部分黑客都在使用的「Permit 钓鱼」快速入手。 黑客在钓鱼的时候可能使用的调用方法有「Permit/PermitBatch/PermitBatchTransferFrom/PermitSingle/PermitTransferFrom」,这些都是需要能被解析出来的内容。 现在,OneKey 的 App 软件钱包和 OneKey Pro 硬件钱包,都已支持以太坊和所有 EVM L2 的所有 Permit 类型风险提醒。 假如你签名的是 Permit 授权类型,在你签名之前,我们将会进行一个【高亮提醒】并确认。Classic 1s 也在快速跟进。 和前面提到「以为是普通的登录签名,结果却是签了 Permit 授权导致被盗」的情况说再见吧。 此外,我们已经支持初始授权代币给 Permit/Permit2 合约时,设置「用多少授权多少」。 (2)App 的现在进行时✨ 11 月底(也就是两三周的时间),App 将会渐进式更新的签名交易数据 ABI 解析。 要把所有的签名都能解析,这其实是一个巨大的体力工作。这里有个以太坊签名数据库(www.[删掉]4byte.[删掉]directory),收集了高达 1,350,091 个不同的签名。 目前,我们从以太坊最近 100 万条交易,统计出来了 Top 1000 个合约方法。我们将收集足够多的 ABI(目前也有很多现有的裤),争取 100% 覆盖。这也将涵盖各个 EVM L2。 我们将优先处理高风险的 Permit 类型,之后再扩展到全部。 不管是使用硬件钱包还是仅使用软件钱包,你都能 App 上读取签名目的和资产变动情况,如转账或授权金额、调用的合约和方法等。 此外,OneKey App 将在这之上进行额外的检测。一个是对交互的合约地址进行「是否交互过」检测。帮助你确认这个是你交互过的可信合约。另一个是进行「合约风险监测」,这一块我们将与 BlockAid、ScamSniffer、GoPlus 等知名机构合作。即使是信赖的大项目合约因为黑客出现风险时,也可以第一时间在交互确认前得到警告。 (3)硬件钱包的现在进行时✨ 有了前面的工作,我们将会实现在硬件钱包本地的解析。这样你能够在 App 和和硬件钱包离线本地进行两次确认,更安心。 这意味着,我们将会把 ABI 内置在硬件钱包中,并及时更新各种智能合约新的 ABI。 与 App 同样地,钓鱼重灾区「Permit」系列签名解析,会是我们重点优先推出的对象。 对于无法解析的,我们会警告,并允许用户设置禁止签这种类型的交易,以此倒逼各位新的项目方对 ABI 标注文件进行公布。 同时,我们也建议各位手握大额资产 Permit 调用权限的项目(尤其是质押类),除了保护好自己的合约多签权限之外,也增加类似 T+1 时间锁的功能,让用户即使被钓鱼也有时间反应和阻止。 关于 ABI 的收集,我们的友商 Ledger 在这一块是先锋者,他们推出了「Clear Signing」计划。 主要是在这个 GitHub (https://github.[删除]com/LedgerHQ/clear-signing-erc7730-registry),由第三方上传 ABI 标注文件然后他们进行审核,通过后会更新到固件中进行解析。 (4)其他更进一步的升级✨ a、支持展示硬件钱包的交易数据,进行第三方解析。 对安全要求更高的用户,有时候希望多方认证确认。 我们将通过硬件钱包屏幕展示出动态二维码,在二维码中编码了完整的待签名数据。或者是通过蓝牙加密传输的方式。 用户可以通过外部服务(比如一个第三方的 Ap)扫描该二维码,解析待签名内容,展示给用户。用户核对后,在硬件钱包上确认签名。 b、支持多帐户批量取消授权 & 动态监控。 当项目的合约发生权限问题时,黑客调用 Permit 转移资产往往需要一定的时间。不少用户是来得及进行取消授权拯救自己的资产的。当然,更好的情况是用户自己定期取消授权。 我们正在进行这方面的研发,针对突发风险的合约,针对目标用户进行推送预警,并提醒用户批量取消。不过这个服务消耗资源很大,我们会考虑使用订阅的模式,面向深度用户。 安全不是一个结果,而是一个动态博弈的漫漫长路。而这条路上,我们充满了决心。 共勉。 以上,欢迎点赞分享——让更多朋友明白 Permit 的风险以及我们硬件钱包的努力方向。
顯示更多
0
23
91
28
轉發到社區