∞ 华为徐直军公布昇腾芯片路线:明年Q1推出Ascend 950PR芯片
在华为全联接大会2025上,华为轮值董事长徐直军表示,算力过去是,未来也将继续是,人工智能的关键,更是中国人工智能的关键。
同时他还分享了昇腾芯片的后续规划:
Ascend 950PR:2026年Q1
Ascend 950DT:2026年Q4
Ascend 960:2027年Q4
Ascend 970:2028年Q4
其中,950芯片采用华为自研HBM,新增支持低精度数据格式、提升向量算力、提升互联带宽2.5倍。
据报道,华为Ascend 910C在今年一季度量产,将两颗昇腾910B芯片通过先进封装技术整合在一起,采用相对成熟的封装方案,在性能和成本间做了平衡。
其FP16精度算力约800 TFLOPS,内存带宽约3.2 TB/s,性能大概能达到NVIDIA H100的80%。
据悉,阿里巴巴、百度、腾讯等互联网巨头都是Ascend 910C的首批客户,他们过往都采购了大量的NVIDIA GPU加速器,华为昇腾对NVIDIA造成了巨大冲击。
今年5月,美国商务部下属的工业和安全局(BIS)发布多项指导意见,加强对中国的AI出口管制,其中最主要的一项规定声称:在全球任何地方使用华为“昇腾”系列AI芯片都将违反美国出口管制规定。
∞ 昇腾950/960/970芯片全公布 华为徐直军:全球最强超节点今年四季度上市
在今日举办的华为全联接大会2025上,华为轮值董事长徐直军表示超节点成为AI基础设施建设新常态,目前CloudMatrix 384超节点累计部署300+套,服务20+客户。华为将推出全球最强超节点Atlas 950 SuperPoD,算力规模8192卡,预计于今年四季度上市。此外新一代产品Atlas 960 SuperPoD ,算力规模15488卡,预计2027年四季度上市。
会上,徐直军还发布了全球首个通算超节点TaiShan950 SuperPoD,计划2026年一季度上市。徐直军称,其将成为大型机、小型机终结者。
此外,他还表示,算力过去是,未来也将继续是,人工智能的关键,更是中国人工智能的关键,同时分享了昇腾芯片的后续规划。
除了今年第一季度推出的昇腾910C芯片之外,华为还将于2026年第一季度推出昇腾950PR芯片,四季度推出昇腾950DT,2027年四季度推出昇腾960芯片,2028年四季度推出昇腾970芯片。
∞ Intel Gaudi 3 AI芯片成功集成至戴尔PowerEdge服务器
Intel的Gaudi 3 AI加速器近日取得了一大进展,成功被戴尔的PowerEdge XE7740服务器采用。Intel在AI领域的进展相对缓慢,主要原因是其进入市场较晚,且未能跟上NVIDIA和AMD的步伐。
当其他GPU制造商依靠AI热潮获得收入时,Intel采取了较为保守的策略,导致其Gaudi AI系列芯片未能被云服务提供商大量采用。
如今,戴尔在其PowerEdge XE7740服务器中采用Gaudi 3 AI芯片,成为首批提供此类配置的主要厂商之一。
戴尔的PowerEdge XE7740服务器支持八块PCIe加速器,能够在单一配置中支持8块Gaudi 3 AI芯片,并提供1:1的网络接口,便于在基于服务器的系统中灵活集成。
该服务器还支持现代AI模型,包括Llama4、Llama3、Deepseek、Phi4、Qwen3、Falcon3等。
戴尔尚未公布任何性能数据,但该公司声称使用Intel的Gaudi 3 AI芯片具有以下优势:
成本效益:XE7740提供了极具吸引力的价格与性能比,确保用户以更低的成本获得更多的AI能力。
可扩展性:通过模块化配置和可选的加速器桥接,企业可以更灵活地调整和逐步扩展其AI能力。
兼容性:该服务器专为企业数据中心设计,符合严格的功率和冷却限制,确保无缝集成,无需改造现有基础设施。
此外随着Falcon Shores项目的取消,Intel的下一产品可能是Jaguar Shores,这是Intel首个确认的机架级解决方案,借助该系列,Intel有望与AMD和NVIDIA展开更激烈竞争。
∞ 中芯国际总市值破万亿 消息称正测试首款国产DUV光刻机
国产半导体又迎来了标志性的一幕,中芯国际总市值突破10000亿。截至笔者发稿时,中芯国际A股日内成交额超100亿元,公司股价曾一度大涨7.9%,总市值突破1万亿元。
近段时间中芯国际股价大涨,跟一则传闻有关。
从目前曝光的消息看,中芯国际正在测试由上海初创公司宇量昇生产的深紫外线(DUV)光刻机,正测试的光刻机采用浸没式技术,类似于ASML所采用的技术。
过去,中芯国际高度依赖从荷兰半导体设备大厂ASML进口的DUV,但是近年来由于美国的出口管制,只能获得较旧设备。
知情人士透露,中芯国际正在测试一台28纳米的DUV设备,并利用多重曝光来生产7纳米芯片。
据透露,中芯国际试用的这类设备也能被推向极限以生产5纳米处理器,但良率会偏低,无法再进一步制造更先进的产品。
∞ 华为自研HBM内存正式公布:最大144GB 带宽4TB/s
今日举办的华为全联接大会2025上,华为轮值董事长徐直军首次公布了昇腾芯片演进和目标。他表示,未来三年,华为已经规划了昇腾多款芯片,包括昇腾950PR、950DT以及昇腾960、970。其中昇腾950PR 2026年第一季度对外推出,该芯片采用了华为自研HBM。
根据现场公布的信息,昇腾950PR芯片架构新增支持低精度数据格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重点提升向量算力,提升互联宽带2.5倍,支持华为自研HBM高带宽内存,分为HiBL 1.0和HiZQ 2.0两个版本。
规格方面,HiBL 1.0容量128GB,带宽1.6TB/s;HiZQ 2.0容量144GB,带宽4TB/s。
其中,昇腾950PR芯片采用950核心+HiBL 1.0内存,可提升推理Prefill(预填充)性能,提升推荐业务性能。
昇腾950DT采用HiZQ 2.0内存,可提升推理Decode(解码)性能,提升训练性能,提升内存容量和带宽。
延伸阅读:
在大模型推理中,Prefill阶段负责接收完整输入数据(如文本或图像),并计算缓存。这一过程需要强大的算力支持,通常由高性能芯片完成。 该阶段强调算力而非内存带宽,因此更适合在HBM(高带宽内存)芯片上运行。相比之下,后续的Decode阶段更依赖高速内存传输和互联方案。
HBM(High Bandwidth Memory,高带宽内存)是一种基于3D堆叠技术的先进DRAM解决方案,多层DRAM芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势,能协助快速处理数据密集型的AI任务。
美国国际战略研究中心(CSIS)AI专家艾伦(Gregory Allen)解释,HBM对于制造先进AI芯片至关重要,价值约占整体芯片的一半。
AI推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型,可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM可显著提升响应速度。
当下,HBM已成为高端AI芯片的标配,训练侧渗透率接近100%,推理侧随模型复杂化加速普及。