中文114

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

一文读懂华为昇腾芯片:国产ai算力的中流砥柱(第1页)

在当下人工智能飞速发展的时代,芯片就如同AI的“心脏”,为各种智能应用提供着不可或缺的算力支持。华为的昇腾芯片,作为国产AI芯片的杰出代表,备受瞩目。今天,咱们就用最通俗易懂的大白话,来深入了解一下昇腾芯片到底是怎么一回事。

一、昇腾芯片诞生的背景

这几年,人工智能火得一塌糊涂,到处都在搞AI大模型,像ChatGPT这类的应用更是让大家看到了AI的巨大潜力。AI大模型的训练和各种AI应用的落地,都需要巨量的计算能力,这就离不开AI芯片。

以前,在AI芯片领域,英伟达的GPU那是占据着主导地位。但是呢,由于众所周知的原因,英伟达的GPU对我们进行了禁售,连阉割版的H20都不卖给我们了。这就好比做饭突然没了锅,AI发展面临着算力短缺的困境。就在这个时候,华为的昇腾芯片挺身而出,成为了国产AI芯片的希望之光,发挥了重要的替代作用,也迎来了巨大的市场机遇。

二、昇腾芯片的家族成员

昇腾芯片是一个庞大的系列,主要包括昇腾310和昇腾910两个子系列 ,它们有着各自不同的特点和用途。

(一)昇腾310:小巧灵活的边缘“助手”

昇腾310是SoC小芯片,就跟我们手机芯片差不多大,只有指甲盖那么点儿大 ,功耗也特别低,仅有8W,特别省电。它麻雀虽小,五脏俱全,集成了多个运算单元,包括8个ARM A55 Core的CPU、AI Core、数字视觉预处理子系统等。

它主要面向边缘计算与低功耗终端,就像是一个灵活的小助手,在边缘端帮助完成AI推理任务。比如说,在智能安防摄像头里,昇腾310就能实时对采集到的视频图像进行分析,看看有没有异常行为,而且因为它功耗低,摄像头也不用担心太费电。它的AI Core采用了华为自研的达芬奇架构,就像一个高效的计算小能手,能够复杂执行矩阵、向量、标量计算的算子任务,而CPU则负责非矩阵类复杂计算。根据海思官网的披露,昇腾310的FP16算力为8TOPS,INT8算力为16TOPS,采用12nm工艺制造。

(二)昇腾910:云端的强大“算力担当”

昇腾910可就大多了,和我们的掌心差不多大 ,功耗在300W以上 ,是个“大力士”,主要面向云端高性能计算。它的算力特别强,既能用于AI推理任务,也能用于AI训练任务,是云端的“算力担当”。

华为早期发布的昇腾910,其实应该算是910A 。当时华为还没被完全禁售,所以910A采用了台积电的7nm增强版EUV工艺 。芯片内建了32颗达芬奇Max核心(达芬奇核心分为Max/Lite/Tiny三种,Max最完整),支持混合精度计算(FP16/FP32/INT8),FP16算力为256TFOPs,最大功耗350W(一开始说是350W,后来变成了310W )。

2020年华为被列入实体清单后,台积电那边的先进工艺用不了了。于是,华为就与中芯国际(SMIC)合作,采用他们的N+1工艺(等效7nm),推出了910B 。910B优化了架构设计,提升了能效比,芯片尺寸为21.32mm×31.22mm,FP16算力约320TFLOPS,INT8算力约640TOPS 。显存为64GB HBM2e,显存带宽400GB/s 。910B也分为B1/B2/B3 。910B3引入了HBM3e内存,带宽提升至1.2TB/s,支持万亿参数模型训练。

最近这两年,华为又推出了昇腾910C 。昇腾910C采用中芯国际的7nm(N+2)工艺,晶体管数量达到530亿 。910C采用了类似B200的双die封装设计,就是把两颗独立的芯片die分别放置在各自的中介层,再通过有机基板将两个中介层连接起来 。通过把两颗昇腾910B整合到一起,实现了性能的提升。这种封装方式虽然在芯片间互联带宽上可能低于英伟达的先进封装方案,但好处是成本更低、良率更高,量产速度也更快。

业界估测,910C在FP16精度下的单卡算力能达到800TFLOPS左右,大概是英伟达H100芯片(2022年推出)的80% 。不过,910C的芯片逻辑面积大约比H100多60% 。这也意味着910C在架构效率和设计优化方面,和H100还是存在一定差距的。910C的HBM高带宽内存仍然来自海外厂商(国内DRAM制造商长鑫存储HBM2e相关技术还需要再等等),但芯片的整体国产化比例据说已经达到90%以上 。

关于910C的消息比较神秘,根据网络上不太确定的信息,910C于2024年四季度推出样片,2025年一季度开始量产,目前已经处于大规模出货阶段,全年销量大概在70 - 80万颗 。也有消息说,2024年910B的出货量约四十万张,今年910B出货量可能与去年持平或略低(约30万张),而910C的出货量预计可能超过40万张 。因此,华为今年910B + 910C的整体出货量可能是70 - 100万张 。出货量和产能也有很大关系,中芯国际N+2工艺良率去年只有20%,今年据说已经达到40 - 50% ,分配给910C的产能貌似是2.6万片晶圆/月(数据不太确定,仅供参考)。价格方面,910B的均价据说大约是11万/片,910C可能是18 - 20万/片 。网上很多文章说910C价格是1800美元,感觉不太靠谱。相比之下,英伟达H100的市场价格,大约是2.5 - 3万美元/张 。

本小章还未完,请点击下一页继续阅读后面精彩内容!

对了,华为前段时间推出的CloudMatrix 384超节点,由384颗昇腾910C芯片构建,系统性能比英伟达的GB200 NVL72更强 。这就像是“群殴”模式,虽然单芯片的性能比不过人家,但通过系统层面的创新,组成更大规模的集群,也能在一定程度上弥补差距,满足算力需求。

在连接方面,华为自研的HCCS高速互连接口也很厉害。昇腾910集成了HCCS、PCIe 4.0和RoCE v2接口,可以灵活高效地实现横向扩展和纵向扩展 。HCCS对标的是英伟达的NVLINK,能够给内核、设备、集群提供系统内存的一致访问 。在单一链路的单向/双向互联带宽上,HCCS有显着优势,可以有效提升多个Al芯片协同训练的能力。

热门小说推荐
我的女警妈妈

我的女警妈妈

妈妈的名字很好听,叫黎绮雯,是个警察。她经常对我说,她随时都有可能在追捕罪犯的过程中丧命,到那时候,我需要学会如何保护我自己。现在的我看起来太懦弱了,妈妈有时候看我的眼神总是有些恨铁不成钢,我知道妈妈心中一定是觉得,作为一个警察的儿子,懦弱成这样,如果是被别人外人知道了,一定会笑掉自己的大牙。...

大泼猴

大泼猴

苍穹动摇时,我放声狂笑,挥动如意金箍棒,砸它个天翻地覆! 此后一万年,你们还会记住我——齐天大圣孙悟空! ※※※ 这个世界上总有那么一些人,他们英勇无畏,固执,乃至偏执,不羁,骄傲,而又狂妄。即使到了绝境,他们也绝不妥协。 宁愿死,也不愿输。...

晏捕头

晏捕头

左手锅,炒人间美味;右手刀,辨世间冤屈 从现代法医到古城仵作,到天下第一女捕头 晏骄亲身书写着传奇。 而这个成功女人背后的男人,定国公, 也终于过上了相妻教子看家带娃的退隐生活。 【不是,划掉!!】 现代女法医与半退隐将军吃喝查案的故事, 夫妻搭档,干活不累!故事发生在上部结束后两年1个月...

神级修炼系统

神级修炼系统

一次意外,让宅男秦少风穿越重生到了异世,成为了连泱国蓝江城秦家大少。什么修为被废?丹田也无法修复了?不怕,咱有一个神级修炼系统,破坏的再严重的丹田也能修复!系统在手,功法无尽任我有!达摩老祖的易筋经……齐天大圣的火眼金睛……李寻欢的小李飞刀……美好的世界,我秦少风来了!......

晓风书院的八卦事

晓风书院的八卦事

盛世太平,朝中无事,能引起些许波澜的,无外乎一些八卦。 某日,号称天下第一才子、第一美男子、第一风流子的白晓风,办了家晓风书院。 一时间,什么公主、郡主、才女、千金……蜂拥而至,各个醉翁之意不在酒。 史官程子谦蹲点晓风书院,各种“子谦手稿”流出,流到街头巷尾又流到皇宫内院,白晓风最终情归何处,成了都城百姓茶余饭后津津乐道的话题。 慢住,说到这里,大家是否认为本书的主角就是白晓风?非也! 皇朝有个将军,叫索罗定,这位名字拗口又玩世不恭、“臭名远播”还不受欢迎的皇朝第一高手,才是本书的男主。 皇帝给了索罗定一个任务,让他进书院做卧底,汇报第一手资料,偶尔推波助澜偶尔破坏好事,好让皇帝在跟嫔妃们打赌时稳赢不输。 另外,皇帝还让索罗定顺便去学学礼仪,改改他那一身的痞气。 而负责“管束”索罗定的,是白晓风那位毒嘴又八卦的漂亮妹子白晓月。 索罗定就这么跟白晓月杠上了,这丫头不是一般的难对付!...

娇花系统教我做O

娇花系统教我做O

舒天,Omega,仗着自己天生拥有3s级精神力在学校里耀武扬威,牛逼冲天。 可他做梦都没想到,有朝一日他竟然被所谓的娇花系统成功绑定。 【任务一:您的学习成绩下降,请去找未婚夫要个安慰的抱抱。】 【任务二:您的衬衫脏了,请向未婚夫借件儿他的衬衫来穿。】 【任务三:您的未婚夫身负重伤,行动不便,请您用毛巾帮他仔细擦拭身体。】 舒天握着手里的毛巾,看了看躺在床上“行动不便”却还释放着Alpha信息素的男人。 顿时黑脸掀桌:什么狗屁系统!老子不干了! 系统:叮,请维持好娇花人设哦,系统惩罚中…… 舒天立马身子一软,泪眼婆娑,面色微红的在心里爆了句粗口:系统你大爷! 文案二: 秦景恒和他暗恋多年的Omega有了婚约,原本以为他会厌恶拒绝,却没想到那人突然变了性子,娇娇软软的老想往他怀里钻。 面对心上人的撒娇关怀,他抑制了七年的感情终于一发不可收拾…… *abo星际文/只想谈个恋爱的甜饼/日常流水账/不生子 *(大写加粗)系统会有强制任务的元素*...