中文114

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

一文读懂华为昇腾芯片:国产ai算力的中流砥柱(第2页)

据说910C之后,还有910D ,采用5nm制程,4Die封装,支持FP8 。今年5 - 6月份回片,预期2026Q2 - Q3大规模量产。不过这个消息来源不太可靠,只能仅供参考。再往后,华为可能就会推出昇腾920系列,采用下一代工艺,更先进制程,努力缩小和英伟达的差距。

除了昇腾310和910之外,华为其实还有昇腾610 。昇腾610也称为MDC610,是智能驾驶芯片,用于华为自己的智能驾驶平台(MDC) 。根据资料显示,昇腾610采用了7nm制程,AI算力达到200TOPS@INT8或100TFLOPS@FP16 ,目前已经实现量产。

三、昇腾芯片的架构奥秘

华为昇腾芯片采用了自家独特的达芬奇架构,这可是昇腾芯片的核心技术之一,就像是给芯片赋予了一颗超级“智慧大脑” 。

这个架构专为人工智能计算设计,具有超高的计算能效比。咱们以昇腾910为例,它强大的算力能够满足大规模深度学习计算的需求 。在处理矩阵运算等人工智能常见计算任务时,达芬奇架构就展现出了极高的效率。比如说,在训练一个超大规模的图像识别模型时,需要处理海量的图像数据和复杂的计算,昇腾910凭借着达芬奇架构,能够快速地完成这些矩阵运算,大大缩短了模型训练的时间。

昇腾芯片还具备先进的张量处理单元(TPU) ,这就像是一个专门为神经网络计算打造的“加速引擎” 。它能够加速神经网络中的张量计算,让模型训练和推理的速度大幅提升 。在图像识别任务中,昇腾芯片可以快速处理大量的图像数据,准确识别出目标物体,这主要就得益于其高效的架构设计和强大的计算核心,以及TPU的加速作用。

而且,昇腾芯片在内存子系统等方面也有创新。就拿昇腾950系列来说,它将内存访问颗粒度从512字节减少到128字节 ,实现更精细的内存访问控制,大幅提升了对离散、不连续内存访问场景的支持能力 。配合华为自研的两种HBM内存技术,形成了完整的场景化内存解决方案。

HiBL 1.0低成本HBM(昇腾950PR搭载) :在保证128GB容量和1.6TB/s带宽的基础上,通过材料与封装工艺创新,将推理Prefill阶段和推荐业务的硬件投资成本降低40%以上 ,解决了大规模部署的经济性瓶颈。这就好比以前买一台设备要花很多钱,现在通过技术创新,用更少的钱就能达到差不多的效果,让更多企业用得起。

HiZQ 2.0高性能HBM(昇腾950DT搭载) :实现144GB超大内存容量和4TB/s带宽,配合2TB/s的互联带宽,满足大模型训练和长文本推理对高访存带宽的严苛需求 ,为千亿参数模型训练提供了充足的内存支撑。比如在训练一个超大型的语言模型时,需要大量的内存来存储和处理数据,HiZQ 2.0高性能HBM就能很好地满足这种需求,保证模型训练的顺利进行。

在精度支持方面,昇腾950系列全面覆盖FP8/MXFP8/MXFP4等业界标准低数值精度格式 ,同时引入华为自研的HiF8精度模式 。在保持FP8计算效率的同时,精度接近FP16 ,有效解决了低精度计算中的精度损失问题 ,使推理结果准确性提升15% - 20% 。这种多精度支持能力使其能灵活适配从图像识别到自动驾驶等不同精度需求的AI场景。比如在自动驾驶场景中,对精度要求就非常高,HiF8精度模式就能在保证计算效率的同时,提高识别的准确性,保障行车安全。

四、基于昇腾芯片的硬件体系

基于昇腾芯片,华为开发了一系列丰富的硬件产品,就像是搭建了一个完整的AI算力“王国”,这些硬件覆盖了边缘推理、云端推理、云端训练三大场景 ,可以满足不同行业用户各种各样的AI计算需求。

本小章还未完,请点击下一页继续阅读后面精彩内容!

(一)Atlas 200I DK A2:开发者的得力“小助手”

Atlas 200I DK A2是面向开发者的高性能AI开发套件 ,它集成了昇腾310芯片,内置2个Al core ,可支持128位宽的LPDDR4X ,最大算力为22TOPS 。对于开发者来说,它就像是一个得力的小助手,方便开发者快速上手进行AI开发。比如说,一些想要开发智能安防应用的开发者,就可以利用Atlas 200I DK A2,快速搭建起一个简单的图像分析系统,进行算法测试和功能验证。

(二)Atlas 300T训练卡:云端训练的“加速引擎”

Atlas 300T训练卡基于昇腾910芯片 ,集成32个达芬奇AI核 + 16个TaiShan核 ,能够提供280TFLOPS FP16的算力 。在云端训练场景中,它就像是一个强大的“加速引擎” 。当企业需要训练大规模的深度学习模型时,Atlas 300T训练卡就能发挥它的强大算力,快速完成模型训练,大大提高了训练效率,节省了时间成本。

(三)CloudMatrix 384超节点:集群算力的“超级战舰”

前面提到的CloudMatrix 384超节点,由384颗昇腾910C芯片构建 ,系统性能比英伟达的GB200 NVL72更强 。它就像是一艘“超级战舰”,在集群算力方面展现出了强大的实力。通过将众多昇腾芯片组合在一起,形成了一个超级强大的计算集群,能够满足那些对算力要求极高的大型企业和科研机构的需求,比如进行超大规模的气象预测模型训练、基因数据分析等。

热门小说推荐
武掌苍穹

武掌苍穹

少年李青掉落悬崖,大难不死,意外成为扶摇星域顶级势力的宗主,从此开启了他霸绝天下的征程。“我之脚下尽皆蝼蚁。”...

灵墟破妄录

灵墟破妄录

在玄幻大陆,星辰之力主宰一切,各大家族与宗门为争夺星髓、灵晶等宝物纷争不断。少年林羽,出身于没落的林家,天生星脉闭塞,被视作家族的耻辱,受尽族人冷眼与唾弃。......

校园风流邪神

校园风流邪神

校园风流邪神情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,校园风流邪神-陨落星辰-小说旗免费提供校园风流邪神最新清爽干净的文字章节在线阅读和TXT下载。...

群星烈火

群星烈火

主角翻阅书籍,来到异世界的明帝国,在这个光怪陆离的异世界,看主角如何求生,探索这个似曾相识,却又极度陌生的世界。......

综影视小说:姒妘

综影视小说:姒妘

大道五十,天衍四九,遁去其一。姜姒妘一个普通女孩的成长史,有爱人友人。类似悠闲的快穿,一切随心。1v1女主:姜姒妘,男主:李莲花/李相夷作者看了李莲花出不来了,自己写着玩的,文笔不好,请见谅。如果不喜欢的请手下留情,直接点退出,一些东西也是自己设定的,如果不喜欢可以走人,作者玻璃心。1.莲花楼2.欢乐颂3.星际兽世......

御兽化身

御兽化身

御兽化身情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的玄幻魔法小说,御兽化身-而龙-小说旗免费提供御兽化身最新清爽干净的文字章节在线阅读和TXT下载。...