关闭广告

华为版CUDA,全面开源了

量子位2025-08-07 00:00:014877人阅读

红交 发自 凹非寺
量子位 | 公众号 QbitAI

华为版本CUDA,全面开源开放!

最新消息,华为宣布为其昇腾AI GPU开源其CANN软件工具包。



华为轮值董事长徐直军在主题演讲中强调:华为AI战略的核心是算力,并坚持昇腾硬件变现。

基于这一背景下,徐直军在会上宣布华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用

CANN,神经网络计算架构,提供多层编程接口,帮助用户构建针对华为昇腾的AI应用程序。

它是一个由多种技能栈和算子加速库等组成的软件生态系统,换句话说,它就像是华为版本的CUDA,为GPU提供相同的接口。

巧合的是,同一天,一传奇GPU大佬创业公司终于浮出水面,他们不搞消费级GPU,而是做CUDA类似软件生态系统。



看来,想要挑战英伟达的玩家可真不少。

华为版CUDA全面开源

过去,开发者苦于CUDA封闭生态系统久矣。

除了英伟达自身硬件,CUDA几乎不支持其他第三方,因此开发者如果想用CUDA来构建软件,就只能使用英伟达的GPU。这其实也构成了英伟达的核心壁垒。

因为一旦开发者想要迁移到其他产品。那么就需要重写代码,使用生态相对不成熟的替代库,同时也会失去英伟达围绕CUDA建立起来的庞大技术社区的支持。

之前有项目尝试将CUDA功能(通过转换层)引入其他 GPU供应商,但由于英伟达阻拦,这些项目大多未能成功。2024年CUDA 11.6版开始,就禁止使用转换层。

如今,在昇腾计算产业发展峰会上,华为宣布开源CANN架构,以及Mind系列应用使能套件及工具链也跟着开源,那么开发者可以自主深度挖掘昇腾GPU的潜力。

目前CANN已经升级到8.0版本,它主要提供两个版本:社区版,提供新功能的早期体验;商业版,提供专为企业用户量身定制的稳定版本。两个版本都更新到了8.2.RC1版本,新增适配12款操作系统。

与CANN配套的,还有华为自研深度学习框架MindSpore,其作用类似于PyTorch,这些工具共同构成了华为原生的AI软硬件方案。



截至目前,CANN已支持包括PyTorch、MindSpore、TensorFlow、飞桨、ONNX、计图、OpenCV和OpenMMLab等深度学习框架与第三方库。



在会上,与会代表和华为还共同发起了《CANN开源开放生态共建倡议》。

看来在构建开源开放的昇腾生态这件事儿上,华为已经开始大力出手了。

传奇GPU架构师创业,对标英伟达CUDA

而挑战英伟达CUDA生态的,业内还有不少玩家。

比如就有一位传奇GPU架构师Raja Koduri,宣布创立了一家GPU初创公司Oxmiq Labs。



他曾效力于AMD、苹果、英特尔等,曾在英特尔担任加速计算系统和图形(AXG)业务执行副总裁。加入英特尔之前,他曾担任AMD的图形部门Radeon Technologies Group的高级副总裁兼首席架构师。

而现在创立的这家公司专注于开发GPU硬件和软件IP,并将其授权给各方。他将这家公司定位为硅谷25年以来第一家GPU初创公司。



不过他们不打造消费级GPU,也不开发GPU所需的所有IP模块,他们提供一个垂直集成平台,该平台将GPU硬件IP与功能齐全的软件堆栈相结合,旨在满足AI、图形和多模态工作负载的需求,在这些工作负载中,显式并行处理至关重要。



在硬件方面,Oxmiq提供了一个基于RISC-V指令集架构(ISA)的GPU IP核OxCore,该核将标量、矢量和张量计算引擎集成在一个模块化架构中,并支持近内存和内存计算功能。

Oxmiq还提供基于芯片集(chiplet)的系统级芯片(SoC)构建器OxQuilt,使客户能够根据特定工作负载需求,快速且经济高效地创建集成计算集群桥接器(CCB,可能集成OxCores)、内存集群桥接器(MCB)和互连集群桥接器(ICB)模块的SoC。



例如,用于边缘应用的推理AI加速器可以封装一个或两个CCB和一个ICB,推理SoC则需要更多CCB、MCB和ICB,而用于AI训练的大规模SoC则可能封装数十个芯片集。

Oxmiq尚未透露其OxQuilt是仅支持构建多芯片集系统级封装(SiP),还是也可用于组装单片处理器。

不过他们的软件业务似乎更为核心和关键。他们提供的软件包可以兼容第三方的硬件,支持在各种硬件平台上部署AI和图形工作负载。



该软件堆栈的核心是OXCapsule,这是一个统一的运行时和调度层,用于管理工作负载分配、资源平衡和硬件抽象。

该堆栈的一个突出组件是OXPython,它是一个兼容层,将以CUDA为中心的工作负载转换为Oxmiq的运行时,并允许基于Python的CUDA应用程序在非英伟达硬件上无需修改即可运行,无需重新编译。

OXPython最初不会在Oxmiq的IP上发布,而是在Tenstorrent的Wormhole和Blackhole AI加速器上发布。

事实上,Oxmiq的软件堆栈从根本上设计为独立于Oxmiq硬件,这是其战略的核心部分。

不管最后结果如何,但竞争的号角已经吹响,最终受益的究竟还是开发者。

参考链接:
[1]https://x.com/RajaXg/status/1952633159818060164
[2]https://www.tomshardware.com/tech-industry/artificial-intelligence/huawei-is-making-its-ascend-ai-gpu-software-toolkit-open-source-to-better-compete-against-cuda
[3]https://www.tomshardware.com/tech-industry/artificial-intelligence/legendary-gpu-architect-raja-koduris-new-startup-leverages-risc-v-and-targets-cuda-workloads-oxmiq-labs-supports-running-python-based-cuda-applications-unmodified-on-non-nvidia-hardware
[4]https://mp.weixin.qq.com/s/cK7REZ9_ToHPEq4iyWoRqA

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

狗狗被宠物店放烘干箱一小时活活烤死 门店谎称是中暑

极目新闻 浏览 8062 07-24

REDMI Note 15 Pro将搭载1.5K超级阳光屏,峰值亮度达3200尼特

IT之家 浏览 6146 08-19

定位顶级奢华MPV 奔驰VLE测试谍照曝光

车质网 浏览 48 10-17

美国与印尼贸易协议细节来了:新增至少500亿美元美商品市场准入,印尼关键矿产出口“畅通”

华尔街见闻官方 浏览 1725 07-23

印度回怼美国所谓"二级制裁":买谁的能源我们说了算

国际在线 浏览 2616 07-21

阿隆索:我们在安菲尔德跑动太少?不能凭一场比赛下结论

懂球帝 浏览 44 11-09

上汽尚界H5将杀入20万级市场 华为ADS 4首度普惠

大侠上车 浏览 9110 07-26

李亚鹏带货卖超千万?网友说他是不会蹭热度的人

安宁007 浏览 7 01-19

周冬雨刘昊然没分手?女方为男方新片上映包场,网友直呼真爱

萌神木木 浏览 9198 07-27

鸿铭股份创始人夫妇拟退出董事会,25岁哥大硕士儿子将加入

红星资本局 浏览 5 01-23

正面迎战苹果 雷军讲述小米如何“逆天改命”

中国商报 浏览 87 09-26

澎湃新闻总裁、总编辑刘永钢:变革是一场没有终点的征程

澎湃新闻 浏览 7610 07-25

韩鹏过招邵佳一!鲁媒:泰山阵容还存在变数,防线遇挑战

直播吧 浏览 85 08-22

中央定调!“十五五”目标确立,未来5年养老金还会涨吗?

数字财经智库 浏览 55 10-27

怀特谈被交易:当时我满脑子想的都是他们为什么不要我了

直播吧 浏览 8517 07-30

王梦迪团队「自我进化agent」综述:从静态LLM到超级智能ASI

学术头条 浏览 1452 08-09

华硕无畏Pro16 2025福利来袭:AI轻薄本高能体验,到手6399.2元

IT之家 浏览 5510 08-12

女演员自曝曾遭受校园暴力!留下心理阴影

鲁中晨报 浏览 17 01-15

特朗普称认定委内瑞拉现政府是“外国恐怖组织”

极目新闻 浏览 20 12-17

小鹏汽车品牌充电站登陆新马泰,为当地G6、G9、X9等车型提供支持

IT之家 浏览 80 09-25

李凯尔更新中文社媒为男篮鼓气:硬汉们干得漂亮

懂球帝 浏览 8061 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3