在当今AI时代,算力如同石油一般,成为了稀缺且关键的资源。2023 – 2024年间,智算中心作为“新基建”的主旋律蓬勃发展,我国算力规模在2024年9月已达246 EFLOPS,智能算力同比增长超65%,各行业算力应用项目超过1.3万个。然而,这看似繁荣的表象下,却隐藏着诸多问题,中国算力面临着从资源堆砌到生态流动的艰难转型。
算力资源的现状:量与质的失衡
(一)算力中心建设火热但运营不佳 智算中心建设的热潮涌起,大量社会资本涌入,众多智算中心纷纷建立。但实际运营状况却令人堪忧,平均机柜利用率仅在20% – 30%,部分企业级中心甚至低至10%。这表明虽然算力在“量”上有巨大的突破,但在“质”的方面,即实际的使用效能上,却未能同步提升。
(二)供需失衡与资源错配 从评估智算中心算力使用的关键指标来看,上架率和点亮率反映出整体算力利用率仅32%。多地对算力进行摸底工作,这一举措背后折射出行业面临的供需失衡、资源错配等结构性问题。一方面,许多企业难以找到符合业务需求的优质算力资源,大部分由分散社会资本建设的智算中心规模多在1000P上下,这些资本不懂行业需求,难以找到合适的需求方;另一方面,对于创业公司而言,存在找不到、用不起算力的普遍问题,即使找到算力,面对裸金属设备也不会使用。此外,国产芯片生态存在割裂,多模型和多芯片导致的异构算力,不同厂商芯片架构和指令集互不兼容,使得算力资源无法高效流动,国产卡企业也面临用不起来的困境,出现了人工智能企业“算力荒”,智算中心却在“卖卡”求生的奇特现象。
无问芯穹的破局思路:清华基因与算力运营的野心
(一)清华系团队的创业与资本青睐 2023年5月,由清华大学电子工程系教授汪玉发起,其博士生夏立雪、戴国浩等人联合创立了无问芯穹。这个团队有着鲜明的清华基因,汪玉是国际电气与电子工程师协会会士,清华大学电子工程系主任,也是AI芯片公司深鉴科技的联合创始人之一;夏立雪本科和博士均毕业于清华电子系,研究方向是AI芯片与算法协同优化;联合创始人颜深根有着在商汤科技的工作经验并现任清华大学副研究员。这种背景让无问芯穹在成立不到两年就完成了近10亿元融资,投资方包括众多知名机构,其融资速度和规模在AI算力硬科技赛道并不多见。
(二)算力运营商的目标与技术理念 无问芯穹将自己定义为大模型时代的“算力运营商”,其核心目标是解决中国算力市场的痛点。在英伟达CUDA生态占据绝对优势的背景下,国产芯片厂商各自为战,开发者更换硬件需重新适配代码,生态割裂严重制约国产算力应用价值。无问芯穹打造以“M×N”为特点的云端算力网络,旨在汇聚全局的异构、异域、异属的算力,使其成为“智能感知、实时发现、随需获取”的网络。在技术实现路径上,通过统一中间层屏蔽硬件差异,让开发者无需关心底层芯片,并且针对大模型的训练、推理等场景优化国产芯片性能表现,将使用差距压到体感阈值以下。这一技术理念在第二十届研电赛中得到验证,无问芯穹作为命题企业,设置的赛事吸引了高校团队参与,公司不仅提供产业命题,还反馈技术需求给高校团队,通过产学研用协同机制,缩短科研成果产业化周期,构建完整AI基础设施生态。
无问芯穹的竞争力:三个“盒子”的布局与优势
(一)“三个盒子”的产品战略 无问芯穹以云端结合的方式推进商业化进程,在产品打磨和早期商业化落地阶段,提出了三个关键指标:易用性、稳定性和性价比。在2025世界人工智能大会上推出的全规模AI效能跃升方案的三大核心产品,被形象地称为“三个盒子”。“大盒子”无穹AI云,底层是基于“一网三异”调度架构的广域算力网,覆盖“东数西算”关键节点,汇聚26个省市、53个核心数据中心的庞大算力资源,整合超15种主流芯片架构的异构算力池,总算力规模超25000P。基于强大的广域高性能专线内网互联互通,用户能按需在不同地域、型号的算力资源间实时切换与无缝迁移,体现易用性与稳定性。“中盒子”无界智算平台,面向百卡至千卡级大型智算集群,以“全链路解决方案”提升算力性价比。在与上海算法创新研究院合作中,基于3000卡沐曦国产GPU集群稳定支撑百亿参数大模型训练600小时不间断,在服务云南移动时,高效利用2000张华为昇腾910B加速卡实现千亿参数模型的分布式部署与大规模推理,印证了其在复杂场景下的稳定性与性价比优势。“小盒子”无垠终端智能,针对单卡至十卡级的有限算力终端,让终端算力好用又经济。携手上海创智院打造的全球首款端侧本征模型无穹天权Infini – Megrez2.0,突破终端设备资源局限,打破终端“能效 – 空间 – 智能”的不可能三角,适配各类终端设备,扩展算力服务边界。
(二)应对产业问题的实践意义 无问芯穹的“三个盒子”试图在单卡至十万卡算力的全规模软硬件场景中释放每一份算力的最大潜能。当面临“算力碎片化”与“成本高昂”的问题时,通过底层的算子、通信、调度、容错等方面的技术创新和实践,大幅提升算力资源的实际利用率,显著提升单位算力的性价比和服务质量。例如,在异构情况下,通过技术发展,部分不同芯片混合的算力利用率最高能达到97.6%,使用者几乎感觉不到算力异构的体验差异。这表明无问芯穹在解决中国算力市场问题上有着积极的实践意义,为构建能让算力真正流动起来的生态体系提供了珍贵的样本。
中国算力不应仅仅停留在智算中心数量和规模的增长上,更需要构建一套能让算力像水和电一样自然流动的生态体系。无问芯穹的探索与实践,从解决算力资源供需失衡、生态割裂等问题出发,通过打造算力网络、推出具有竞争力的产品等多方面努力,为中国AI产业走出“有算力难用”的困境提供了方向和希望。当开发者能轻松调用国产算力,芯片厂商能依据真实需求迭代产品时,中国算力才能真正发挥其在AI时代的核心竞争力,推动整个产业的蓬勃发展。