软硬件协同释放潜能:让“纸面算力”变“有效算力”
来源: | 作者:秘书处 | 发布时间: 2026-06-08 | 2 次浏览 | 🔊 点击朗读正文 ❚❚ | 分享到:

如何提高利用效率,让算力带来更多产能?怎样通过问题导向,创新技术、优化成本,促进应用落地?

在国家顶层设计上,算力产业的发展路线图越来越明晰。十五五规划纲要提出,加强算力设施支撑”“提升算力普惠易用水平。今年政府工作报告提出,实施超大规模智算集群、算电协同等新基建工程”“加强全国一体化算力监测调度

我们要推动纸面算力更高效地转化为有效产能在近期举办的鲲鹏昇腾开发者大会2026”现场,多位来自高校的科研人员表示,软硬件深度协同优化将减少超大规模大模型训练中的系统内耗,加速推动应用落地。

把脉算力消耗症结

过去存在一种误区,认为硬件性能会持续迭代升级,产业重心多聚焦在软件开发层面。浙江大学软件学院特聘研究员常志豪指出,如今摩尔定律已接近物理极限。当硬件的代际红利放缓,系统性的软硬协同优化就不再是锦上添花,而是决定算力能否真正释放价值的核心工作。

这一现象在万卡集群的分布式训练中尤为明显。北京大学计算机学院助理教授刘古月说,行业过往评判算力水平,多聚焦单卡或单台服务器的硬件指标。但在超大模型训练,依托数万张算力卡进行分布式协同作业的背景下,跨节点的网络传输存在数据拥堵与算力等待的情况。

东数西算等工程提出构建多层次算力调度架构,提升算力网络传输效率。在刘古月看来,这一顶层设计的核心落点之一,就是通过算法与通信协议的持续迭代,解决集群内部的拥堵问题,让硬件算力从被空耗变成被驱动

异构协同压降成本

数据顺畅流动后,下一个问题接踵而至,计算资源如何配置才不会浪费?

清华大学计算机科学与技术系副教授章明星提到,大模型训练与推理的不同环节对资源的需求差异大,有的阶段需要密集的矩阵运算,有的阶段则偏向逻辑处理和序列生成。单一硬件架构往往只能在其中某一个环节高效运转,其余环节容易陷入低效等待。

章明星认为,通过分而治之、异构协同的策略,针对大模型不同阶段的资源诉求,精准匹配CPU与自主架构的人工智能(AI)加速芯片的差异化计算能力,降低词元(Token)的生成成本,为新技术的普惠共享提供了经济可行性。

随着软硬协同将算力门槛和综合成本推向更合理的区间,受益者不仅是互联网大厂。北京大学计算机学院副教授熊英飞认为,伴随单位算力成本持续下探,结合大模型赋能的代码自动化研发,软件开发的门槛将被系统性压低。以往需要专业团队才能完成的工作,中小开发者甚至初创企业借助AI工具有望逐步落地。这种技术普惠效应,也将成为中小企业数字化转型培育专精特新小巨人企业的底层支撑。

场景落地释放产能

业界人士勾勒出的技术逻辑链,在产业一线初步显现。

浙江大学人工智能学院百人计划研究员朱霖潮在数字文化产业一线看到了改变。他说,AI视频在生成过程中,短短数秒内就会产生数十万级的视觉Token,且画面要保证场景、外观语义、物理逻辑的高维一致性。这对算力是极高的实时挑战。在传统模式下,视频生成往往面临耗时较长、效率有限的瓶颈。如今,得益于底层算力结构的持续优化与模型压缩技术的协同进步,这一瓶颈正在被快速打破。这种效率的量级跃迁,正深刻推动数字内容创作的生产力革新。

在关乎国计民生的气象预报领域,清华大学计算机科学与技术系助理研究员王一鸣见证了软硬协同的价值。他介绍,气象预报是一个极度依赖高并发、低延迟的计算场景。预报时效每提升一天,计算复杂度都呈指数级上升。相较于以往模糊的城市级预报,现在通过数百个监测点位精准演算,将常规天气预报有效时长稳定提升至7天以上。提前预警极端天气,能够指导农业生产、防灾减灾。

从底层技术攻坚到成本控制、从减少系统消耗到场景落地,计算科学的不断成熟,离不开科研力量与产业主体的双向奔赴。

华为计算战略与业务发展部部长朱照生表示:随着AI智能体、多模态迅速发展,我们将持续完善开发工具链与开源社区,深化校企合作,通过技术赛事、开源生态和高校科研攻关等,为开发者提供全方位支持,共同构建健康的计算产业生态。


转自:软硬件协同释放潜能:让“纸面算力”变“有效算力”--经济·科技--人民网