CGC FORUM | GCC成功举办业界首次低精度AI计算专题研讨,共启高能效AI计算新征程
2025-11-20
以下文章来源于微信公众号——全球计算联盟GCC
2025年11月8日下午,作为CGC2025的收官之作,低精度AI计算专题沙龙研讨成功举办。这次研讨由GCC智算产发委联合华为、商汤、神州鲲泰、魔乐社区共同发起,来自芯片、模型、整机、系统、高校和科研机构的40余名技术与产业专家围绕芯片能力如何匹配大模型发展、计算产品对低精度计算及配套工具链的需求展开了热烈的讨论。这次会议旨在通过最新研究进展共享与多角度观点碰撞破解AI算力瓶颈,推动新型计算生态高质量发展。

作为一场定位于充分交流的会议,本次研讨以特邀嘉宾引导发言+会场专家提问讨论的形式开展。来自华为的技术专家李建鹏、余子伟首先带领大家回顾了业界8比特数据格式的发展过程,之后详细介绍了华为发明的新一代8比特浮点数据格式HiF8,并欢迎各界伙伴在GCC智算产发委计算数据格式工作组的平台上加入团标编写、参加联合创新。


对大模型算子研究多年的专家、华南理工大学计算机科学与工程学院陆璐教授向大家介绍了FP8算子性能大幅提升的量化算法和设计优化等研究,以及在昇腾卡上实践的成果。

来自清华大学深圳国际研究生院唐彦嵩副教授团队的王子轩、伍越介绍了通过基于salience矩阵的分组量化、时间步迁移等技术对扩散模型的显存占用压缩与推理速度提升。

在芯片设计和算法研究专家分享后,来自商汤科技的架构师梁凯焕分享了商用模型在应用FP8低精度数据格式方面遇到的挑战及解决方案,如框架适配、Scaling策略选择、训练精度等。

从产品开发和解决方案商用的角度,来自神州鲲泰的资深AI专家高洪福基于对低精度技术发展的洞察分析,提出定义低精度计算通用核心规范、建立开放低精度合规性与性能基准测试套件等标准化与联创思路,并提议由GCC设立产、学、研、用共同参与的特别兴趣小组,以推动低精度技术产业化的协同研究和“分层协同”的开放式低精度计算标准体系建设。

来自中国电信研究院的王学聪专家基于应用开发者对底层新特性通常的接受过程,建议GCC作为产业和标准组织通过白皮书的形式让各类开发者快速了解怎样将HiF8低精度计算用起来,并对HiF8的生态建设、推理框架支持、重要功能特性规划等也提出了具体建议。

针对大家对低精度数据格式在大模型应用的疑问,来自华为的AI核架构师罗元勇予以了积极的回应,并欢迎芯片、模型、系统、应用等各环节的产业和研究伙伴加入HiF8标准与联创,共同打造开放的HiF8标准与生态。

在主题发言嘉宾的引导下,现场来自各方的与会专家做了深入且充分的交流,从技术问题到解决方案,再到验证结果,从芯片节奏到配套工具,再到GCC后续专题工作的规划。随着讨论的深入,也迸发更多的发展思路。

这次研讨会上,GCC还启动了《HiF8团体标准》及《低精度AI计算产业白皮书》的编写工作。
其中,《HiF8团体标准》将针对HiF8浮点数据格式的定义进行标准化,并给出其应用于训练/推理的典型参考案例。该标准计划于即日起征集参编单位并启动各部分研究、编写,期间由GCC组织相关讨论,于2026年1月提交公示、2026年2月发布。
《低精度AI计算产业白皮书》将通过参编单位的讨论提炼产业共识:业界主流的低精度浮点数据格式所适用的应用场景,对产业界应用低精度AI计算的建议和推荐方案,对技术应用及未来演进所需的技术研究给出建议。该白皮书计划于即日起征集参编单位,于2025年12月开始各部分研究、编写,期间由GCC组织相关讨论,预计于2026年3月发布。

这次沙龙的成功举办,为低精度浮点数据格式应用于商用AI计算搭建了首个产学研用交流平台,未来,GCC将围绕如何用好低精度数据格式、基于低精度数据格式的应用创新开展系列化的沙龙研讨,加速整个产业界对低精度计算的接纳,助力数智社会可持续发展。
敬请关注GCC智算产发委相关资讯,我们将持续发布关于HiF8的技术剖析与低精度计算的研究计划。
欢迎有兴趣参与推动中国乃至全球低精度计算的产业伙伴和科研机构加入HiF8标准编写与相关研究活动,可联系智算产发委执行秘书长熊华xionghua@gccorg.com
