发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

华为携手湖北移动完成全国运营商首个AI推理加速测试:性能显著提升

2026-06-27来源:快讯编辑:瑞雪

在2026 MWC上海展期间,华为与中国移动通信集团湖北有限公司共同宣布,双方成功完成全国运营商首个AI推理加速解决方案的现网测试。这一突破性成果标志着AI技术在运营商领域的应用迈入新阶段,为智能计算业务的高效部署提供了坚实的技术支撑。

此次测试依托华为OceanStor A800存储系统与昇腾A3超节点架构,结合UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了Token吞吐率最高提升372%的显著效果。测试团队在湖北移动现网环境中部署了vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K长序列输入场景,全面验证了方案的实际性能。

在MiniMax M2.5模型测试中,启用UCM技术后,首Token延迟(TTFT)优化幅度达26%至62%,单NPU卡Token输出效率(TPS)显著提升。具体数据显示,64K序列长度下TPS提升58%,128K序列长度下提升78%,验证了方案在不同长度序列下的稳定性与高效性。

GLM-5.1模型的测试结果更为突出,UCM技术带来的加速效果显著增强。TTFT优化幅度达51%至93%,TPS提升范围为56%至372%。其中,64K序列长度下TPS提升313%,128K序列长度下最高提升372%,充分展现了方案在复杂长序列推理场景中的优势。

华为相关负责人表示,测试数据表明,随着上下文长度的增加,AI推理加速方案的优势将进一步放大。该方案有效突破了长序列推理中的KV Cache容量瓶颈,为运营商在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中提供了高效解决方案,有助于提升现网智算资源的利用率,同时降低长上下文推理带来的性能压力。

MWC上海2026:临舟科技HAPS平台,6G时代通信新势力崛起之路
但所有卫星都有一个硬性界限,必须飞到距地面100千米(卡门线)以上的太空区域运行,目前主流低轨卫星飞行高度都在几百至上千千米。在6G的赛道上,绝不仅仅只有大家熟知的低轨卫星,还有大家以前比较陌生的高空平台飞艇…

2026-06-27

量子科技与AI深度融合 驱动通信产业迈向智能安全新未来
他指出,一方面,借助量子精密测量技术,可精准排查芯片光路、电路缺陷,提升产品良品率与综合性能;另一方面,基于量子原理打造的光量子芯片,在特定任务中具有高速运算、低功耗、大带宽等潜在优势,是未来量子通信、量子…

2026-06-27