得益于国内软硬件厂商协同发力,DeepSeek模型性能正在快速释放。近日,澎峰科技正式宣布,公司自主研发的PerfXLM+推理框架已基于海光DCU,完成对DeepSeek全系列模型的深度适配与优化,进一步提升了AI大模型应用效能

图片1(1).png

DCU深度协同,推动大模型降耗增效

PerfXLM+推理框架通过底层架构优化,全面适配海光DCU算力平台,为DeepSeek模型提供高性能支持。针对DeepSeek-R1-Distill系列等模型,框架结合海光DCU的并行计算能力,可显著降低资源消耗,在同等硬件条件下进一步提升推理效率。

图片4.png

此外,海光DCU采用GPGPU通用加速计算架构设计,基于其高度兼容性与生态开放,DeepSeek模型可直接在海光DCU上运行,大幅减少底层适配工作量,技术团队仅需聚焦模型精度验证与持续性能优化,即可实现高效部署。

目前PerfXLM+推理框架通过模型量化、算子融合等核心技术,正在进一步挖掘海光DCU的异构计算潜力,为企业提供低成本、高稳定的AI推理服务。

核心场景覆盖,满足全行业AI需求

在信创与AI普惠化趋势下,澎峰科技与海光DCU的深度结合,不仅打破了海外技术依赖,更以“框架+硬件+模型”的全栈能力,为全行业企业提供自主可控的AI基础设施服务

图片5.png

从应用层面来看,PerfXLM+推理框架已覆盖自然语言处理、多模态理解等核心场景,客户可基于海光DCU集群实现模型快速迭代与弹性扩展,满足各行各业的实时推理需求,推动AI技术走向规模化应用。

叠加海光DCU架构生态优势PerfXLM+推理框架的高效优化能力,企业AI部署门槛进一步降低,未来将加力赋能DeepSeek模型在产业终端的价值释放,助力中国AI迈向全球产业链前沿