昆仑技术助力滴普科技完成模型迁移调优，加速推进国产化生态建设

算力释放难：为充分利用KunLun G5680 V2计算资源，实现自有 Qwen1.5-32b、Qwen1.5-72b、Reranker模型在GCH硬件上的适配。
适配问题多：客户在业务部署的各个阶段均遇到一系列问题。“点亮”阶段：NPU驱动不兼容、集群网络不通等；“跑起来”阶段：模型未适配，迁移过程中遇到训练卡死问题；“用得好”阶段：模型显存占用过大，业务无法在单卡上部署。

推动大模型在产业场景中落地应用

依托软硬深度协同能力，昆仑技术FAE（现场技术支持工程师）团队充分发挥技术优势，逐层拆解问题，快速定位定界，提供从环境部署到业务落地的端到端解决方案，加速客户业务国产化进程：

“点亮”阶段：针对NPU驱动不兼容和集群网络不通问题，昆仑技术FAE团队提供兼容性配套的系统和驱动版本，结合过往项目的集群交付经验，提供成熟的集群部署指导手册，快速帮助客户完成基础环境部署。
“跑起来”阶段：针对未适配模型，昆仑技术FAE团队进行模型迁移适配工作，迁移实施前进行充分的可行性分析；迁移过程中深入分析模型参数和日志，解决训练卡死问题；迁移完成后从单机训练拓展到集群训练&微调，快速拉起模型集群测试。
用得好”阶段：针对客户Reranker模型显存占用过多的问题，昆仑技术FAE团队通过升级torch版本，对模型进行Quanto量化等优化方案，将模型显存占用从40G降低到19G，优化后的显存占用仅为A800的50%，大大降低客户的业务成本。

数字化与智能化正以前所未有的速度重塑着我们的世界。在这个过程中，昇腾以其强大的计算能力，为数字化与智能化的发展提供了坚实的基础。未来，昆仑技术将继续紧抓 “人工智能 +” 趋势，积极拥抱昇腾根技术路线，在大模型开发的三阶段：点亮、跑起来、用得好，持续构建模型迁移、适配和调优的能力，为行业的数智化转型注入新的动力。

分享至

上一篇：昆仑技术团队在昇思MindSpore模型开发挑战赛中斩获佳绩

下一篇：第六届中国超级算力大会 | 昆仑技术获评2024中国算力卓越企业