在科技飞速发展的当下,AI领域的每一次突破都备受瞩目。最近,DeepSeek V3.1的发布,犹如一颗投入平静湖面的石子,在业界激起层层涟漪,尤其是其中的UE8M0 FP8,更是成为了众人热议的焦点。 为何FP8能成为大模型的“新宠”?相较于传统的 FP16/BF16精度,FP8能将显存需求直接减半,大幅缓解硬件资源压力;而对比INT8(W8A8)精度,FP8的推理精度更高、表示范围更广,完美平衡了“效率”与“精度”。然而,长期以来,FP8精度的原生支持高度依赖海外芯片,严重制约了相关技术的自主发展与广泛应用。 在此背景下,河南昆仑技术有限公司(简称:昆仑技术)基于昇腾灵活易用的Ascend C算子开发框架,成功研发出软FP8解决方案,为大模型部署构建起更经济、更自主的技术路径,更让昇腾平台具备了快速兼容后续新出FP8权重格式模型的能力,进一步丰富了昇腾AI生态的应用版图。 具体来看,该方案通过定制化Ascend C算子实现核心突破:一方面,将FP8权重模型输入昇腾硬件,通过精准的反量化算子,转化为BF16格式参与计算,既保障了计算过程的准确性,又为后续新FP8权重模型的快速适配预留了
随着国家对反洗钱监管力度持续加码,金融机构在客户尽职调查、风险评估等工作中面临诸多挑战。为助力行业破解痛点,8月20日,河南昆仑技术有限公司与新致软件在北京联合举办“反洗钱应用实践”技术沙龙,聚焦金融机构反洗钱实践难题,共探合规高效路径。
8月22日-24日,2025中国算力大会在山西大同举行。本次大会以“算网筑基 智引未来”为主题,聚集算力产业发展政策,展出算力发展最新成果,研讨算力未来发展趋势,并发布“年度重大突破成果”、“创新先锋”等重要荣誉。
近日,由中国电子技术标准化研究院主办的“人工智能标准行——全国信标委人工智能分委会‘标准周’活动”会议在京召开。会上颁发了KunLun G5680 V2 AI服务器《人工智能服务器系统性能测试证书》。
8月13日-16日,第21届CCF全国高性能计算学术年会(CCF HPC China 2025)于鄂尔多斯盛大召开。作为全球三大超算盛会之一,本届大会以“绿动计算 超智融合”为主题,集结顶尖学术阵容,展现全产业链成果与前沿趋势。河南昆仑技术有限公司聚焦高性能计算领域,全方位展示先进的双生态硬件平台、极致性能的软件平台、应用迁移与调优服务、全行业覆盖的HPC实践成果,促进高性能计算蓬勃发展。