幸福梧桐湖

查看: 115|回复: 0

[热点] DeepSeek宣布开源DeepGEMM

[复制链接]

223

主题

224

帖子

555

积分

超级版主

Rank: 8Rank: 8

积分
555
发表于 2025-2-26 17:48:28 | 显示全部楼层 |阅读模式
【#DeepSeek宣布开源DeepGEMM#,同时支持普通的和专家混合(MoE)分组的GEMM运算】据新浪科技报道,DeepSeek开源周(OpenSourceWeek)第三日,在宣布开源MLA解码核FlashMLA以及DeepEP两款代码库后,DeepSeek今日再次宣布开放了DeepGEMM代码库。

tovlzdom.png

据DeepSeek方面介绍,DeepGEMM是专为简洁高效的FP8通用矩阵乘法(GEMMs)而设计,它同时支持普通的和专家混合(MoE)分组的GEMM运算。该库使用CUDA编写,在安装过程中无需编译,通过在运行时使用轻量级即时编译模块来编译所有内核。

目前,DeepGEMM仅支持英伟达Hopper架构运算,为解决FP8张量核心累加不精确的问题,它采用了CUDA核心的两级累加(提升)方法。该代码库设计非常简洁,只有一个核心内核函数,代码量约为300行。来源:福布斯中文网

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2022-2025 joywth.com All Rights Reserved 鄂ICP备2023010813号-4

统计:今日: |昨日: |帖子: |会员: |最新回复

快速回复 返回顶部 返回列表