IT之家 11 月 12 日音问,摩尔线程晓示开源高性能线性代数模板库 MUTLASS,以便开辟者简略更高效针对摩尔线程全功能 GPU 的 MUSA Core 及 Tensor Core 等单位进行编程,加快基于国产 GPU 的算子开辟以及算法鼎新。
看成摩尔线程专为 MUSA 架构优化的高性能缱绻库,MUTLASS(MUSA Templates for Linear Algebra Subroutines)是基于开源模板库 CUTLASS 进行的 MUSA 适配和定制化开辟、优化。
针对矩阵乘法及相干变种,MUTLASS 提供了一系列高性能的 C++ 模板组件,并弃取了与 muDNN 库通常的分层剖判及数据搬运计谋,以确保性能的充分发达。
在本次开源的版块中,摩尔线程适配了 CuTe 后端库,为其加多了第三代 MUSA 架构的 MMA 缱绻原语,撑握 TF32 / FP16 / BF16 / INT8 等多种数据精度,并以此为基础,初步已毕了矩阵乘法、默许实例库、性能测试器及相干器用包的撑握。
IT之家附 MUTLASS 开源地址:https://github.com/MooreThreads/mutlass九游体育app娱乐