国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

摩爾線程宣布正式開源高性能線性代數模板庫MUTLASS 加速國產GPU開發

發布時間:2024-11-13 08:29    發布者:eechina
關鍵詞: 摩爾線程 , MUTLASS , GPU
近日,摩爾線程宣布正式開源高性能線性代數模板庫MUTLASS,這一舉措旨在幫助開發者更高效地針對摩爾線程GPU的MUSA Core及Tensor Core等單元進行編程,從而加速基于國產GPU的算子開發以及算法創新。MUTLASS的開源地址為:https://github.com/MooreThreads/mutlass

作為摩爾線程專為自研MUSA架構優化的高性能計算庫,MUTLASS(MUSA Templates for Linear Algebra Subroutines)是基于開源模板庫CUTLASS進行的MUSA適配和定制化開發、優化。在數值計算和深度學習領域,矩陣乘法(GEMM)及其變種(如FlashAttention、Convolution)是構建復雜上層應用的基石。然而,為了追求更高的算子融合效率或更創新的算法,開發者們往往需要超越標準化計算接口的限制,如標準BLAS接口以及芯片廠商的計算庫接口,以實現高性能的定制化算子。MUTLASS正是為滿足這一需求而設計。

針對矩陣乘法及相關變種,MUTLASS提供了一系列高性能的C++模板組件,并采用了與muDNN庫類似的分層分解及數據搬運策略,以確保性能的充分發揮。在本次開源的版本中,摩爾線程適配了CuTe后端庫,為其增加了第三代MUSA架構的MMA計算原語,支持TF32/FP16/BF16/INT8等多種數據精度。以此為基礎,初步實現了矩陣乘法、默認實例庫、性能測試器及相關工具包的支持。

借助MUTLASS,開發者們既可以靈活復用不同層級的模板組件,也可以按需修改各種模板組件的實現細節,以較低的開發成本實現定制化的高性能算子。這將在摩爾線程全功能GPU上充分釋放性能,并鼓勵開發者嘗試更多的算法創新。摩爾線程表示,將持續優化MUTLASS的性能,并不斷引入新的功能。

摩爾線程的這一開源舉措,不僅為開發者提供了更為便捷和高效的工具,同時也展示了摩爾線程在推動國產GPU生態建設方面的堅定決心。此前,摩爾線程已經相繼開源了OpenCV-MUSA計算機視覺庫、MooER音頻理解大模型以及vLLM-MUSA大語言模型高速推理框架,這些開源項目都在不同程度上促進了基于摩爾線程GPU的應用開發和算法創新。
本文地址:http://www.qingdxww.cn/thread-876492-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 無線充電基礎知識及應用培訓教程3
  • 為何選擇集成電平轉換?
  • 5分鐘詳解定時器/計數器E和波形擴展!
  • PIC18-Q71系列MCU概述
  • 貿澤電子(Mouser)專區
關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 草久影院 | 欧美成人免费看片一区 | 亚洲黄色片在线观看 | 青青草原国产在线观看 | 毛片免费高清免费 | 青久久 | 久久免费精品高清麻豆 | 亚州一级毛片在线 | 久久福利资源网站免费看 | 国产在线观看入口 | 紫黑色的巨大又粗又硬视频 | 成人久久久观看免费毛片 | 91啪国自产中文字幕在线 | 国产欧美日韩在线一区二区不卡 | 久久精品综合免费观看 | 青青草国产97免久久费观看 | 欧美日韩亚洲国内综合网香蕉 | 国产成人污污网站在线观看 | 欧美特黄视频在线观看 | 亚洲激情 | 国产黄色片在线观看 | 日本天天操| 精品伊人久久久久网站 | 国产精品福利在线观看免费不卡 | 黄色片网站免费观看 | 亚洲影视一区 | 天堂最新在线 | 黄色成人一级片 | 538porm在线看国产亚洲 | 无人视频完整免费版视频观看下载 | 国产成a人片在线观看视频 国产产一区二区三区久久毛片国语 | 精品二区| www.日本在线 | 91精品国产综合成人 | 久久久小视频 | 网站久久 | 亚洲色图第四色 | 性情视频在线高清免费 | 日韩黄色一级 | 麻豆亚洲 | 色综合天天综合网国产人 |