国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

透過(guò)DeepSeek,聊聊存儲(chǔ)是如何給AI加速的

發(fā)布時(shí)間:2025-2-26 17:51    發(fā)布者:eechina
關(guān)鍵詞: 鎧俠 , AI加速 , DeepSeek , BiCS
作者:鎧俠

從AI服務(wù)器到AI PC,如何快速的用上DeepSeek成為熱門問(wèn)題。無(wú)論DeepSeek Janus-Pro把多模態(tài)提升到了一個(gè)新層次,還是媲美主流的DeepSeek-V3,或者應(yīng)用于本地的DeepSeek-V3,對(duì)存儲(chǔ)都提出了新的需求。以完整未蒸餾的DeepSeek R1模型為例,這是一個(gè)擁有6710億參數(shù)的混合專家(MoE)模型,未量化版本的文件體積高達(dá)720GB,而動(dòng)態(tài)量化版本也達(dá)到150GB到400GB之間。

DeepSeek讓GPU算力一下子得到了空前的釋放,允許廠商將更多的資源集中到其它關(guān)鍵硬件中,比如更強(qiáng)大的并行能力,以及更優(yōu)秀的存儲(chǔ)方案。很顯然,常規(guī)的存儲(chǔ)方案已經(jīng)不能很好的解決效率和存儲(chǔ)的問(wèn)題,在企業(yè)級(jí)和數(shù)據(jù)中心級(jí)SSD為AI提供存儲(chǔ)支持時(shí),以QLC和CXL為例的新技術(shù)也正在協(xié)助AI以更低成本和更高的效率運(yùn)行。



QLC與CXL:為AI鋪路

由于DeepSeek不僅降低了計(jì)算成本,多模態(tài)處理能力、說(shuō)是知識(shí)圖譜和推理能力的優(yōu)秀表現(xiàn),使得廠商擁有足夠的資源調(diào)用更多的數(shù)據(jù)。這使得原本大量的冷數(shù)據(jù)變成了溫?cái)?shù)據(jù)。溫?cái)?shù)據(jù)對(duì)存儲(chǔ)有著更高的要求,需要相對(duì)HDD更快的傳輸速率,并且存儲(chǔ)數(shù)據(jù)可能每年以EB級(jí)增長(zhǎng)。這導(dǎo)致SSD的需求往大容量和低成本的方向發(fā)展。

其中QLC能夠更好的在單位空間內(nèi)提升存儲(chǔ)容量,第八代BiCS FLASH™ 2Tb QLC的位密度比鎧俠目前所采用的第五代BiCS FLASH™的QLC產(chǎn)品提高了約2.3倍,寫入能效比提高了約70%。不僅如此,全新的QLC產(chǎn)品架構(gòu)可在單個(gè)存儲(chǔ)器封裝中堆疊16個(gè)芯片,為業(yè)界提供領(lǐng)先的4TB容量,并采用更為緊湊的封裝設(shè)計(jì),尺寸僅為11.5 x 13.5 mm,高度為1.5 mm。

這意味著,未來(lái)采用第八代BiCS FLASH QLC的存儲(chǔ)產(chǎn)品在存儲(chǔ)空間擁有質(zhì)的飛躍,可以輕松將企業(yè)級(jí)SSD和數(shù)據(jù)中心級(jí)SSD容量提升至120TB以上。



密集的DeepSeek計(jì)算也意味著對(duì)內(nèi)存有著海量的要求,但動(dòng)輒數(shù)百GB的訓(xùn)練模型全部存儲(chǔ)在內(nèi)存中也意味著高昂的成本,如何利用BiCS FLASH™降低成本也是未來(lái)的思考方向。例如利用相變存儲(chǔ)原理,基于BiCS FLASH™結(jié)構(gòu)打造的XL-FLASH存儲(chǔ)級(jí)內(nèi)存(Storage Class Memory, SCM)與CXL相結(jié)合,開發(fā)相較內(nèi)存功耗更低、位密度更高,相較閃存讀取速度更快的存儲(chǔ)器。這不僅會(huì)提高存儲(chǔ)器利用效率,還有助于節(jié)能。



CXL技術(shù)本身通常也意味著更先進(jìn)的PCIe版本支持,鎧俠則是積極響應(yīng)PCIe升級(jí)的存儲(chǔ)制造商之一。例如,鎧俠率先推出支持PCIe 5.0的企業(yè)級(jí)固態(tài)硬盤CM7系列。PCIe 5.0 SSD與傳統(tǒng)存儲(chǔ)設(shè)備(如PCIe 4.0 SSD)的對(duì)比測(cè)試,結(jié)果顯示, CM7系列SSD在多個(gè)GPU并行訪問(wèn)時(shí),能夠提供91%的I/O吞吐量提升,此外,它的讀取延遲比傳統(tǒng)SSD低57%。同時(shí),PCIe 5.0 SSD能機(jī)器學(xué)習(xí)訓(xùn)練時(shí)間能夠得到顯著減少。以16個(gè)GPU并行處理為例,使用PCIe 5.0 SSD可以減少32到44天的訓(xùn)練時(shí)間。

特別是在PCIe 5.0與NVMe™規(guī)范下實(shí)現(xiàn)可靠的RAID兼容性和互操作性能。特別是生成式AI與檢索增強(qiáng)生成 (RAG) 系統(tǒng)的重要性更勝以往,關(guān)系數(shù)據(jù)庫(kù)PostgreSQL和向量數(shù)據(jù)庫(kù)需求變得格外重要。例如通過(guò)Xinnor的RAID 解決方案的兼容性和互操作性測(cè)試,與采用相同硬件配置的軟件 RAID 解決方案相比,在數(shù)據(jù)降級(jí)模式下執(zhí)行PostgreSQL,效能更提升達(dá)25倍。



搶先布局

任何前沿技術(shù)不可能一蹴而就,AI技術(shù)的積累更是如此。流暢體驗(yàn)的AI服務(wù)對(duì)數(shù)據(jù)傳輸速度有著很高的要求。在多年前,鎧俠已經(jīng)開始對(duì)AI展開布局,并致力于為人工智能的發(fā)展提供高性能的存儲(chǔ)解決方案。

為了推動(dòng)檢索增強(qiáng)生成(RAG)擴(kuò)展獲得更好的性能支持,并進(jìn)一步降低成本。鎧俠在近期宣布開源AiSAQ™技術(shù),這是一項(xiàng)專為SSD優(yōu)化的新型“近似最近鄰”搜索(ANNS)算法,跳過(guò)將索引數(shù)據(jù)載入內(nèi)存(DRAM)的步驟,直接在SSD上執(zhí)行檢索操作,幫助企業(yè)/應(yīng)用針對(duì)特定數(shù)據(jù)優(yōu)化,從而實(shí)現(xiàn)幫助大語(yǔ)言模型(LLM)訓(xùn)練節(jié)省成本。



利用高性能存儲(chǔ)特性,鎧俠在AI前沿進(jìn)行了諸多嘗試。包括通過(guò)Memory-Centric AI技術(shù)解決企業(yè)級(jí)SSD中圖像分類任務(wù)中災(zāi)難性丟失問(wèn)題,在神經(jīng)網(wǎng)絡(luò)不通過(guò)調(diào)整的前提下,在深度學(xué)習(xí)中快速獲得圖像特征辨別和標(biāo)簽添加。并在數(shù)年前與NVIDIA展開深度合作,從加速StyleGAN、NeRF等算法,到協(xié)助NVIDIA搭建Omniverse平臺(tái),包括搭建最新的物理AI開發(fā)平臺(tái)NVIDIA Cosmos,為L(zhǎng)LM訓(xùn)練整理自定義數(shù)據(jù)集的NVIDIA NeMo Curator。



針對(duì)前瞻性存儲(chǔ),鎧俠在近期還正式發(fā)布了全新XD8系列PCIe 5.0 EDSFF(企業(yè)和數(shù)據(jù)中心標(biāo)準(zhǔn)型)E1.S固態(tài)硬盤。它是鎧俠第三代E1.S固態(tài)硬盤,符合PCIe 5.0(32 GT/s x 4)和NVMe™ 2.0規(guī)范,并支持開放計(jì)算項(xiàng)目(OCP)數(shù)據(jù)中心NVMe SSD v2.5規(guī)范。

鎧俠XD8系列專為云和超大規(guī)模環(huán)境設(shè)計(jì),滿足數(shù)據(jù)中心對(duì)高性能、高效率和高可擴(kuò)展性的日益增長(zhǎng)的需求。通過(guò)這款新的固態(tài)硬盤,云服務(wù)提供商和超大規(guī)模企業(yè)能夠優(yōu)化基礎(chǔ)設(shè)施,在保持運(yùn)營(yíng)效率的同時(shí)提供卓越的性能。



讓AI移動(dòng)起來(lái)

DeepSeek另一個(gè)實(shí)現(xiàn)領(lǐng)域則是在移動(dòng)平臺(tái)。即便是春節(jié)假期,多個(gè)版本針對(duì)AI PC本地化AI部署的DeepSeek R1已經(jīng)成型,例如蒸餾版本的7B和14B參數(shù)模型在筆記本和消費(fèi)級(jí)臺(tái)式機(jī)電腦上,可利用NPU和GPU實(shí)現(xiàn)離線運(yùn)作,進(jìn)一步確保了私有信息的安全。

對(duì)于AI PC而言,除了提供獨(dú)立GPU或者NPU進(jìn)行AI加速,大容量NVMe SSD也同等重要,另外還要考慮到有限的AI PC內(nèi)部空間,固態(tài)硬盤需要同時(shí)兼顧性能與散熱。以鎧俠BG6系列為例,鎧俠 BG6 系列在AI PC上能夠展現(xiàn)卓越的性能和靈活性。采用 PCIe 4.0 和 NVMe 1.4c 規(guī)范,搭載高達(dá)2,048GB存儲(chǔ)空間。順序讀取速度最高可達(dá) 6,000 MB/s,隨機(jī)讀取速度更是高達(dá) 900,000 IOPS。這使得BG6系列成為緊湊型固態(tài)硬盤中的佼佼者,為用戶提供了更快速、更高效的數(shù)據(jù)處理體驗(yàn)。



另外BG6 系列提供了多種容量選擇,包括 256GB、512GB、1,024GB 和 2,048GB,適用于不同用戶需求。其采用 M.2 Type 2230 和 Type 2280 模組封裝,可靈活應(yīng)用于各類薄型設(shè)備,如超薄筆記本電腦、嵌入式設(shè)備。也給不同形態(tài)的AI PC部署本地AI提供了豐富的解決方案。

從數(shù)據(jù)中心、服務(wù)器,到個(gè)人計(jì)算機(jī),鎧俠為AI計(jì)算提供了豐富、高效的存儲(chǔ)方案,并與合作伙伴展開深度合作,從軟件和硬件層面入手,利用高性能固態(tài)硬盤的特性,為AI計(jì)算提供可靠的存儲(chǔ)后盾,共同探索更多AI的可能性,充分利用AI與數(shù)據(jù),創(chuàng)造更多價(jià)值。

本文地址:http://www.qingdxww.cn/thread-882601-1-1.html     【打印本頁(yè)】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,我們將根據(jù)著作權(quán)人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評(píng)論 登錄 | 立即注冊(cè)

廠商推薦

  • Microchip視頻專區(qū)
  • 基于CEC1712實(shí)現(xiàn)的處理器SPI FLASH固件安全彈性方案培訓(xùn)教程
  • 5分鐘詳解定時(shí)器/計(jì)數(shù)器E和波形擴(kuò)展!
  • 為何選擇集成電平轉(zhuǎn)換?
  • 無(wú)線充電基礎(chǔ)知識(shí)及應(yīng)用培訓(xùn)教程3
  • 貿(mào)澤電子(Mouser)專區(qū)
關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號(hào) | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 热久久免费视频 | 亚欧视频在线观看 | 一区二区三区免费看 | 亚洲国产日韩在线观看 | 中文字幕日韩精品麻豆系列 | 国产成人精品福利网站在线 | 男女强吻摸下面揉免费 | 国产一区在线观看免费 | 国产高清一级毛片在线不卡 | 国产精品麻豆一区二区 | 中文字幕一二区 | 久久久久久国产精品免费免 | 国产福利一区二区在线观看 | 再次拥抱阳光漫画免费下拉式观看 | 在线观看男女爱视频网站 | 亚洲成年网站在线观看 | 国产精品成人网红女主播 | 手机在线看片国产 | 亚洲欧美一二三区 | 伊人热热久久原色播放www | 欧洲1区二区三区二页 | 四虎国产精品免费久久麻豆 | 久久精品免费 | wwxx在线观看免费 | 亚洲高清毛片 | 一级做a级爰片性色毛片视频 | 日韩精选 | 欧美日韩国产在线人 | 青青国产成人久久激情911 | 青青国产成人久久91网站站 | 福利片一区| 亚洲视频h | 91精品啪在线看国产网站 | 中文在线日本免费永久18近 | 亚洲欧洲一区二区三区在线 | xxxxchina麻豆免费视频 | 亚洲精品成人网 | 人成午夜视频 | 麻豆国产精品 | 久久国产精品二区99 | 一级做a爰片久久毛片一 |