PCIE5存儲時代關鍵趨勢:EDSSF、QLC、SCM、CXL、云定義存儲 數據中心通訊的“5G新標準” 根據IDC數據顯示,到2025年,全球數據圈總量將激增至175ZB,而根據二八法則,到2025年全球數據圈中將有35ZB的高價值熱數據,會一刻不停的處于運轉狀態中,能否支撐起這些海量最熱化的高價值數據,將決定了全球數字經濟的發展效率。 在5G、元宇宙、高頻線上交易等低延時海量實時數據處場景的背后是以服務器、網絡、存儲等ICT 設備不間斷管理和運營的基礎設施。而PCIe 5.0正是數據中心高頻海量低延時海量實時數據通訊的新標準。 PCI-SIG此前給出PCIe的帶寬增長趨勢。2020-2021期間,PCIe4.0-5.0作為PCIe3.0的更新版本陸續出現并量產。在從 PCIe 4.0 到 PCIe 5.0 的過渡中,速度翻倍、向后兼容和加速發布周期是構建實施策略的三個基本支柱。 數據中心CPU行業龍頭AMD及Intel都計劃將于2022年下半年發布支持PCIe 5.0的Sapphire Rapids和Zen4服務器級別主控平臺,預計2023年,其他CPU廠商將陸續跟隨,2023年下半年PCIe5的服務器應用將開始逐步成為主流。 PCIe 5.0時代的數據中心存儲基礎設施-SSD PCIe 5.0.0對于存儲與計算之間的意義是,算得快需要存得及時,才可以真正滿足海量實時數據處理/存儲的需求。與現在的PCIe 4.0相比,PCIe 5.0單通道速率翻倍到了32GT/s,大約是4GB/s,SSD硬盤主控通常是PCIe 5.0 x4,速度理論上可達16GB/s,相比現在的PCIe 4.0硬盤提升一倍。固態硬盤是否支持PCIe 5.0,與SSD主控芯片及固件直接相關。 SSD(固態硬盤)通過SSD 主控PCIe接口將I/O命令和響應映射到主機的共享內存,支持多核CPU處理器并行I/O,以促進高吞吐量,緩解CPU的壓力。同時,利用并行數據路徑,在加速方面提供更好的性能,通過與PCIe接口的結合,使得數據通過NVMe協議直接與CPU相連,從而達到低延時性。 國內廠商亦紛紛發布PCIe 5.0 SSD主控方案,包括江蘇華存、英韌科技、庫瀚科技等,其中庫瀚科技發布的Aurora為全球首款基于RISC-V架構的PCIe 5.0企業級SSD主控。從各家發布信息匯總整理來看,可見以下行業發展趨勢: PCIe 5.0 SSD 企業級將先于消費級實現大規模商用 SSD業內人士的看法認為,目前消費級SSD還在處于PCIe 3.0向PCIe 4.0升級的階段,PCIe 5.0普及要晚上一兩年到,要到2024年才會在消費級市場上出貨。而在企業級高性能場景可承受新技術標準相對較高的基礎設施成本,PCIe 5.0 企業級SSD有望2023年開始得以全面應用普及。 無論消費級還是企業級,從各家發布的測試數據來看,標稱性能幾乎都可接近14GB/s的讀寫速度,但這是由PCIe 5.0的通訊標準決定的,單從最高性能上,并不能完全體現各家產品性能優劣。企業級與消費級最大的分別在于,需要更復雜的主控系統架構實現在企業級高性能荷載場景下(如觸發垃圾回收策略等)能保證高穩態的性能。 目前各家發布的產品都未見商業化供應,未見PCIe 5.0 企業級SSD相關穩態性能數據的第三方測試數據,在庫瀚Aurora主控的相關發布信息上,有透露了部分PCIe4平臺測試場景下數據,其穩態性能已可實現500K IOPS,這對目前主流的PCIe4 SSD而言,已有25%以上的性能提升。 大容量密度存儲時代到臨,GB/W將大幅降低 PCIE 5.0時代傳統U.2/AIC 規格的SSD已無法滿足技術需求,要實現大容量、更低的每GB能耗以及TCO,必須在硬盤規格上進行創新設計。EDSFF工業界新標準的推動,將帶來存儲基礎設施物理形態重構。從各家發布的方案來看,無論是頭部企業三星、鎧俠,還是國內方案廠商英韌、庫瀚,都明確表示將支持EDSSF規格高密度SSD設計。隨著PCIe 5.0 SSD主控的普及,單盤容量將從U.2規格主流的4/8TB,躍升到EDSFF可支持的16/32 TB。 SCM(Storage Class Memory)內存級存儲介質,是同時兼具內存的微秒級延時以及閃存的容量、掉電保護等方面優勢的新型存儲介質。存儲硬件方案的延時核心由主控以及閃存介質的物理特性延時決定,PCIe5意味著更快的速率,更快的速率將推動更低延時的SCM存儲介質的商用。 目前業內主要有三家國際廠商可提供相關商業化的SCM方案,包括英特爾傲騰、三星Z-NAND、鎧俠XL-FLASH(XLF)。英特爾采取了極其封閉的市場策略,并不開放傲騰的SCM介質顆粒3D Xpiont(3DXP),且其傲騰持久內存僅可在英特爾X86服務器主板上適配使用,而鎧俠的XLF目前是秉承開放策略,可單獨出售。 但XLF受物理特性局限,只可應用于超高性能的SCM SSD,而無法應用在目前已得以真正大規模商用的持久內存形態。SCM持久內存應用廣于SCM硬盤,主要原因是SCM介質顆粒的定價在乎內存與閃存之間,SCM SSD硬盤相比于以TLC閃存為核心的企業級SSD成本劣勢明顯,且現有的PCIe3/4系統無法充分釋放SCM SSD性能,但傲騰SCM持久內存形態因相比于內存具備成本及掉電保護等的優勢,在高性能場景,已成為眾多廠商的主流選擇。 英特爾已投入多年培育起SCM持久內存的應用生態,在其宣布退出SCM持久內存市場后,相關頭部介質、主控廠商將有望加速研發填補空白。國際上,SK海力士在其發布論文信息中顯示了其XPOINT技術與英特爾3D XPoint技術具有強烈的相似性,是最有可能可應用在持久內存的介質;在國內,庫瀚科技創始人為美國海力士存儲解決方案公司CTO背景,但目前未知其發布的第一款PCIe5 主控方案是否可支持SCM持久內存設計。華中科大、中科院上海技術物理研究所等均有發布SCM介質研究的相關論文,目前產業化進展未知;從招聘信息可見,長江存儲亦在招聘具備SCM主控經驗的工程師,但也仍未見正式發布相關SCM產品。 PCIe 5.0時代的CXL技術將重塑數據中心基礎設施 2019年3月,在Interconnect Day 上,英特爾公布了服務于下一代高性能計算與數據中心的CXL(Compute Express Link)開放互連技術及其CXL 1.0規范。該技術建立在完善的PCIe 5.0的物理和電氣實現上,因為無需通過專門設計的接口,簡化了服務器硬件的設計難度,也消除了CPU與設備、CPU與存儲之間的計算密集型工作負載的傳輸瓶頸,顯著提升性能、整體成本也大大降低。 CXL為英特爾發起的行業技術標準,阿里巴巴、華為、谷歌、微軟等均為CXL聯盟會員。CXL技術推廣也是英特爾的一種自我革命,傳統以高成本、超高性能通用架構X86 CPU為唯一核心的數據存儲基礎設施格局可能將發生改變 - 雖然通用計算依然無法撼動X86 CPU的主導局面,但是不同的加速、專用系統級芯片將有望得以更快普及,超異構計算的XPU時代將加速到臨。 國際存儲廠商Marvell在今年五月宣布收購CXL技術公司Tanzanite信息可見,在 Marvell 的完整愿景中,XPU 上會有一些本地內存,而 PCIe 上的 CXLink將連接到內存模塊它已在其上集成計算以執行專門的功能。Marvell 希望使用其定制處理器設計團隊來幫助超大規模、云構建者和其他任何擁有合理容量的客戶將計算放在內存上并將其鏈接到 XPU。在國內,庫瀚科技基于RISC-V架構的存儲基礎設施芯片SPU(Storage Processing Unit),具有計算能力,可以進行壓縮、加密、搜索或向量處理,它們將配備用于數據移動的DMA引擎,也可以使用諸如NVMe之類的PCIe服務。 PCIe 5.0時代的NVMe 2.0 ZNS技術將加速更低成本的QLC閃存商用 閃存介質顆粒根據每個單元存儲的容量不同,可分為SLC、MLC、TLC、QLC等,SLC的存儲容量最低,但是支持讀寫次數最多,使用壽命最長。QLC的存儲容量最高,但是使用壽命最短,寫入速度相對較慢。 伴隨PCIe 5.0 時代到臨的NVME2.0 ZNS技術為QLC的大規模商用提供了可行性,QLC比較適合順序寫、隨機讀和順序讀的場景,適合讀取密集型場景。采用ZNS技術的中國電子云PCIe 5.0 CeaFlash平臺已明確表示將對QLC提供支持。基于ZNS技術,通過系統層過軟硬件融合設計,基于數據熱度使用場景,實現數據智能放置分層,這將使得QLC可以應用在云存儲和CDN等的核心場景。 云廠商自研或定制硬件的趨勢將加速PCIe 5.0存儲時代到臨 正如5G的商用,離不開電信運營商。PCIe 5.0數據基礎設施的普及,核心在于云廠商的應用推廣。艾瑞咨詢指出,企業級固態硬盤下游客戶主要來自云計算,占總市場規模的份額達到67%,企業級SSD將充分受益云基礎設施增量。 近日,中國電子云發布全球首個PCIe 5.0云定義固態存儲解決方案CeaFlash,這是繼亞馬遜云發布Nitro SSD平臺、阿里云發布AliFlash平臺之后,最新宣布軟硬件融合設計自研云定義全閃存儲的云廠商,也是首家發布PCIe 5.0全閃存儲技術平臺的云廠商。 據IDC預測,中國將在2025年成為全球最大數據圈(48.6ZB),未來全球云廠商的頭部企業有望將誕生在中國。據Canalys測算,中國云市場的平均增長率達到60%,超過世界其他地區。中國在5G商業化普及上已經領先全球,隨著國內云廠商的崛起,數字經濟存儲基礎設施的“5G新標準”-PCIe 5.0的應用普及將有望在中國最早實現大規模商用推廣,賦能中國數字新經濟發展。 |