2017年9月19日,英特爾在京召開了PSG IFTD媒體見面會。英特爾可編程解決方案事業部副總裁兼客戶體驗事業部總經理Rina Raman女士做了“英特爾FPGA:加速建設智能互聯世界”的演講,介紹了FPGA技術、FPGA技術的主要應用、英特爾FPGA技術特色等事項。Raman女士的演講內容豐富詳盡,形式也很正式,這里就全文登出演講實錄,請讀者就自己感興趣的內容選擇瀏覽。 Rina Raman:謝謝大家!我是來自英特爾公司的可編程解決方案事業部。我工作的地址在圣何塞。今天主要內容給大家介紹一下FPGA,FPGA怎么樣幫助我們加速實現一個智慧的互聯的世界。 可以看到,在互聯的世界,數據的需求呈現出一個指數型的增長,預測估計在2020年一個平均的互聯網用戶每天會產生1.5GB的數據,無人駕駛車輛每天會產生4TB,聯網的飛機每天會產生5TB的數據量,智慧工廠每天是1PB的數據量,云視頻的提供商會產生750PB的數據量。可以看到在一個聯網的世界,我們數據量的需求會急劇增長。 ![]() 根據預測,到2020年,將會有500億個終端聯網,現在我們聯網的終端數量是80億個,未來聯網的這些終端數量比現在所需要的帶寬每一個都要高。思科預測到2020年IP的流量會達到2300EB量級每年,數據中心會和這些終端連接起來,這些終端又會和數據中心實現連接,這樣我們就稱為一個良性的循環,這個循環開始隨著物聯網的發展會加速,意味著網絡就必須要在更高的速度上處理更多的數據,數據中心也必須要做更復雜的計算,處理更大的數據集,即使嵌入式的終端和設備也要做很多本地的計算。 除此之外,數據中心還會應對一些更加具有挑戰性的工作負載。比如說要進行大數據的分析,還有機器學習,最后可以看到在整個循環當中我們會出現一些瓶頸和計算的熱點,這個是CPU單獨無法應對的,所以說這個時候就需要FPGA。 我們可以看到這個幻燈片上列出來了我們FPGA針對現在應用最早、轉型最厲害的六個全球的市場,一個是5G無線通訊,另外一個是雷達和航天,還有網絡的轉型、云計算、智慧城市和無人駕駛車輛。無論是哪個市場,實際上它們都面臨著同樣的挑戰,就是連接的數量在急劇增長,計算的復雜度也在不斷地增長,這就會帶來瓶頸和熱點。這個時候,FPGA就可以幫助我們很好地應對這些挑戰。它利用FPGA,你的系統的設計不會被鎖定,開發時間沒有那么長,而且相比這些專用的硬件來說,它更具有靈活性。 ![]() 現在我們都知道我們在朝著5G無線通訊的時代在邁進,我們可以看到5G未來需要更大的帶寬,需要更復雜的數字信號處理能力,但是現在5G的標準沒有最終確定,所以我們不知道5G把消費者和物聯網的這些終端連接到云以后會出現什么樣的用力。現在英特爾處在一個非常獨特的位置上,能夠幫助我們應對5G所帶來的挑戰,比如說像固定功能和軟件、硬件、可編程的終端,還有端到端的解決方案,在整個良性循環中的每一個點,我們都能提供我們的解決方案。 特別是在5G網絡上面,我們的FPGA可以有以下一些能力,比如說加速MIMO天線的計算和基帶的信號的處理,安全,還有其他一些可能會制約發展的網絡的功能。 另外在航空領域,特別是像雷達處理到安全的通訊,的確也面臨著一系列的挑戰。包括像波速形成和過濾和更多的像機器學習的算法等等方面的挑戰,傳統的方法是我們要使用更快的CPU和DSP芯片陣列或者是ASIC專用的集成電路來應對,但是,通過使用FPGA,我們可以加速數字的處理,加速處理機器學習的一些任務,這樣的話讓我們整個架構會更加簡單,而且開發的環境也更加統一。 在網絡方面,我們可以看到加速的良性循環和物聯網的不斷發展,要求我們網絡要進行根本性的轉型,無論是在本地網還是在城域網,還是在互聯網骨干,甚至在數據中心,都要進行轉型。可以看到其中轉型的一個最關鍵的核心就是網絡功能虛擬化NFV,就是把我們一些關鍵的功能,像切換、交換、安全和流量、成型,從我們專用的硬件轉移到數據中心中的一些軟件硬件上面來處理。 另外,這個轉型可能也會帶來流量方面的一些瓶頸和計算的熱點,所以,在這樣一個充滿了不確定性和快速變化的環境當中,FPGA就給我們提供了一個很好的解決辦法,因為它能夠加速一些關鍵數據包的交換、數據包的檢測以及安全任務的處理。 在無人駕駛汽車領域,我們可以看到大家都在這方面有很多的投入,這也很好地說明了FPGA能夠加速我們剛才所談到的良性的循環。可以看到,隨著無人駕駛汽車的發展,對性能將會有一個極大的要求,再加上對算法和用力方面有很大的不確定性,所以,我們看到可能會出現計算的孤島,每個孤島都可能有自己本身的硬件和開發環境,這對制造商來說可能是不可持續的。FPGA實際上在以下兩個領域能夠發揮非常關鍵的作用,一個是本地計算,比如說傳感器、融合,還有深度學習的推算方面,實際上這些都是要在汽車上本地實時的進行的。 另外,還有安全可靠的5G連接,把汽車和另外其他的車輛和高速公路的基礎設施和云實現連接。 另外,看到在智慧城市的領域,現代化的當中有很多的計算孤島正在出現,包括像我們的交通管理系統和照明管理系統,泊車管理系統和安全的攝像頭,實際上他們都是各自為政,這些眾多不同的系統由眾多不同的廠家來生產,有不同的架構,有不同的開發環境,更重要的是這些不同的系統之間沒有辦法實現數據的共享,所以,作為城市管理者來說,很難獲得一個對城市正在發生的情況的全面的了解。 英特爾的CPU加上FPGA就能取代這些專有的架構,可以提供一些像本地計算、連接和分析的能力,只需要通過加速幾個關鍵的功能就能實現。 另外,我們也可以把這些眾多的孤島放到一個單一的英特爾架構上面,再加上FPGA的環境,再加上5G的網絡,實際上可以讓我們整個開發的成本實現很好的降低,降低錯誤率,另外還可以讓我們具備數據分析和機器學習的能力,這樣的話,我們就可以了解網絡產生數據到底能給我們帶來什么,這樣的話,我們可以做出更明智的決定。 另外,最后一個應用領域就是云計算。在云的環境中,工作負載會出現動態的變化,甚至這些工作負載的構成也會出現快速的變化。有一些工作負載可能所需要的性能即使CPU在合理的功耗水平之下也是難以實現的,所以可能這個服務器卡上需要一些特別的芯片或者是配上一個GPU,專門處理并行的運算,或者是裝上網絡加速器,處理協議和安全的流量分流。 另外,還有視頻的解碼器,或者是配上ASIC專用的集成電路,用于搜索的加速和深度學習。但是,事實上在服務器上面并沒有空間,也沒有足夠的功率里支持所有這些芯片都放進去,所以,有一些云的服務提供商和數據中心的架構師就開始轉向使用英特爾最先進的FPGA的產品,就是和英特爾Xeon的CPU能夠實現很好地連接,提供搜索、計算、加密、分組處理和機器學習的硬件的加速。 隨著這種變化的變化和工作負載的變化,你也可以對FPGA進行重新的配置,以滿足這些新的需求。 另外,從這三個例子上大家可以看到我們面臨著三方面的挑戰,一個是處理大量數據的增長,另外我們還要應對快速變化的新技術帶來的計算環境的變化,另外就是CPU的功耗是非常重要的。你僅僅靠計算平臺同質的擴展,可能沒有辦法滿足所有這些需求,所以就意味著我們需要異構的計算,今天我們可以看到硬件平臺包括CPU,包括FPGA,還包括專用的加速器,CPU仍然是我們處理能力的一個核心引擎,再加上一些專用的加速器,比如說加上ASSP和ASIC,就可以實施一些專用的功能,實現最好的計算的效率。 ![]() 現在我們可以看到FPGA也越來越發揮著重要的作用,特別是在需要靈活加速的時候,因為算法也在不斷地發展,而且我們所處的環境當中加速的工作負載也在動態地變化,所以FPGA有以下的好處,相當于一個軟件定義的硬件,可以滿足性能和計算方面的要求。另外,還有一定的靈活性,能夠支持未來的計算和商業需求不斷地變化。 這張幻燈片給大家介紹了FPGA實際上對異構計算或者是異構的架構是至關重要的。如果你們對FPGA不熟悉,大家可以把FPGA想象成一種先進的多功能的加速器,一方面能夠帶來最大的編程的靈活性,支持高度差異化的產品,你還可以在現場進行重新配置,虛擬加速任何數字的算法。另外,他們也是支持并行運算的,所以,他們特別適合未來計算的世界,更重要的是他們的性能從吞吐量,從實施的速度和能耗的角度來說,比CPU或者是GPU要優上十倍。 ![]() 另外可以看到它可以以更低的時延處理更大的數據,比傳統的在硬件產品上跑的基于軟件的產品更快。就是因為FPGA有以上這些好處,FPGA相當于具有硬件的性能,又具有軟件的可編程的能力,所以說對異構計算的環境或者是架構來說變得尤為重要。 我們這張幻燈片上舉了一些FPGA是怎么樣使用的例子,它可以支持我們稱為LookAside和inline的加速,旁路加速可以讓我們把一些重度計算的數據功能轉移到FPGA上面,這樣可以釋放處理器去處理其他一些功能。如果時延比較重要,我們就可以進行內聯加速。LookAside旁路加速就可以讓我們把一些重度計算的數據功能轉移到FPGA上面,這樣可以釋放處理器去處理其他一些功能。如果時延比較重要,我們就可以進行內聯Inline加速。這樣通過FPGA的多功能性,可以帶來更好的網絡的存儲和計算的加速。 ![]() 下面我會給大家介紹一些FPGA在現實生活當中實際的案例。 這張幻燈片給大家展示了我們FPGA帶數據庫加速當中的應用。數據中心的加速和混合云是非常重要的,但是我們來看一下我們PGA是怎么應對現實生活中一些挑戰的? 第一個就是數據庫的加速。現在關系數據庫實際上是無處不在的,數據分析就變得至關重要了,無論是對電子商務還是廣告,對所有人來說數據分析就是最重要的事情。Swarm64是我們英特爾的一個合作伙伴,它就使用了我們最新的FPGA大量處理一些并行的數據,實現了很好的吞吐量,也有比較好的能耗和更高的性能。 ![]() Swarm64這個可擴展的數據加速器是一個無縫的插件,能夠讓我們常用的一些數據庫可以處理一些高速的大數據,無論是在云里面,還是在現場,它都可以支持任何的配置。另外,這也是一個很好的內聯加速的例子,我們可以把數據存儲在數據庫之前先進行壓縮和處理。可以看到分析的能力是以前的5倍,數據倉庫的能力是以前的2倍,存儲壓縮的能力是以前的3倍。 另外,這個例子是基因測序,可以看到這個數據量非常大,也非常復雜,基本上是分析能力跟不上,所以說很多的研究項目被迫推遲,可能會影響整個醫療界在這方面取得大家都非常需要的醫療的突破。英特爾和Broad Institute合作,希望能夠在基因測序這方面取得一些突破。我們共同開發出了一個叫基因分析的工具,GATK,這是一個用于基因分析的軟件工具包,Broad Institute開發出來,主要是用于分析大吞吐量測序的數據。 ![]() 在數據處理的三個階段當中,FPGA對變體分析的階段進行了加速,這個階段也是最影響性能的一個階段。我們可以看到這種旁路加速可以把計算密集性的任務分流到FPGA,FPGA直接給CPU提供結果。我們可以看到這個工具包的軟件和參考設計使用了OpenCL,可以說加速整個改變了基因測序和分析的行業。研究人員現在可以在過去三分之一的時間能夠獲得5倍的數據量,相當于15倍的提升。所以,通過這樣的合作關系,英特爾也幫助了Broad Institute加速了它的Pair-HMM提高了50倍,整個通道能力提高了2.2倍,所以說幫助實現了DNA測序方面取得了很大的突破。 這張幻燈片給大家展示了Attala的系統公司。這家公司想要重造云基礎設施,主要是希望能夠利用英特爾的FPGA重新設計和開發出來新一代的儲存和網絡的基礎設施。 NVMe代表的是非易失性儲存器的規范。它是針對NVND的閃存和下一代固態的儲存技術,這也是一個內件加速的例子,不是在軟件里面進行處理,數據是在硬件里面通過FPGA來進行處理和加速的,然后再進入到Ethernet Fabric,這個基于FPGA的解決方案相比我們之前的解決方案,可以在讀寫速度的時延方面降低57-72%。所以,可以看到Attala的解決方案節省了所有軟件的開支,這種很好的硬件和軟件的解決方案有很強的適應能力,提高了性能,也為云的服務提供商降低了運行成本。而且,還包括企業級的端到端的數據的保護,無論上行還是下行數據的交換,有雙重的冗余保護。 ![]() 這張幻燈片給大家展示了我們幾個客戶對我們的評價。我就援引中興和阿里巴巴的評價。中興說通過利用它制定的拓撲結構,中興取得了一項新的記錄,它的面部識別功能每秒能夠識別1000張圖片,實現了以前理論上最過的準確性,所以,英特爾 Arria 10的FPGA將原始的設計性能提高了10倍,同時又保證了高準確性。這是中興對我們FPGA的評價。 另外一個是阿里云,主要是幫助云中的客戶訪問大量的服務,基于FPGA全新的加速服務,意味著客戶能夠訪問云中豐富的資源,而且無需構建自己的基礎設施。 還有京東的評價,我就不讀出來了。 這個是我們英特爾提供的一系列的產品,像Stratix 10最新的產品有樣片了。另外像Arria 10的終端系列產品已經在全面生產了。像Cyclone 10和Max 10已經大量出貨。 ![]() 剛才跟大家介紹了我們現在已經發貨的產品,下面給大家介紹一下我們下一代的FPGA的產品,英文名字叫做Falcon Mesa,這是我們下一代基于10納米制程的新的Falcon Mesa的產品。可以看到它是使用了英特爾10納米的制程技術,基于世界上最先進的一個FinFET制程的技術,這是我們第二代使用HyperFlex架構產品,也是第二代基于EMIB的異構的SIP。EMIB實際上是英特爾接口的規范。 還有我們新的產品也會支持下一代的HBM,現在Stratix 10也支持HBM,可以看到它的轉換速率可以達到112G。另外我們還支持PC/IE兼4×16的支持,就意味著支持的帶寬能夠達到16TB。 剛才我也說了,這實際上是我們在并入英特爾以后開發出來的第一代使用了英特爾10納米制程技術開發出來的產品,我們希望能夠繼續推動摩爾定律的實現,希望能夠給大家帶來業界領先的性能和能效。 另外可以看到和英特爾整合之后實際上給我們公司帶來了很多的更強的能力,在Stratix 10上面大家也可以看到,我們作為它的企業,也獲得了英特爾領先業界3年的制程技術,意味著給我們帶來了更大的容量和更快的速度,大家都知道英特爾的制程技術是全球最創新的、最領先的技術,我們也是把它的制程技術用于我們Falcon Mesa的生產和制造。晶體管的數量每兩年會增加一倍,那就意味著單位面積的成本會增加,但是,晶體管數量翻一倍意味著性能的改善,從而使每個晶體管的成本降下來了。 我們英特爾也是遵循了這樣一個模式,兩年一個節奏,從14納米到10納米,再通過像(51:26)的一些改善,我們可以看到die的面積可以實現0.46到0.43倍的擴展,晶體管的密度會有2.7倍的提升,在10納米的時候,這就意味著更好的性能和更低的功耗,在這種我們稱之為自排列的雙重圖( self-aligned double pattern),在這個制程方面,英特爾一直都是領先的。通常在生產硅的過程中,一般都是一層會鋪一層研磨,但是,鋪兩層研磨就意味著這個晶體管有更緊密的封裝,那就意味著我們的排列必須更加準確,這種可能會帶來的好處是我們制程的控制會更加嚴格,從而帶來密度方面的提升。 ![]() 另外,剛才給大家介紹了EMIB這個技術,EMIB是英特爾一個橋接、連通的技術,過去你可以通過硅通孔和轉接板的技術來實現連接,EMIB實際上提供了一個很好的帶與帶之間和帶橋之間的很好的連接,這個相比于過去的技術,給我們提供了一個更好的解決辦法。 這個地方提供的加速堆棧實際上是更多地幫助我們開發者的。之前介紹了很多硬件方面的內容。在軟件方面,實際上英特爾給我們帶來了更好的新的資源,能夠讓我們的FPGA讓更多的軟件開發者能獲得。包括我們提供的FPGA的加速數據庫,針對至強處理器的,另外還可以為人工智能、數據分析數據壓縮提供硬件的加速。 可以看到這張幻燈片是我們展示了一個機器學習的解決方案的堆棧,大家可以看到,這是一個相當于針對FPGA優化的數據庫,它實際上可以在一些最通用的常見的網絡拓撲上,比如說AlexNet和GoogleNet上面進行實施,高級用戶可能會想利用這個堆棧,使用預先定義好的數據庫的內核,直接在API的層面進行編程,或者也可以使用英特爾深度學習部署的工具包。 通常一個用戶可能會想要利用最常用的深度學習的框架,比如說TensorFow、Caffe來開發出自己機器學習的應用,這個也是支持的。 大家可以看到實際上英特爾給我們帶來的這些能力包括強大的封裝能力,制程的技術和光學方面的技術,包括我們可以獲得它開發的工具、處理器和它的合作伙伴的生態系統,這個實際上我們也可以幫助實現硬件和軟件編程的統一。 ![]() 可以看到,如果再挖深一點,我覺得我們面臨著三個方面的轉型,一個就是我們可以連接到網絡處理器和存儲器方面能帶來最高的性能,以及最高的FPGA的Fabric的性能。另外,我們可以通過一些先進的制程技術、先進的冷卻技術和異構的整合,帶來很好的功耗方面的降低。另外,我們也使傳統的FPGA設計工具的生產力有很大的提高,讓更多的軟件開發者可以獲得,了解我們相關的一些框架和內容。 ![]() 總結一下,今天介紹的主要內容包括我們都知道現在的數據像洪水一般的涌來,它就會推動計算網絡和存儲需求不斷增長。第二,我們看到異構計算的平臺還有混合云基礎設施的發展對于FPGA來說,FPGA未來能夠在這些領域發揮更重要的作用。第三,我們看到FPGA是可以滿足以下工作負載不斷增加的需求,在這個過程當中,FPGA能夠幫助很多行業解決他們面臨的一些問題和挑戰。最后,可以看到英特爾有一個良好的記錄,不斷地創造著行業的標準和標桿,他們也致力于讓我們的FPGA對開發者更易于使用。 最后我想說的是,我們面臨的挑戰是非常復雜的,面對這樣的復雜性,可能需要不同的解決方案來應對挑戰。英特爾認為FPGA實際上能夠幫助我們加速計算,幫助我們更好地應對今天以及未來數據的需求。 |