国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

FPGA、GPU 與 CPU – 人工智能應(yīng)用程序的硬件選擇

發(fā)布時(shí)間:2022-4-26 10:29    發(fā)布者:eechina
關(guān)鍵詞: FPGA , GPU , CPU , 人工智能
來源:AVNET

現(xiàn)場可編程門陣列 (FPGA) 為人工智能 (AI) 應(yīng)用帶來了許多優(yōu)勢。圖形處理單元 (GPU) 和傳統(tǒng)的中央處理單元 (CPU) 相比,孰優(yōu)孰劣?

所謂人工智能 (AI),是指能夠以類似于人類的方式做出決策的非人類機(jī)器智能,涵蓋了判斷、思考、適應(yīng)和意圖能力。

研究公司 Statista 預(yù)測,到 2025 年,人工智能的全球市場規(guī)模將達(dá) 1260 億美元。到 2030 年,人工智能在中國、北美和阿聯(lián)酋 GDP 中的占比將分別達(dá)到 26.1%、14.5% 和 13.6%。

人工智能市場涵蓋了各類應(yīng)用,包括自然語言處理 (NLP)、機(jī)器人過程自動(dòng)化、機(jī)器學(xué)習(xí)和機(jī)器視覺。在很多垂直行業(yè),人工智能的采用率迅速提升,正在創(chuàng)造又一項(xiàng)偉大的技術(shù)變革,可以與個(gè)人電腦和智能手機(jī)的出現(xiàn)相提并論。

盡管人工智能主要依賴于模擬人類思維的編程算法,但硬件同樣發(fā)揮著重要作用。人工智能操作包括三大主要硬件解決方案:現(xiàn)場可編程門陣列 (FPGA)、圖形處理單元 (GPU) 和中央處理器 (CPU)。

人工智能 (AI) 及其術(shù)語最早來源于研究人員 Allen Newell、Cliff Shaw 和 Herbert Simon 在 1956 年創(chuàng)建的 Logic Theorist 程序。Logic Theorist 程序由蘭德 (RAND) 公司資助開發(fā),旨在模擬人類解決問題的技能。Logic Theorist 被視為第一款人工智能程序,并于 1956 年在新罕布什爾州達(dá)特茅斯學(xué)院的達(dá)特茅斯人工智能夏季研究項(xiàng)目 (DSRPAI) 中進(jìn)行了介紹。

每種方案都各有優(yōu)缺點(diǎn),接下來我們將進(jìn)一步探討。

FPGA

現(xiàn)場可編程門陣列 (FPGA) 是具有可編程硬件結(jié)構(gòu)的集成電路。其與圖形處理單元 (GPU) 和中央處理單元 (CPU) 的不同之。處在于,F(xiàn)PGA 處理器內(nèi)部的功能電路未經(jīng)過硬蝕刻。因此,F(xiàn)PGA 處理器可以根據(jù)需要進(jìn)行編程和更新。此外,設(shè)計(jì)人員也能從頭開始構(gòu)建神經(jīng)網(wǎng)絡(luò),或完全根據(jù)自身需求打造 FPGA。

FPGA 采用可重編程、可重配置的架構(gòu),在日新月異的人工智能領(lǐng)域優(yōu)勢明顯,使設(shè)計(jì)人員可以快速測試新算法。由于無需開發(fā)和發(fā)布新硬件,因此在縮短產(chǎn)品上市時(shí)間和節(jié)省成本方面競爭優(yōu)勢明顯。

FPGA 兼具速度、可編程性和靈活性,降低了專用集成電路 (ASIC) 開發(fā)所固有的成本和復(fù)雜性,使得效率大為提高。

FPGA 的主要優(yōu)勢包括:

• 延遲降低,性能卓越: FPGA 可以帶來低延時(shí),同時(shí)也是可確定性的延時(shí)(Deterministic Latency)。DL 作為模型將從初始狀態(tài)或給定的起始條件連續(xù)產(chǎn)生相同的輸出。DL 提供已知的響應(yīng)時(shí)間,對于很多具有嚴(yán)格硬時(shí)延要求的應(yīng)用程序而言,這一點(diǎn)至關(guān)重要。由此,可以加快語音識(shí)別、視頻流和運(yùn)動(dòng)識(shí)別等實(shí)時(shí)應(yīng)用程序的執(zhí)行速度。

• 成本效益:制造完成后,F(xiàn)PGA 可以針對不同的數(shù)據(jù)類型和功能重新編程,避免因?yàn)閼?yīng)用改變而需要的硬件更新,從而體現(xiàn)出極高的價(jià)值。設(shè)計(jì)人員可以將其他功能(例如圖像處理流程)集成到同一芯片上,借助 FPGA 實(shí)現(xiàn)人工智能以外的功能,從而降低成本,節(jié)省電路板空間。FPGA 的產(chǎn)品生命周期較長,能顯著提升應(yīng)用的實(shí)用性,延長的有效時(shí)間可達(dá)數(shù)年甚至數(shù)十年。由此,其成為了工業(yè)、航空航天、國防、醫(yī)療和運(yùn)輸領(lǐng)域的理想之選。

• 能源效率: 借助 FPGA,設(shè)計(jì)人員能夠?qū)τ布M(jìn)行微調(diào),以匹配應(yīng)用需求。利用 INT8 量化等開發(fā)工具是優(yōu)化機(jī)器學(xué)習(xí)框架(如 TensorFlow 和 PyTorch)的有效方法。同時(shí),INT8 量化也為 NVIDIA® TensorRT 和 Xilinx® DNNDK 等硬件工具鏈提供了令人滿意的結(jié)果,因?yàn)?INT8 使用 8 位整數(shù)而不是浮點(diǎn)數(shù),同時(shí)使用整數(shù)運(yùn)算而不是浮點(diǎn)運(yùn)算。適當(dāng)使用 INT8 可以減少內(nèi)存和計(jì)算需求,最多能使內(nèi)存和帶寬使用量減少 75%。在要求苛刻的應(yīng)用中,這一點(diǎn)對于滿足功耗要求而言至關(guān)重要。

FPGA 可以并行處理多種功能,甚至能為特定功能分配器件中特定資源,大大提高了操作和能源效率。FPGA 架構(gòu)獨(dú)特,將少量分布式內(nèi)存放入結(jié)構(gòu)中,使得它們更靠近處理單元。與 GPU 設(shè)計(jì)相比,這種設(shè)計(jì)降低了延遲,更重要的是減少了功耗。

GPU

圖形處理單元 (GPU) 最初開發(fā)用于生成計(jì)算機(jī)圖形、虛擬現(xiàn)實(shí)訓(xùn)練環(huán)境和視頻,其借助高級計(jì)算和浮點(diǎn)功能繪制幾何對象、照明和色深。人工智能若要獲得成功,就需要大量用于分析和學(xué)習(xí)的數(shù)據(jù)。這就需要強(qiáng)大的計(jì)算能力來執(zhí)行人工智能算法并轉(zhuǎn)移大量數(shù)據(jù)。GPU 之所以能夠執(zhí)行此類操作,是因?yàn)槠鋵iT設(shè)計(jì)用于快速處理渲染視頻和圖形時(shí)使用的大量數(shù)據(jù)。由于計(jì)算能力出眾,GPU 在機(jī)器學(xué)習(xí)和人工智能應(yīng)用領(lǐng)域頗受歡迎。

GPU 非常適合并行處理,即并行計(jì)算大量算術(shù)運(yùn)算。由此,在具有重復(fù)工作負(fù)載且快速連續(xù)地重復(fù)執(zhí)行的應(yīng)用程序中,可以顯著提高處理速度。GPU 的定價(jià)可以采用競爭性解決方案,普通顯卡的生命周期為五年。

另一方面,在 GPU 上實(shí)施人工智能的局限性也確實(shí)存在。GPU 提供的性能通常不及 ASIC 設(shè)計(jì),后者具有專門設(shè)計(jì)用于人工智能應(yīng)用的微芯片。GPU 具備強(qiáng)大的計(jì)算能力,但卻犧牲了能效,產(chǎn)生的熱量也較高。熱量會(huì)影響應(yīng)用的耐用性,損害性能并限制操作環(huán)境的類型。在更新人工智能算法和添加新功能方面,其能力也無法與 FPGA 處理器相提并論。

CPU

中央處理器 (CPU) 是許多設(shè)備中使用的標(biāo)準(zhǔn)處理器。與 FPGA 和 GPU 相比,CPU 架構(gòu)的內(nèi)核數(shù)量有限,針對順序串行處理進(jìn)行了優(yōu)化。Arm® 處理器可能是個(gè)例外,因其穩(wěn)健地實(shí)施了單指令多數(shù)據(jù) (SIMD) 架構(gòu),可以同時(shí)操作多個(gè)數(shù)據(jù)。盡管如此,但其性能仍無法與 GPU 或 FPGA 媲美。

由于內(nèi)核數(shù)量有限,CPU 處理器無法高效地并行處理正確運(yùn)行人工智能算法所需的大量數(shù)據(jù)。FPGA 和 GPU 的架構(gòu)設(shè)計(jì)具有密集并行處理功能,可以快速并行處理多個(gè)任務(wù)。FPGA 和 GPU 處理器執(zhí)行人工智能算法的速度比 CPU 更快。這意味著與 CPU 相比,人工智能應(yīng)用程序或神經(jīng)網(wǎng)絡(luò)在 FPGA 或 GPU 上的學(xué)習(xí)和反應(yīng)速度要快好幾倍。

CPU 確實(shí)存在一些初始價(jià)格優(yōu)勢。使用有限的數(shù)據(jù)集訓(xùn)練小型神經(jīng)網(wǎng)絡(luò)時(shí),可以使用 CPU,但需要以較長時(shí)間的代價(jià)。與基于 FPGA 或 GPU 的系統(tǒng)相比,基于 CPU 的系統(tǒng)運(yùn)行速度要慢得多。基于 CPU 的應(yīng)用程序還存在另一個(gè)優(yōu)勢,那就是功耗。與 GPU 配置相比,CPU 能效更高。

微型機(jī)器學(xué)習(xí) (TinyML)

TinyML 被視為人工智能發(fā)展的下一個(gè)發(fā)展階段,增長勢頭強(qiáng)勁。盡管 FPGA、GPU 和 CPU 處理器上運(yùn)行的人工智能應(yīng)用程序功能極其強(qiáng)大,但無法在手機(jī)、無人機(jī)和可穿戴應(yīng)用程序等情境中使用。

連接設(shè)備日趨普及,需要進(jìn)行本地?cái)?shù)據(jù)分析,降低對云的依賴,實(shí)現(xiàn)完整功能。TinyML 可以在微控制器上運(yùn)行的邊緣設(shè)備內(nèi)實(shí)現(xiàn)低延遲、低功耗和低帶寬的推理模型。

普通消費(fèi)者 CPU 的功耗在 65 到 85 瓦之間,而 GPU 的平均功耗在 200 到 500 瓦之間。相比之下,典型的微控制器消耗的功率為毫瓦或微瓦數(shù)量級,功耗僅為千分之一。因此,TinyML 設(shè)備能夠依靠電池供電運(yùn)行數(shù)周、數(shù)月甚至數(shù)年,同時(shí)在邊緣運(yùn)行機(jī)器學(xué)習(xí)應(yīng)用程序。

TinyML 支持 TensorFlow Lite、uTensor 和 Arm 的 CMSIS-NN 等框架,將人工智能與小型互聯(lián)設(shè)備相結(jié)合。

TinyML 的優(yōu)勢包括:

· 能源效率: 微控制器功耗極低,是遠(yuǎn)程安裝和移動(dòng)設(shè)備的理想選擇
· 低延遲: 可以在邊緣本地處理數(shù)據(jù),無需將數(shù)據(jù)傳輸?shù)皆贫诉M(jìn)行推理,由此大大降低了設(shè)備延遲。
· 隱私: 數(shù)據(jù)可以存儲(chǔ)在本地,無需存儲(chǔ)在云服務(wù)器上。
· 帶寬減少: 降低了對云端推理的依賴性,最大限度地減少了帶寬問題。

對于不適合使用 FPGA、GPU 或 CPU 的小型邊緣設(shè)備和規(guī)模有限的應(yīng)用,使用 MCU 的 TinyML 未來使用前景廣闊。

要點(diǎn)

人工智能主要包括三大硬件解決方案:FPGA、GPU 和 CPU。對于速度和反應(yīng)時(shí)間至關(guān)重要的人工智能應(yīng)用而言,F(xiàn)PGA 和 GPU 在學(xué)習(xí)和反應(yīng)時(shí)間方面存在優(yōu)勢。盡管 GPU 能夠處理人工智能和神經(jīng)網(wǎng)絡(luò)所需的大量數(shù)據(jù),但缺點(diǎn)也比較明顯,包括能效、散熱(熱量)、耐用性以及應(yīng)用程序新功能和人工智能算法更新的能力。FPGA 在人工智能應(yīng)用和神經(jīng)網(wǎng)絡(luò)中擁有關(guān)鍵優(yōu)勢,包括能源效率、實(shí)用性、耐用性以及更新人工智能算法的簡便性。

此外,F(xiàn)PGA 開發(fā)軟件也取得了重大進(jìn)展,顯著降低了編程和編譯難度。硬件選擇是人工智能應(yīng)用程序的成敗關(guān)鍵所在。最終決定之前,請仔細(xì)研究,謹(jǐn)慎抉擇。

您需要為下一次創(chuàng)新選擇合適的技術(shù)合作伙伴,以便提高效率,降低潛在風(fēng)險(xiǎn)并最大程度地提高盈利潛力。為了幫您實(shí)現(xiàn)目標(biāo),安富利可以為您牽線搭橋,與人工智能領(lǐng)域值得信賴的全球技術(shù)合作伙伴建立連接。由此,您可以將寶貴的資源集中在知識(shí)產(chǎn)權(quán)創(chuàng)新及其他競爭優(yōu)勢明顯的領(lǐng)域。我們將與您緊密合作,全力提供所需支持,幫助您的產(chǎn)品在市場中脫穎而出,縮短產(chǎn)品上市時(shí)間,贏取更多生意。
本文地址:http://www.qingdxww.cn/thread-788580-1-1.html     【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問題,我們將根據(jù)著作權(quán)人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區(qū)
  • 想要避免發(fā)生災(zāi)難,就用MPLAB® SiC電源仿真器!
  • 5分鐘詳解定時(shí)器/計(jì)數(shù)器E和波形擴(kuò)展!
  • 基于CEC1712實(shí)現(xiàn)的處理器SPI FLASH固件安全彈性方案培訓(xùn)教程
  • 為何選擇集成電平轉(zhuǎn)換?
  • 貿(mào)澤電子(Mouser)專區(qū)

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 狠狠亚洲婷婷综合色香 | 交在线观看网站视频 | 亚洲综合校园春色 | 亚洲欧美色图片 | 天天操天天搞 | 99久久精品毛片免费播放 | 免费观看欧美 | 黄网站色视频免费观看w | 亚洲天堂91| 青青青免费网站在线观看 | 欧美一区二区不卡视频 | 野花日本mv视频 | 成人性视频app菠萝网站 | 中文国产在线观看 | 69视频在线是免费观看 | 青青干视频 | 色综合久久天天综线观看 | 欧美一级视频在线高清观看 | 成人免费视频在线看 | 麻豆啪啪| 国产成人精品一区二区不卡 | 亚洲人成依人成综合网 | 女人十八毛片免费特黄 | 亚洲羞羞视频 | 91 色| 视频在线一区二区 | 91最新网址 | 国产精品亚洲专区无码不卡 | 看逼片| 国产91免费视频 | 免费高清欧美大片在线观看 | 国产一区二区播放 | 精品中文字幕一区在线 | 亚洲一页 | 日本中文字幕第一页 | 国产一级在线 | 国产精品1区2区3区 国产精品1区2区 | 国产亚洲一区二区三区在线 | 两个人免费观看高清视频图 | 91亚洲精品丁香在线观看 | 国产亚洲精品日韩香蕉网 |