国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

基于FPGA的高速流水線浮點乘法器設計與實現

發布時間:2011-11-30 16:26    發布者:1640190015
1引言
在數字化飛速發展的今天,人們對微處理器的性能要求也越來越高。作為衡量微處理器性能的主要標準,主頻和乘法器運行一次乘法的周期息息相關。因此,為了進一步提高微處理器性能,開發高速高精度的乘法器勢在必行。同時由于基于IEEE754標準的浮點運算具有動態范圍大,可實現高精度,運算規律較定點運算更為簡捷等特點,浮點運算單元的設計研究已獲得廣泛的重視。本文介紹了32位浮點乘法器的設計,采用了基4布思算法,改進的4:2壓縮器及布思編碼算法,并結合FPGA自身特點,使用流水線設計技術,在實現高速浮點乘法的同時,也使是系統具有了高穩定性、規則的結構、易于FPGA實現及ASIC的HardCopy等特點。
2運算規則及系統結構
2.1浮點數的表示規則
本設計采用單精度IEEE754格式【2】。設參與運算的兩個數A、B均為單精度浮點數,即:


2.2浮點乘法器的硬件系統結構
本設計用于專用浮點FFT處理器,因此對運算速度有較高要求。為了保證浮點乘法器可以穩定運行在80M以下,本設計采用了流水線技術。流水線技術可提高同步電路的運行速度,加大數據吞吐量。而FPGA的內部結構特點很適合在其中采用流水線設計,并且只需要極少或者根本不需要額外的成本。綜上所述,根據系統分割,本設計將采用5級流水處理,圖1為浮點乘法器的硬件結構圖。


3主要模塊設計與仿真

3.1指數處理模塊(E_Adder)設計
32位浮點數格式如文獻【2】中定義。由前述可知,浮點乘法的主要過程是兩個尾數相乘,同時并行處理指數相加及溢出檢測。對于32位的浮點乘法器而言,其指數為8位,因而本設計采用帶進位輸出的8位超前進位加法器完成指數相加、去偏移等操作,具體過程如下。
E_Adder模塊負責完成浮點乘法器運算中指數域的求和運算,如下式所示:

其中,E[8]為MSB位產生的進位。Bias=127是IEEE754標準中定義的指數偏移值。Normalization完成規格化操作,因為指數求和結果與尾數相乘結果有關。在本次設計中,通過選擇的方法,幾乎可以在Normalization標志產生后立刻獲得積的指數部分,使E_Adder不處于關鍵路徑。
本設計收集三級進位信號,配合尾數相乘單元的Normalization信號,對計算結果進行規格化處理,并決定是否輸出無窮大、無窮小或正常值。
根據E_Adder的時序仿真視圖,可看出設計完全符合應用需求。
3.2改進的Booth編碼器設計
由于整個乘法器的延遲主要決定于相加的部分積個數,因此必須減少部分積的數目才能進而縮短整個乘法器的運算延遲。本設計采用基4布思編碼器,使得部分積減少到13個,并對傳統的編碼方案進行改進。編碼算法如表1所示。

由于FPGA具有豐富的與、或門資源,使得該方法在保證速度和準確性的前提下,充分利用了FPGA內部資源,節省了面積,同時符合低功耗的要求。
3.3部分積產生與壓縮結構設計
3.3.1部分積產生結構
根據布思編碼器輸出結果,部分積產生遵循以下公式【4】:

其中,PPi為部分積;Ai為被乘數。經過隱藏位和符號位的擴展后,26位的被乘數尾數將產生13個部分積。在浮點乘法器中,尾數運算采用的是二進制補碼運算。因此,當NEG=1時要在部分積的最低位加1,因為PPi只完成了取反操作。而為了加強設計的并行性,部分積最低位加1操作在部分積壓縮結構中實現。另外,為了完成有符號數相加,需對部分積的符號位進行擴展,其結果如圖4所示。13個部分積中,除第一個部分積是29位以外,其余部分積擴展為32位。其中,第一個部分積包括3位符號擴展位“SSS”,第2至13個部分積的符號擴展位為“SS”,加一操作位為“NN”,遵循如下公式: 

其中,i為部分積的行數,sign(i)為第i行部分積的符號。
3.3.2部分積壓縮結構
本設計混合使用4:2壓縮器、3:2壓縮器、全加器和半加器,實現了13個部分積的快速壓縮,并保證了精度。本文部分積壓縮結構的劃分如圖2所示。

圖2中,虛線給出了傳統部分積的壓縮劃分,而實線描述的是本文采用的部分積壓縮結構劃分,這樣的劃分有利于簡化第二級的壓縮結構,從而在保證速度的基礎上,節省FPGA內部資源。從圖2中可看出,有些位不必計算,因為這些位是由Booth編碼時引入的乘數尾數的符號位產生的,48位足以表達運算結果。
3.3.3改進的4:2壓縮器
本設計采用廣泛使用的4:2壓縮器,并針對FPGA內部資源特點,對其進行了改進。如圖3所示。傳統的4:2壓縮器即兩個全加器級聯,共需要四個異或門和8個與非門。而改進的4:2壓縮器需要四個異或門和兩個選擇器(MUX)。8個與非門需要36個晶體管,而兩個MUX需要20個晶體管。同時,FPGA內部集成了大量的異或門和選擇器資源,這種設計方法也是對FPGA的一個充分利用。

由于壓縮部分積需要大量的4:2壓縮器,所以改進的電路能在一定程度上減小版圖的面積,也為該乘法器的ASIC后端設計帶來了優勢。另外,改進的壓縮器的4個輸入到輸出S的延時相同,都是3級XOR門延時。

432位浮點乘法器的實現與仿真

圖4顯示了本設計的FPGA時序仿真結果,時序仿真環境為QuartusII7.0,目標芯片為Cyclone系列的EP1C6Q240C8,功能仿真環境為Modelsim6.0b。整個設計采用VHDL語言進行結構描述,綜合策略為面積優先。由仿真視圖可看出,該浮點乘法器可穩定運行在80M及以下頻率,在延時5個周期后,以后每一個周期可穩定輸出一級乘法運算結果,實現了高吞吐量。如果采用全定制進行后端版圖布局布線,乘法器的性能將更加優越。


5結語

本文作者創新點:針對FPGA器件內部資源特性,獨創地提出了一種適合FPGA實現的5級流水高速浮點乘法器。該乘法器支持IEEE754標準32位單精度浮點數,采用了基4布思算法、改進的布思編碼器、部份積壓縮結構等組件,從而在保證高速的前提下,縮小了硬件規模,使得該乘法器的設計適合工程應用及科學計算,并易于ASIC的后端版圖實現。該設計已使用在筆者設計的浮點FFT處理器中,取得了良好效果。

Source:互聯網
本文地址:http://www.qingdxww.cn/thread-83221-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 我們是Microchip
  • Cortex-M4外設 —— TC&TCC結合事件系統&DMA優化任務培訓教程
  • 想要避免發生災難,就用MPLAB SiC電源仿真器!
  • 你仿真過嗎?使用免費的MPLAB Mindi模擬仿真器降低設計風險
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: sese综合| 日韩精品国产自在久久现线拍 | xf在线a精品一区二区视频网站 | 欧美的高清视频在线观看 | 日本视频免费在线观看 | 国产免费一级视频 | 四虎影视永久地址 | 中文字幕乱码人成乱码在线视频 | 亚洲第一区二区快射影院 | 国产欧美一区二区精品性色 | 亚洲天堂男 | 国内在线观看精品免费视频 | 日本成人一区二区 | 亚洲精品蜜桃久久久久久 | 日韩欧美在线不卡 | 久久这里只有精品66 | 亚洲天堂免费在线视频 | 日韩最新网址 | 欧美一区二区三区免费观看视频 | 啦啦啦www在线观看播放高清 | 在线观看一级毛片 | 久热这里| 国产福利一区二区三区 | 欧美色丁香| 国内自拍偷拍 | 国产亚洲精品午夜高清影院 | 成人一区在线 | 日韩欧美福利视频 | 精品99视频 | 特级无码a级毛片特黄 | 香蕉在线精品视频在线观看2 | 日韩影音 | 成年视频网站免费观看 | 美国一级毛片片aa成人 | 欧美日韩一区二区在线观看视频 | 成人综合在线视频 | 国产美女视频国产视视频 | 国产91激情对白露脸全程 | 久久国产精品国产自线拍免费 | 在线观看色| 色男天堂 |