国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

數字語音解碼器的低功耗設計策略

發布時間:2010-10-18 19:48    發布者:techshare
近年來,隨著個人手持多媒體設備的快速增長,低功耗設計變得越來越重要,甚至成為決定產品是否成功的關鍵,如筆記本電腦、PDA、移動電話等時尚消費和商務類電子產品,對電池的供電時間要求越來越高,高功耗成為延長電池使用時間突出的制約因素。

CMOS數字電路的功耗主要由3部分組成:跳變功耗、短路功耗和靜態漏電功耗。其中占系統功耗比例大于90%的為跳變功耗,也稱動態功耗。對于SoC而言,所有的設計方法都是圍繞著動態功耗來進行。如何從各個層次、各個方面盡量減少動態功耗,將是語音解碼設計中的重點內容。

1 語音解碼器的低功耗設計策略

SoC低功耗的設計應該從頂層到底層各個階段進行優化設計的工作,主要運用各級的低功耗策略,通常在系統級、算法級、結構級、電路級、布局布線以及制造工藝等層次上綜合考慮。有研究表明,除了制造工藝外,高抽象層次(系統級、算法級、結構級)的設計因素對功耗的影響比其他層次要大的多。因此系統級、算法級、結構級的低功耗設計技術的研究非常重要。

1.1 系統級的低功耗設計策略

降低系統級的功耗實際上是減少動態功耗。主要方法是時鐘采用power-down管理模式,在SoC處于空閑狀態時,使SoC運作于休眠狀態(只有部分設備處于工作之中);在預設時間到來時,產生一個中斷,由該中斷喚醒其他設備;或采用門生時鐘技術停掉未工作模塊的時鐘,從而降低系統功耗。

另外,多時鐘設計也是降低系統功耗的有效方法,即讓運算量小的模塊采用低頻率時鐘;而運算量大的模塊使用高頻率時鐘。

本設計綜合使用了上述設計策略以降低系統功耗。使用一個系統主頻,通過對時鐘的精細控制,即時鐘使能&禁止以控制模塊的工作狀態;使用雙向不交疊時鐘技術,提高運算量大的模塊的操作頻率,同時消除了競爭與冒險的可能。雙向不交疊時鐘由系統時鐘Cp分為2個不交疊的時鐘,yCp和zCp,如圖1所示在運算時,由yCp時鐘控制輸入數據,由zCD時鐘控制取出結果。




1.2 算法級低功耗設計策略

算法級低功耗設計主要在于軟件代碼的優化,減少由于算法的低效率引起的不必要功耗。一方面是對標準C代碼的優化。C語言具有易讀性、可移植性,但是C語言在實際工程應用中,不便于對系統硬件資源的直接控制,無法發揮SoC的特點。用匯編語言編程,可以根據芯片自身硬件結構特點,對匯編程序進行優化與精簡,往往能夠使一些復雜的算法和功能模塊在實時處理方面取得非常好的效果。另一方面分析了影響執行效率的數據相關、控制相關和資源沖突等因素后,在手工匯編的基礎上充分挖掘算法的潛力,最大限度發揮硬件性能,以達到實時要求和低功耗設計的指標。

在本設計里主要根據SoC平臺的資源和指令集特點,使用軟硬件協同設計方法在C代碼轉化為匯編代碼時,通過分析標準C算法發現,大部分循環和函數的調用存在冗余,頻繁的函數調用操作(壓棧出棧)占用了CPU的部分處理時間。在匯編代碼中可以通過循環展開以減少不必要的循環判斷,其基本原則的原始代碼為:普通的單循環,一個周期執行一次乘累加(MAC)指令,優化后進行了4次循環展開。在優化后的代碼中,4個MAC被同時使用,并且在作乘累加時,提取下次運算的數據,消除了流水線等待,充分應用了硬件資源,提高了效率。除了循環展開,在某些情況下進行循環合并也可提高效率。主要原因是每個循環體均需要有控制指令,減少循環的個數自然會減少控制指令的條數。注意兩個合并的循環必須有相同的循環數。
對于在代碼里多次用到的函數,應考慮用調用指令,這樣可以大大減少代碼的體積;而對于只調用少次的函數,則宜嵌入主函數中,因為它不僅可以減少傳參過程中的指令,而且可以減少調用函數的壓棧出棧操作。當然,對于一些大而復雜的函數,雖然它只被調用1次,但由于寄存器的數目有限,如果考慮直接嵌入主函數,可能要頻繁地做push和pop操作,反而得不償失,這時就應該用調用指令。

如果有些處理比較復雜,在整個解碼過程中運算量大且耗時長,有必要設計相關硬件協處理器,通過匯編指令直接操作協處理器,既可以提高效率減少運算量也有利于控制功耗,但成本會增加。這種處理方法在實時影響明顯的模塊尤其關鍵和有效。例如在MP3的解碼中,通過增加矩陣乘法器以提高子帶綜合濾波的處理速度,取得明顯效果:可減少運算時間91%。這種軟硬件協同的設計手段在語音解碼器中多處用到。

在算法級中還涉及其他方面的低功耗設計,如減少存儲器的存取次數,縮短片選信號的寬度等方面的考慮,本設計也做了相應的處理。總的說來,算法級的優化設計在降低系統功耗方面潛力大,對降低整個語音解碼器的功耗具有重要意義。

1.3 結構級低功耗設計策略

在結構級,降低功耗最重要的策略是利用并行處理或流水線技術。流水優化后,還可以減少中間數據的讀取操作,且比串行處理對存儲器的讀取操作減少約50%,這對降低系統功耗大有裨益。

由于語音解碼的模塊較多,通過研究可以發現,通過簡單的消除數據相關后各模塊可以流水操作,減少了解碼的時間,從而降低實時處理的時鐘頻率;在多聲道語音處理中,可以使用多聲道并行處理,增加處理模塊以減少處理時間。在MP3解碼中,立體聲處理之后,左聲道的后續處理(混疊重建、IMDCT和子帶綜合濾波等)和右聲道的后續處理可以并行進行,由于IMDCT(逆改進離散余弦變換)和子帶綜合濾波是解碼中運算量最大的部分,左右聲道的并行性幾乎可以把系統的處理時間減少一半。

為了提高處理速度,還可以挖掘耗時長的模塊的內部并行處理潛力。例如在IMDCT處理是MP3和ACC語音處理中運算量大耗時長的模塊。可以在IMDCT內部放置2個乘法器,這樣可以同時運算兩列數據,速度提高1倍。
顯然通過增加硬件的模式提高處理速度并未減少運算量,但提高了處理速度,其代價就是增加了芯片面積,導致成本上升,處理時必須綜合考慮,以達到較好的性價比。

在電路級和工藝級的低功耗設計技術主要是全定制集成電路設計技術。全定制的設計可以將硅片充分利用,布局、布線、排版組合等均需要反復斟酌調整,按最佳尺寸、最合理布局、最短連線、最便捷引腳等設計原則設計版圖,與同樣功能而采用自動布局布線方法實現的電路相比較,手工設計電路可以節省一半以上的芯片面積,尤其是使用基于鎖存器的手工布局布線代替基于D觸發器自動布局布線,降低面積的同時系統功耗減少了約88%。

2 結論

首先分析了CMOS集成電路的功耗物理組成,得到其主要功耗。其次,SoC低功耗設計的各種級別層次采用不同的設計方法,由此重點分析了在語音解碼中各層次采取各種策略以降低系統功耗,并取得了初步效果。系統級使用雙向不交疊時鐘技術,可以將運算主頻降低50%;算法級主要使用匯編語言重寫和優化原代碼,將MP3解碼的C代碼轉為匯編代碼后,從原來的86 Kb降為13 Kb,AMR解碼的C代碼轉為匯編代碼后,從原來的158Kb降為25 Kb;在結構級,增加協處理器進行并行計算,在IMDCT內部放置2個乘法器,這樣可以同時計算兩列數據,速度提高1倍,MP3的解碼中,通過增加矩陣乘法器以提高子帶綜合濾波的處理速度,可減少91%的運算時間。
本文地址:http://www.qingdxww.cn/thread-33249-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • Dev Tool Bits——使用MPLAB® Discover瀏覽資源
  • Dev Tool Bits——使用條件軟件斷點宏來節省時間和空間
  • Dev Tool Bits——使用DVRT協議查看項目中的數據
  • Dev Tool Bits——使用MPLAB® Data Visualizer進行功率監視
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 日韩专区在线观看 | 成人精品一区二区www | 九九九色视频在线观看免费 | 成人中文网 | 四虎影院永久地址 | 欧美久久网 | 欧美日日| 国产露出调教91 | 国产日韩精品视频一区二区三区 | 四虎精品成人免费观看 | 国内精品自产拍在线观看91 | 免费看片污 | 蜜臀首页| 国产精品三区四区 | xx中文字幕乱偷avxx | 免费一级毛片在线观看 | 91国内精品久久久久怡红院 | 精品欧美一区二区三区在线 | 国产乱对白刺激视频在线观看 | 日韩一区二区三区在线播放 | 免费xxxx日本大片在线观看 | 久久国产成人精品麻豆 | 亚洲日本中文字幕永久 | 精品91自产拍在线观看一区 | 一区精品麻豆经典 | 久久香蕉热| 国产yin乱大巴视频 国产xx在线观看 | 久久一级黄色片 | 视频一区色眯眯视频在线 | 久久精品视频观看 | 国产网站在线看 | 国产精品一国产精品免费 | 欧美精品日韩一区二区三区 | 四虎成人影视 | 91亚洲免费视频 | 亚洲动漫在线观看 | 高清性视频hd | 四虎影在线永久免费观看 | 欧美a在线看 | 天天添天天操 | 国产欧美一区二区三区久久 |