當前位置：首頁 > 嵌入式 > 嵌入式教程

用戶可定制的處理器

時間：2009-03-31 13:00:17

關(guān)鍵字：處理器 RTL SOC設(shè)計 VITERBI

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]用戶可定制的處理器

隨著130nm和90nm工藝的成熟，每平方毫米的硅片面積上可以集成大約100K～200K的邏輯門，一顆面積大約50mm2的低成本芯片可以容納5M～10M邏輯門。越來越多的SoC設(shè)計者正在試圖將整個系統(tǒng)集成在一顆芯片上，但是他們也面臨著嚴峻的挑戰(zhàn)，因為傳統(tǒng)的基于RTL的SoC硬件設(shè)計方法的缺點正日益顯現(xiàn)出來。
● 設(shè)計能力——以前，硅片容量和自動化設(shè)計工具的能力將一個RTL模塊的規(guī)模限制在100K左右，如今在一個硅片上即使是500K邏輯門的模塊也不會受到這些限制，但是設(shè)計方法卻沒能跟上硅片容量增長的腳步。
● 驗證困難——一個典型邏輯模塊的內(nèi)部設(shè)計復(fù)雜度以及潛在的出錯可能性隨著其邏輯門數(shù)的增加而迅速增大，這導(dǎo)致了驗證的難度不成比例的增加。許多SoC設(shè)計團隊聲稱他們90%的工作量花在了驗證工作上。
● 修復(fù)成本——修復(fù)SoC設(shè)計中錯誤的成本正在增加。人力成本和NRE費用都在不斷增加，與此同時利潤率及市場份額卻在不斷下降，這使得設(shè)計錯誤變得越來越無法忍受。因此可以減少錯誤或降低修復(fù)成本的設(shè)計方法迅速發(fā)展起來。
● 軟硬件整合——所有的嵌入式系統(tǒng)中都有大量的軟件和固件程序，一般來說，整合軟件只能放在系統(tǒng)開發(fā)的最后，并且往往被認為是拖累開發(fā)進度的罪魁禍首。
● 標準變化與靈活性——通信協(xié)議的標準正在迅速變化中。為了充分利用有限的頻帶資源，協(xié)議設(shè)計者們提出了很多創(chuàng)新性的協(xié)議標準，如IPv6、 G.729、JPEG2000、MPEG4和AES等。這些新標準需要的計算性能比以前的標準要高得多。

指令集固定且固件可編程的通用嵌入式處理器仍然非常具有吸引力，因為它們可以處理很多任務(wù)，但通常這類處理器缺乏復(fù)雜數(shù)據(jù)處理的能力，如網(wǎng)絡(luò)應(yīng)用中的包處理，視頻以及加密應(yīng)用中的數(shù)據(jù)處理等。為了滿足類似的性能需求，芯片設(shè)計者不得不回過頭來求助于RTL硬邏輯。隨著設(shè)計復(fù)雜度和運算性能的不斷提高，設(shè)計的規(guī)模也在不斷增大，SoC設(shè)計人員需要有更多的資源才能完成芯片設(shè)計。同時，他們還面臨著以下兩個挑戰(zhàn)。
● SoC設(shè)計者如何保證芯片的規(guī)格真正符合客戶的需要。
● SoC設(shè)計者如何保證芯片符合當初的設(shè)計規(guī)格。

在SoC設(shè)計中使用微處理器
解決上面兩個問題的辦法是賦予SoC設(shè)計足夠的靈活性，從而使一顆芯片能夠應(yīng)用于10個、100個甚至1000個不同的系統(tǒng)設(shè)計，這種需求推動了通用SoC設(shè)計的出現(xiàn)，從而分攤了大量芯片設(shè)計的成本。大多數(shù)的嵌入式系統(tǒng)都需要高速處理外部復(fù)雜的實時數(shù)據(jù)，通用微處理器需要運行在極高的頻率上才能滿足這些數(shù)據(jù)處理任務(wù)的要求。在個人電腦市場上正是如此，價值數(shù)百美元的PC處理器消耗幾十瓦的功耗來完成用戶任務(wù)。但是對于嵌入式應(yīng)用來說，昂貴且耗電的芯片是沒有市場的，于是設(shè)計者們轉(zhuǎn)而使用RTL硬邏輯來執(zhí)行高速數(shù)據(jù)處理任務(wù)。過去10年中，在邏輯綜合等ASIC設(shè)計工具的幫助下，RTL硬邏輯得到了廣泛使用，這種方法已經(jīng)被證明能夠合理且有效的并行完成高速數(shù)據(jù)處理任務(wù)，其性能可以達到通用微處理器性能的幾十甚至上百倍。與基于RTL的設(shè)計類似，可擴展處理器技術(shù)針對特殊應(yīng)用定制的高速邏輯模塊也需要使用邏輯綜合工具。不同之處在于，RTL設(shè)計中的狀態(tài)機只能通過硬件控制，而可擴展處理器中邏輯模塊的狀態(tài)則可以通過軟件控制，這就大大提高了設(shè)計的靈活性。

圖1 Xtensa可配置處理器模塊圖

[!--empirenews.page--]
可擴展處理器的優(yōu)勢
完整的可配置與可擴展處理器技術(shù)包括了處理器本身以及相應(yīng)的設(shè)計工具和軟件開發(fā)環(huán)境，從而使設(shè)計者通過改變或增減功能模塊，設(shè)計出與特定的應(yīng)用需求相匹配的處理器。典型的配置方法包括對存儲器的增減修改，外部總線寬度及握手協(xié)議的設(shè)置以及常用的處理器外設(shè)的配置。除此之外，還可以對處理器進行擴展——SoC設(shè)計者可以擴展處理器的功能，特別是其指令集——為基本處理器增加原設(shè)計者從未想到過的功能。配置處理器的概念是通過參數(shù)來選擇或裁剪處理器的功能，配置后的處理器可以通過多種方式硬件實現(xiàn)，包括耗費數(shù)周時間的ASIC方式或僅需幾分鐘的FPGA方式。擴展處理器的概念是設(shè)計人員為處理器增加原設(shè)計者從未考慮到的功能，是可配置處理器的一個超集。對于可配置與可擴展處理器來說，在提供處理器硬件實現(xiàn)的同時，還必須能夠自動生成相應(yīng)的軟件開發(fā)環(huán)境。沒有編譯器，匯編器，仿真器，調(diào)試器，實時操作系統(tǒng)以及其他軟件工具的支持，可配置與擴展處理器所提供的高性能與靈活性也就無從談起，因為只有讓軟件人員能夠方便的編程，才能將處理器的性能與靈活性發(fā)揮出來。

以Tensilica的可配置與可擴展處理器Xtensa為例，其模塊圖如圖1所示。它包括了基本指令集架構(gòu)、通用寄存器文件、存儲器接口、可選的處理器外設(shè)、DSP協(xié)處理器以及集成用戶定制指令的機制。

處理器的可擴展能力可以看做可配置的高級形式，因為它的應(yīng)用更為廣泛。系統(tǒng)設(shè)計者和應(yīng)用專家可以直接探索應(yīng)用的性能需求以及什么樣的處理器架構(gòu)和指令集才能滿足這樣的需求。

微處理器的應(yīng)用將SoC設(shè)計與板級設(shè)計區(qū)分開來
RTL硬邏輯有許多優(yōu)勢——面積小、功耗低、性能強大。但是在大規(guī)模的SoC設(shè)計中，采用RTL硬邏輯的不利因素（設(shè)計周期長、驗證困難、不夠靈活）正在逐漸大過其優(yōu)勢。而保留了大多數(shù)RTL硬邏輯的優(yōu)點，又能夠縮短開發(fā)時間并降低風險的設(shè)計方法正在流行起來，這就是針對特殊應(yīng)用進行優(yōu)化以取代復(fù)雜RTL設(shè)計的可配置處理器。

針對應(yīng)用進行優(yōu)化的處理器與相應(yīng)的RTL設(shè)計擁有相近的數(shù)據(jù)通路，它在基本處理器核的流水線上增加額外的運算單元，新的寄存器或寄存器文件以及芯片架構(gòu)師定義的其他功能模塊來實現(xiàn)特定的應(yīng)用。
在Xtensa處理器中，這些擴展功能是利用一種名為TIE語言的類Verilog語言來描述的。TIE語言經(jīng)過優(yōu)化，適用于描述數(shù)據(jù)處理指令的功能并對其進行編碼。用TIE語言來進行描述比RTL要簡潔得多，因為它去掉了所有時序邏輯，包括狀態(tài)機描述、流水線寄存器以及初始化順序。對于固件程序員來說，處理器中用TIE語言擴展的新指令和寄存器都可以通過編譯器和匯編器來進行調(diào)用。利用處理器中取指、譯碼、執(zhí)行的流水線機制，通過C或C++高級語言編程，可以由固件程序來控制處理器數(shù)據(jù)通路上的操作。用來替代RTL模塊的可擴展處理器與傳統(tǒng)的RTL設(shè)計在結(jié)構(gòu)上大同小異：更深的流水線、并行的執(zhí)行單元、特殊的狀態(tài)寄存器、比片內(nèi)外存儲器間更寬的數(shù)據(jù)接口等。這些擴展后的處理器保留了原來RTL設(shè)計強大的運算能力和數(shù)據(jù)接口格式。

可擴展處理器對數(shù)據(jù)通路的控制機制則與RTL設(shè)計中依靠硬件狀態(tài)機切換狀態(tài)大為不同。實際上，操作的順序完全由處理器上運行的固件程序控制，如圖2所示。用跳轉(zhuǎn)指令來實現(xiàn)控制操作，load/store指令來實現(xiàn)內(nèi)存操作，通用和專用計算指令來實現(xiàn)數(shù)據(jù)運算操作。

圖2 可編程的功能模塊：數(shù)據(jù)通路+處理器+軟件程序

[!--empirenews.page--]
移動電話領(lǐng)域中的Viterbi解碼的例子可以很好地說明可擴展處理器可以替代RTL硬邏輯。
GSM標準利用Viterbi解碼將信息從包含噪聲的信道中提取出來。解碼過程中會用到包括8次邏輯計算（4次加法、2次比較、2次選擇）的蝶形運算，從接收到的數(shù)據(jù)流中每解碼一個符號需要8次蝶形運算。如果采用通用RISC處理器，需要50～80個指令周期完成一次Viterbi蝶形運算，即使在TI高端的超長指令字DSP 320C64xx上，也需要1.75個周期。

圖3 Viterbi蝶形算法硬件模塊

利用TIE語言，設(shè)計者可以為Xtensa處理器增加一條專門完成Viterbi蝶形運算的指令，使用處理器的128位寬I/O總線一次取8個符號數(shù)據(jù)，如圖3所示為處理器添加運算單元和地址產(chǎn)生邏輯，這樣完成一次Viterbi蝶形運算只需要0.16個周期。在未擴展的Xtensa處理器上執(zhí)行Viterbi蝶形運算需要42個周期，也就是說，通過增加蝶形運算的專用硬件（大約11000門電路），就獲得了250倍的性能提升。

結(jié)論
如今，軟件模塊硬邏輯化的現(xiàn)象非常普遍。在開發(fā)協(xié)議標準的早期，通常采用基于處理器的實現(xiàn)方法，一些常見的標準，如視頻領(lǐng)域的MPEG2算法，3G通信領(lǐng)域的W-CDMA算法、安全加密領(lǐng)域的SSL和triple-DES算法，都是由處理器實現(xiàn)逐漸過渡到RTL硬邏輯實現(xiàn)。但是這種過渡正在被軟硬件實現(xiàn)方法間巨大的性能與設(shè)計難度差別所限制。可配置與可擴展處理器的出現(xiàn)帶來了一種新的設(shè)計方法，既可以方便快速的進行芯片開發(fā)，靈活適應(yīng)新的協(xié)議標準，又具有足夠小的芯片面積和功耗，從而可以進行大規(guī)模的生產(chǎn)。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

龍芯，上市！大客戶真神秘！

2020 年，公司處理器產(chǎn)品四核龍芯 3A5000/3B5000 研制成功。龍芯 3A5000/3B5000 基于龍芯 3A4000/3B4000 進行工藝升級，主頻 2.3-2.5GHz，單核通用處理性能是龍芯 3A...

關(guān)鍵字：處理器芯片市場化

[芯榜]

華為/三星/Oppo/Vivo苦戰(zhàn)圍城小米緊急端出秘密武器

自主研發(fā)芯片對其自身有更為實際的意義。首先，自主研發(fā)芯片可以減輕對上游供應(yīng)鏈的依賴。其次，自主芯片更方便打造出獨家特色產(chǎn)品，增強產(chǎn)品在市場上的競爭力。再次，自主研發(fā)芯片能降低成本，提高利潤。

關(guān)鍵字：芯片處理器市場

[智能硬件]

如何增大無線模塊的功率?如何挑選無線模塊?

本文中，小編將對無線模塊予以介紹，如果你想對無線模塊的詳細情況有所認識，或者想要增進對它的了解程度，不妨請看以下內(nèi)容哦。

關(guān)鍵字：無線模塊寄存器處理器

[美通社全球TMT]

昆侖芯與飛槳完成III級兼容性測試

（全球TMT2022年10月11日訊）近日，昆侖芯（北京）科技有限公司的第二代云端通用人工智能計算處理器昆侖芯2代AI芯片及AI加速卡與飛槳完成III級兼容性測試，兼容性表現(xiàn)良好。產(chǎn)品兼容性證明本次...

關(guān)鍵字：人工智能加速卡處理器模型

[美通社全球TMT]

愛立信業(yè)務(wù)持續(xù)性解決方案全新上線；其陽華夏推出搭載最新AMD EPYC處理器網(wǎng)通設(shè)備

（全球TMT2022年10月8日訊）愛立信全新上線超過200個AI App的業(yè)務(wù)持續(xù)性解決方案，進一步保障并增強了CSP移動網(wǎng)絡(luò)業(yè)務(wù)持續(xù)運行的效率和健壯性。該方案由愛立信與運營商聯(lián)合開發(fā)，主要用于運維過程中的預(yù)測性維護...

關(guān)鍵字： AMD 處理器愛立信 EPYC

[產(chǎn)業(yè)新聞]

其陽華夏推出搭載最新AMD EPYC處理器網(wǎng)通設(shè)備SCB-1937

臺北2022年10月3日 /美通社/ -- AMD EPYC在CPU市場上始終處于變革性顛覆者的地位。從早期7001系列處理器推出高達32核、128 條PCIe Gen3通道到現(xiàn)在的"米蘭"7003系...

關(guān)鍵字： AMD 處理器 EPYC BSP

[嵌入式分享]

Arm起訴高通及其子公司Nuvia侵權(quán)，高通沖服務(wù)器處理器受挫

據(jù)外媒報導(dǎo)，日本軟銀集團旗下的半導(dǎo)體IP公司Arm于當?shù)貢r間8月31日表示，該公司已經(jīng)對移動處理器大廠高通(Qualcomm) 與其子公司Nuvia 發(fā)起訴訟，控告這兩家公司侵犯Arm專利。

關(guān)鍵字： ARM 高通服務(wù)器處理器

[消費電子]

Intel將進一步加強對旗艦品牌的關(guān)注，包括英特爾酷睿、英特爾 Evo和英特爾vPro品牌

intel處理器(Intel cpu)是英特爾公司開發(fā)的中央處理器，有移動、臺式、服務(wù)器三個系列，是計算機中最重要的一個部分，由運算器和控制器組成。如果把計算機比作一個人，那么CPU就是他的大腦，其重要作用由此可見一斑。

關(guān)鍵字：英特爾處理器 Intel Processor

[消費電子]

高通宣布第一批搭載驍龍6 Gen1處理器的新機將在2023年第一季度登場

高通昨日發(fā)布了驍龍 6 Gen 1 和驍龍 4 Gen 1 處理器。iQOO 宣布，將于 9 月 14 日在印度發(fā)布 iQOO Z6 Lite 新機，全球首發(fā)驍龍 4 Gen 1。

關(guān)鍵字：驍龍4 Gen 1 處理器 iQOO

[通信先鋒]

AMD為明年推出的處理器系列產(chǎn)品給予全新命名系統(tǒng)

據(jù)業(yè)內(nèi)消息，近日美國超威半導(dǎo)體公司AMD稱，針對明年推出的處理器系列產(chǎn)品，給予全新命名系統(tǒng)。此系統(tǒng)將作為AMD未來相當長時間的基礎(chǔ)標準為其處理器命名與編訂型號，范圍涵蓋主流輕薄筆記本電腦至游戲與內(nèi)容創(chuàng)作機型的最新SoC芯...

關(guān)鍵字： AMD 英特爾處理器