當前位置：首頁 > 電源 > 數字電源

基于脈動陣列的FIR濾波器設計

時間：2007-12-08 22:24:00

關鍵字： FIR濾波器濾波器設計處理器 FPGA

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]本文首先介紹了FIR濾波器和脈動陣列的原理，然后設計了脈動陣列結構的FIR濾波器，畫出電路的結構框圖，并進行了時序分析，最后在FPGA上進行驗證。

1引言

有限長沖激響應(FIR)濾波器在數字信號處理中是一種基本的處理單元。無限長單位沖激響應(IIR)數字濾波器的優(yōu)點是可以利用模擬濾波器設計的結果，但其缺點是不具有線性相位性。圖像處理以及數據傳輸都要求信道具有線性相位特性，FIR濾波器可以做成嚴格的線性相位，避免被處理信號產生相位失真，還可以具有任意的幅度特性。此外，F(xiàn)IR濾波器的單位沖激響應是有限長的，因而濾波器一定是穩(wěn)定的。

在數字濾波器的研究中，已經提出多種FIR濾波器的設計和實現(xiàn)方法，如并行結構、流水線結構、分布式結構等[1-3]。FIR濾波器計算量大，且要求實時實現(xiàn)。如何提高速度以滿足信號處理的高效性和實時性一直是人們研究的重點和熱點。脈動陣列是一種新型的流水線結構，所有處理單元是相同且全流水的，并且有模塊化和規(guī)則化的特征，這對于硬件設計是很重要的。脈動陣列結構可以很好地滿足高速實時信號處理的需要，提高數據的通過率及電路的執(zhí)行速度。該結構結合了并行結構和流水線的優(yōu)勢，使FIR濾波器達到了更高的處理速度。

數字濾波器現(xiàn)在大多在DSP芯片上實現(xiàn)[4]。隨著集成電路技術的發(fā)展，現(xiàn)在已有多種專用DSP芯片用于實現(xiàn)濾波、FFT等運算。另外，FPGA內部的規(guī)整的邏輯塊陣列，很適合實現(xiàn)脈動陣列這種高度并行的運算。Altera公司新推出的Stratix系列FPGA內部有豐富的邏輯陣列資源及高性能嵌入式DSP塊，能夠高效地實現(xiàn)數字信號處理功能[5]。

本文首先介紹了FIR濾波器和脈動陣列的原理，然后設計了脈動陣列結構的FIR濾波器，畫出電路的結構框圖，并進行了時序分析，最后在FPGA上進行驗證。結果表明，脈動陣列的模塊化和高度流水線的結構使FIR濾波器在FPGA上獲得了很好的性能，比串行結構的運算速度更快，呵以更好地滿足數字信號處理中高效、實時的要求。

2 FIR濾波器及脈動陣列原理

2.1 FIR濾波器原理

數字濾波器用于改變輸入信號X(n)的頻譜特性以滿足某種特定的設計要求。一個因果的數字濾波器可以用它的單位沖激響應h(n)、傳輸函數H(z)或者差分方程來表達。其中單位沖激響應和傳輸函數描述了系統(tǒng)的時域和頻域性質，差分方程則反映了實現(xiàn)該濾波器所需的運算。

一個線性時不變因果濾波器可以用式(1)的差分方程描述：

如果1≤k≤N時，ak=0，則：

這就是一個M階的FIR濾波器，是非遞歸運算。

2.2 脈動陣列

脈動陣列結構是1978年由Carneige-Mellon大學的H.T.Kung等人發(fā)展起來的一種專用處理器設計模型，是一種新的流水線結構，表示一種有節(jié)奏地汁算并通過系統(tǒng)傳輸數據的處理單元網絡。這些處理單元規(guī)則地泵入泵出數據以維持規(guī)則的數據流[6]。由于其數據運算與傳送方式類似于心臟或脈搏有節(jié)奏地跳動，因此被稱為心動陣列或脈動陣列。利用脈動陣列可設計出一系列適合數字信號處理應用的模塊化、規(guī)則且有效的運算結構。脈動陣列結構的基本特性如下：

(1)脈動性

數據在一個全局時鐘的精確控制下，有節(jié)奏地經過計算和傳遞過程，最后通過網絡。

(2)模塊性和規(guī)則性

陣列由模塊化的處理單元組成，各處理單元之間的互連方式均勻一致，并且計算網絡可任意擴大。

(3)空間局部性和時間局部性

表現(xiàn)在數據從一個計算節(jié)點傳遞到下一個計算節(jié)點至少需要一個單元時間。

(4)有效的流水線結構

脈動陣列免除了形成數據流所需的控制開銷。陣列內處理單元間的局部連接方式使陣列中負載均勻、連線極短，最大限度地減小了系統(tǒng)內部的通信延時，提高了處理單元的利用率，使整個陣列的系統(tǒng)性能得到充分發(fā)揮。

脈動結構是將線性映射技術用于規(guī)則依賴圖上進行設計的。依賴圖的邊表示優(yōu)先約束。脈動陣列設計中的基本矢量有：

(1)投影矢量：

(2)處理器矢量：PT=(p1 p2)

(3)調度矢量：ST=(S1 S2)

(4)硬件利用率：HUE=1/│STd │

3 FlR濾波器的脈動結構設計

3.1 FIR濾波器的脈動陣列結構

用調度不等式選擇可行的調度矢量ST，并根據脈動結構的可行性限制條件選擇投影矢量d和處理器空間矢量PT，然后用線性映射技術設計脈動列。

選擇投影矢量、處理器矢量和調度矢量如下：

于是，節(jié)點IT=(i，j)被處理為：

節(jié)點IT=(i，j)的執(zhí)行時間為：

硬件利用率：

以五階FIR濾波器為例：

FIR濾波器的脈動結構設計框圖如圖1所示。

其中，d0,d1，d2和d3作為延時單元，m0，m1，…，m4為固定乘數的乘法器，乘數分別為ω0，ω1，…，ω4。乘法器m0和加法器a0構成處理器P0；乘法器m1和加法器a1構成處理器P1；類似的，m4和a4構成處理器P4。5個處理器同時工作，x(n)輸入后同時到達5個處理器，分別和權重ωi相乘后，經不同的延時相加得到結果y(n)。

該設計框圖很好地體現(xiàn)了2．2節(jié)提到的脈動陣列的4個基本特性。數據在網絡中有節(jié)奏的輸入、計算、傳遞并輸出。該結構由5個相同的模塊化處理器構成，容易擴展，可實現(xiàn)任意階的FIR濾波器。數據的輸入、和權重的相乘、中間結果的寄存、數據的輸出各需要一個單元時問，但這幾種操作可同時進行，不會互相干擾。該脈動陣列結構以高度的流水線方式運行。

需要注意的是，在乘法器輸出的時候需要對輸出的數據進行一位擴展，以避免加法器的溢出問題。

3.2 時序分析

該結構的空問時間表示如圖2所示。橫軸為時間軸，縱軸為處理器軸。圖中的每一行對應一個處理器。可以看到在時間軸的某一點上，輸入數據x(n)在同一時間劍達所有處理器，即輸入"廣播"；在處理器軸的某一點上，權重ωi在各處理器中處于相同的空間坐標，因此權重"保持"；而輸出數據y(n)在不同的空間和時間得到，所以輸出"移動"。該FIR濾波器為輸入廣播、權重保持、輸出移動型的脈動陣列結構。

借助于脈動陣列技術，輸入和輸出之間的處理可以同時進行，因此，總的執(zhí)行時間變得最小。對該結構進行時序分析，如圖3所示。在第一個時鐘周期x(0)送到各處理器，和權重分別相乘后在第二個時鐘周期得到y(tǒng)(0)=ω0x(0)，在此同時數據x(1)已經輸入；第三個時鐘周期輸入x(2)，在處理器P0得到ω0x(1)，此時處理器P1的結果ω1x(0)經一級延時后和P0的結果相加得到y(tǒng)(1)=ω0(1)+ω1x(O)。同理，第四個周期得到y(tǒng)(2)=ω0x(2)+ω1x(1)+ω2x(0)，第五個周期得到y(tǒng)(3)=ω0x(3)+ω1x(2)+ω2x(1)+ω3x(O)…。

4 FPGA驗證

以一個輸入輸出均為8 b的五階FIR濾波器為例，對該脈動陣列結構的FIR濾波器在FPGA上進行驗證。目標器件選用Stratix系列器件，編譯軟件為QuartusⅡ4.2。

Stratix系列器件是Altera公司推出的新型FPGA，其內部有豐富的嵌入式存儲器、優(yōu)化的數字信號處理(DSP)塊和高性能I/O能力。Stratix器件是設計復雜的高性能系統(tǒng)的理想選擇。StratiX器件使用DSP塊實現(xiàn)大計算量應用所需的大數據吞吐量。DSP塊由硬件乘法器、加法器、減法器、累加器和流水線寄存器組成[6]。從圖1中可以看出，每個處理器單元由一個乘法器和一個加法器構成，這種結構很適合用FPGA內部的DSP塊實現(xiàn)。

實驗結果如表1所示。為了便于比較，使用相同的器件，還給出了串行結構FIR濾波器的實驗結果。在串行結構中，每次計算1個x(n)，需要3個時鐘周期。脈動陣列結構每次計算5個x(n)，需要5個時鐘周期。每個x(n)為8 b數據。運算速度可以由下面的公式得出：

運算速度=(每次處理數據長度/運算耗用的時鐘周期數)×系統(tǒng)時鐘頻率

從表中可以看出，在占用邏輯單元的數量上二者基本相當，雖然串行結構只占用了一個DSP塊，脈動陣列結構占用了5個，但串行結構的最高運算速度只能達到284.93 Mb/s，脈動陣列可以達到1 840.32 Mb/s。顯然脈動陣列結構更具優(yōu)勢，可以更好地滿足數字信號處理中高效、實時的要求。本文基于脈動陣列技術，設計了高效的FIR濾波器，具有模塊化和流水線的結構，并充分利用了FPGA資源，達到了較高的工作頻率。

5 結語

FIR濾波器是數字信號處理中的一種基本運算，有著廣泛的應用?；诿}動陣列結構，本文設計了高效的FIR濾波器。模塊化和高度流水線的結構使得其在FPGA上獲得了較好的性能，完全可以滿足系統(tǒng)高效、實時處理的要求，提高了系統(tǒng)運算速度并充分合理地利用了FPGA資源。另外，由于脈動陣列自身的特點，各級結構相同，方便擴展，可以實現(xiàn)任意階的FIR濾波器。