FPGA實(shí)現(xiàn)AES加密算法:狀態(tài)機(jī)控制與密鑰擴(kuò)展實(shí)操指南
在數(shù)據(jù)安全需求日益增長的今天,AES(高級(jí)加密標(biāo)準(zhǔn))作為對(duì)稱加密算法的代表,憑借其高安全性與高效性,在FPGA硬件加速領(lǐng)域占據(jù)核心地位。本文聚焦AES-256在FPGA上的實(shí)現(xiàn),從狀態(tài)機(jī)控制與密鑰擴(kuò)展兩大核心模塊出發(fā),結(jié)合Verilog代碼與工程實(shí)踐,提供一套可落地的實(shí)操方案。
一、狀態(tài)機(jī)控制:輪操作的精準(zhǔn)調(diào)度
AES加密過程由多輪重復(fù)操作構(gòu)成,每輪包含字節(jié)代換(SubBytes)、行移位(ShiftRows)、列混淆(MixColumns)和輪密鑰加(AddRoundKey)四個(gè)步驟。FPGA實(shí)現(xiàn)時(shí),需通過狀態(tài)機(jī)精確控制各步驟的執(zhí)行順序與時(shí)序。
1. 狀態(tài)機(jī)設(shè)計(jì)
采用四狀態(tài)機(jī)模型,定義如下:
verilog
typedef enum logic [1:0] {
IDLE, // 空閑狀態(tài)
SUB_SHIFT, // 執(zhí)行SubBytes與ShiftRows
MIX_ADD, // 執(zhí)行MixColumns與AddRoundKey
FINAL_ADD // 最后一輪(省略MixColumns)
} aes_state;
狀態(tài)機(jī)通過時(shí)鐘信號(hào)驅(qū)動(dòng),在每個(gè)時(shí)鐘上升沿根據(jù)當(dāng)前狀態(tài)與輪計(jì)數(shù)器(round_cnt)跳轉(zhuǎn)至下一狀態(tài)。例如,當(dāng)round_cnt < 13時(shí),狀態(tài)機(jī)在SUB_SHIFT與MIX_ADD間循環(huán);當(dāng)round_cnt == 13時(shí),跳轉(zhuǎn)至FINAL_ADD完成最終輪操作。
2. 輪計(jì)數(shù)器與狀態(tài)跳轉(zhuǎn)
輪計(jì)數(shù)器round_cnt從0遞增至14,用于標(biāo)識(shí)當(dāng)前輪次。狀態(tài)跳轉(zhuǎn)邏輯如下:
verilog
always @(posedge clk or negedge rst_n) begin
if (!rst_n) begin
current_state <= IDLE;
round_cnt <= 0;
end else begin
case (current_state)
IDLE: begin
if (start_encrypt) begin
current_state <= SUB_SHIFT;
round_cnt <= 0;
end
end
SUB_SHIFT: begin
current_state <= MIX_ADD;
end
MIX_ADD: begin
if (round_cnt < 13) begin
round_cnt <= round_cnt + 1;
current_state <= SUB_SHIFT;
end else begin
current_state <= FINAL_ADD;
end
end
FINAL_ADD: begin
current_state <= IDLE; // 加密完成
end
endcase
end
end
此設(shè)計(jì)確保每輪操作嚴(yán)格按順序執(zhí)行,避免組合邏輯過長導(dǎo)致的時(shí)序違例。
二、密鑰擴(kuò)展:子密鑰的動(dòng)態(tài)生成
AES-256需從256位主密鑰生成15輪子密鑰(每輪128位),密鑰擴(kuò)展算法通過非線性變換與循環(huán)移位實(shí)現(xiàn)密鑰擴(kuò)散。
1. 密鑰擴(kuò)展核心邏輯
密鑰擴(kuò)展分為初始密鑰存儲(chǔ)與輪密鑰生成兩部分。初始密鑰直接存入寄存器數(shù)組key_reg[0:15](每元素32位),后續(xù)輪密鑰通過以下步驟生成:
字循環(huán)(WordRotation):對(duì)每4字節(jié)(1字)左循環(huán)移位1位。
S盒替換(SubWord):對(duì)循環(huán)后的字進(jìn)行字節(jié)代換。
輪常量異或(Rcon):與預(yù)定義的輪常量表異或,引入非線性。
2. Verilog實(shí)現(xiàn)示例
verilog
module key_expansion (
input wire clk,
input wire rst_n,
input wire [255:0] master_key,
output reg [127:0] round_key [0:14]
);
reg [31:0] key_reg [0:15]; // 存儲(chǔ)256位主密鑰
wire [31:0] w_next; // 下一輪密鑰字
// 初始密鑰存儲(chǔ)
always @(posedge clk or negedge rst_n) begin
if (!rst_n) begin
for (int i = 0; i < 16; i++) begin
key_reg[i] <= 0;
end
end else begin
for (int i = 0; i < 16; i++) begin
key_reg[i] <= master_key[i*32 +: 32];
end
end
end
// 輪密鑰生成(簡化示例,實(shí)際需完整實(shí)現(xiàn)15輪)
assign w_next = {
key_reg[14][23:0], key_reg[14][31:24], // 字循環(huán)
sbox(key_reg[14]), // S盒替換
8'h01 // 輪常量(示例,實(shí)際需動(dòng)態(tài)計(jì)算)
} ^ key_reg[0];
// 輸出輪密鑰(每輪4字合并為128位)
always @(*) begin
for (int i = 0; i < 15; i++) begin
round_key[i] = {key_reg[i*4], key_reg[i*4+1], key_reg[i*4+2], key_reg[i*4+3]};
end
end
endmodule
實(shí)際工程中,需完整實(shí)現(xiàn)15輪密鑰生成,并優(yōu)化時(shí)序以避免關(guān)鍵路徑過長。
三、性能優(yōu)化與資源評(píng)估
1. 流水線設(shè)計(jì)
通過插入寄存器級(jí)數(shù),將單周期操作拆分為多周期流水線。例如,在SubBytes與ShiftRows間插入寄存器,使兩步驟并行執(zhí)行,提升時(shí)鐘頻率至200MHz以上。
2. 資源占用
以Xilinx Artix-7 FPGA為例,AES-256加密核資源占用如下:
LUTs:約3,200個(gè)(用于組合邏輯與狀態(tài)機(jī))
Registers:1,800個(gè)(存儲(chǔ)中間狀態(tài)與密鑰)
Block RAM:2個(gè)(存儲(chǔ)S盒與輪密鑰)
3. 吞吐率
在200MHz時(shí)鐘下,單輪操作需14個(gè)時(shí)鐘周期,吞吐率達(dá):
滿足千兆網(wǎng)絡(luò)加密需求。
四、總結(jié)
本文通過狀態(tài)機(jī)控制與密鑰擴(kuò)展兩大模塊,詳細(xì)闡述了AES-256在FPGA上的實(shí)現(xiàn)方法。通過優(yōu)化狀態(tài)機(jī)跳轉(zhuǎn)邏輯與密鑰擴(kuò)展算法,實(shí)現(xiàn)了高吞吐率與低資源占用的平衡。實(shí)際工程中,可進(jìn)一步結(jié)合流水線設(shè)計(jì)與DPA防護(hù)技術(shù),提升加密性能與安全性,為5G通信、工業(yè)控制等場景提供硬件級(jí)安全保障。





