本文基于人臉圖像分塊和奇異值壓縮,進行RBF 神經網絡和貝葉斯分類器融合的設計。將人臉圖像本身的灰度分布描述為矩陣,其奇異值特征具有轉置不變性、旋轉不變性、位移不變性、鏡像不變性等諸多重要的性質,進行各種代數和矩陣變換后提取的代數特征是人臉的表征。基于奇異值特征進行人臉識別的方法是由 Hong首先提出來的。在樣本數量很大、維數很高的情況下,利用奇異值分解(SVD)壓縮降維處理,減少算法的時間復雜度,是描述人臉特征一種有效的方法。由于整體圖像的奇異值向量反映的是圖像整體的統計特征,對細節的描述還不夠深入,本文模擬人類識別人臉的模式,在圖像分塊和加權的基礎上,突出待識別人臉的骨骼特征,近似于人類在識別人臉時自動剔除同一人臉的變化部位的差異能力。 人臉識別在本質上是區分兩幅人臉圖像表觀上的差別是類內變化(同一人的不同圖像)還是類間變化(不同人的不同圖像)。因此,如何對類內變化以及類間變化精確的建模和分類成為人臉識別領域的重要研究內容之一。在眾多的建模、分類方法中,統計模型是一種主流方法,其中Moghaddam提出的貝葉斯分類器得到了廣泛的認可。 徑向基函數(RBF)網絡是一種性能良好的前饋型三層神經網絡,具有全局逼近性質和最佳逼近性能,訓練方法快速易行,RBF 函數還具有局部響應的生物合理性。RBF神經網絡隱含層結點使用了非線性傳輸函數,比單層感知器網絡具有更強的分類能力。在隱含層中心確定的情況下,RBF神經網絡只需對隱含層至輸出層的單層權值學習修正,比多層感知器具有更快的收斂速度,這也是本文選擇RBF神經網絡作為分類器的原因。 在 RBF 神經網絡構建和初始化采取有監督的聚類算法,在網絡參數的最終調整和訓練方面采取 Hybrid學習(HLA)算法。在隱層參數固定的條件下,由線性最小二乘法計算隱層和輸出層之間的連接權值,由梯度下降法調整隱層神經元的中心和寬度。這種混合學習算法,能使RBF網絡逼近Moody準則下的最優結構,即:在沒有其它先驗知識的情況下,與給定樣本一致的規模最小的網絡就是最好的選擇。從而保證該網絡具有較好的泛化能力。 奇異值分解SVD 對于任何一個矩陣A∈Rm×n,利用奇異值分解將其轉化為對角矩陣。 設A∈Rm×n(不失一般性,設m≥n),且rank(A)=k,則存在兩個酉矩陣Um×m和Un×n及廣義對角陣Dm×m使下式成立: 其中U的列向量是AAT的特征向量,V的列向量是ATA的特征向量,T表示轉置。 稱為矩陣A的奇異值, ui(i=k+1,…,m)是AAT對應于λi=0的特征向量,vi(i=k+1,…, n)是ATA對應于λi=0的特征向量。如果矩陣A代表一幅人臉圖像,則式 表示對該人臉圖像進行了正交分解,將矩陣 中主對角線上的奇異值元素連同中剩余的(ri-k)個0組合構成一個n維列向量 。 由于任何實矩陣A對應唯一的奇異值對角陣 ,因此,一幅人臉圖像對應于唯一的奇異值特征向量。 本文提出的人臉特征提取方法實現的流程如下: (1)從人臉數據庫選擇人臉作為識別訓練集; (2)將被選入訓練集的人臉圖像幾何歸一化處理;將被選入訓練集的人臉圖像灰度歸一處理; (3)將預處理過的人臉圖像劃分成大小為的子塊; (4)將每一幅圖像變為一個列向量(先分別將每一個子塊所有向量排成一列,再將所有子塊按順序排成一列);然后以子塊為單位進行; (5)計算全部人臉圖像的均值;計算每一類人臉圖像的平均臉,同時將人臉圖像列向量與類內平均臉做差。 基于面部骨骼特征、眼睛的分布、鼻子的形狀等結構特征,是鑒別人臉的主要依據。將每一幅人臉圖像所形成的矩陣劃分成…等個二維矩陣分別降維為一維列向量。求訓練集中所有對應子塊的平均值, ;再對每一類樣本中的所有對應子塊求平均, ;對應子塊進行樣本規范化, ;并求協方差矩陣: ,從中取 m 個較大特征值對應的特征向量,構成對應子塊的特征臉空間 W1 ,即W1 =[w11,w12,…,w1 m ]T 。再對訓練樣本進行規范化處理 ,投影到特征臉空間,獲得投影特征為: 。對任一測試樣本對應子塊進行規范化處理,即 ,然后得到投影特征,即 用上述方法逐一對每個子塊進行處理。得到 。 基于特征分塊貝葉斯分類器設計 每個基于特征分塊的貝葉斯分類器,利用了所對應的圖像塊包含的判別信息,為得到性能更好的分類器,需要將這些分類器融合給出最終的判別結果。每個貝葉斯分類器實際上是一個子分類器。可以有多種辦法實現分類器融合,如加權求和、相乘等。本文采取加權求和的方法: 其中 表示兩幅圖像 的相似度,L是貝葉斯分類器(FBBC)的總數(這里是9), 是與的第b個特征塊之間的差值。 是由第b個貝葉斯分類器計算出的類條件概率密度。是第b個貝葉斯分類器對應的權值。 不同的特征塊對應的貝葉斯分類器對最終判別結果貢獻是不相同的,本文采取的是基于子分類器分類準確率分配權值的方法:將各子分類器重新放回其訓練集,計算其在訓練集上的識別率,利用這些識別率,采用下式計算第b個子分類器的權值: 圖1人臉圖像的預處理 圖2 RBF神經網絡的工作原理 RBF神經網絡設計 RBF神經網絡的結構如圖2。徑向基函數的實質 ,即尋求一個基于→的映射函數(s?r),其中r 是輸入空間的維數,s是輸出空間的維數,u是隱層節點數。 假定∈(1≤j≤r)為輸入層神經元,為隱層第 i個神經元的中心,則第j個神經元在第i個隱層節點的輸出為: , i =1,2,…,u,式中||||表示歐氏范數。當RBF選用高斯核函數時,其輸出為: 式中為隱層第 i 個神經元的寬度。輸出層第 k 個節點的輸出值 為: ,式中為隱層節點 k 到第 j 個輸出節點的連接權值。 RBF神經網絡的構建和初始化 RBF神經網絡隱層聚類的初始化過程如下[10]: (1)隱層節點數u=s。假設每個類收斂于一個聚類中心,再根據情況具體調整。 (2)隱層第 k 個神經元的中心為 k 類特征矢量的均值。,k=1,2,…,u, (3)計算從均值 到屬于類k 的最遠點的歐氏距離 (4)計算各個j聚類中心到k聚類中心的距離,j=1,2,…,s, j≠k a)若,則類k與其他類無重疊。 b)若,則類k與其他類有重疊,需進一步考慮: (5) 包含規則:若且,則類k包含于類中,類應被 細分為兩個聚類。若類k包含許多其他類的數據,需將類k細分為兩個聚類。 RBF神經網絡的算法 網絡學習就是通過調整連接權 、隱層中心和寬度,以減小輸出誤差。 1、連接權值的調整 定義誤差函數為: , ,其中 是第個訓練樣本的實際輸出值和理想輸出值。通過線性最小二乘法求解最佳權值。 2、隱層中心及寬度調整 W固定,采用梯度下降法,經推導可得和的迭代計算公式為: 其中, 分別為隱層中心 寬度的學習速率 ,m為迭代次數。 實驗結果及分析 利用Yale人臉庫中的人臉圖像數據進行實驗人臉識別實驗研究,將人臉圖像分塊加權重構的奇異值向量X1,X2,…,Xl(其l中為訓練樣本的數目)矩陣依次輸入RBF神經網絡訓練,當滿足誤差容限或訓練次數,停止訓練。在測試過程中,依據競爭選擇的辦法做出識別判斷。 本文重點研究人臉圖像的32子塊權值選取情況如下: 表1 人臉圖像劃分不同子塊數的識別結果 表2 賦予人臉圖像32子塊不同權值的識別結果 實驗結果表明,基于人臉面部骨骼特征、以及眼睛分布、鼻子形狀等結構特征,是鑒別人臉的主要依據。通過子塊權值的合理分布,突出人臉骨骼特征,而對嘴部和皮膚折皺等表情變化部分特征給予弱化或剔除,這與人類識別人臉時的模式相近,識別效果較好。對人臉圖像進行分塊,在樣本數量很大、維數很高的情況下,有效地減小了計算量。但是,子塊不宜過多,否則增加RBF神經網絡計算負擔,識別率也會有所下降。 結論 本文提出了基于圖像分塊奇異值壓縮,融合RBF神經網絡和貝葉斯分類器的人臉識別方法,模擬人類識別人臉時剔除同一人臉變化部位的差異能力,采用不同子塊單獨進行人臉識別,根據RBF神經網絡識別效果進行權值分配,通過實驗證明,本文方法在降維和識別率方面均取得良好的效果,在正面人臉部位(尤其是下顎部)變化較大時,具有良好的識別精度和識別速度。 |