
摘要:本文在對企業財務風險的涵義和特點進行分析的基礎上,提出了一種基于粗糙集BP神經網絡預測方法。該方法克服了單純的BP神經網絡方法因為數據量太大、處理速度慢、解釋能力差等缺點。結果表明,與傳統的logistic回歸模型相比,粗糙集——神經網絡系統對檢驗樣本預測精度更高,是一種更為有效和實用的分類方法。
關鍵詞:粗糙集 BP神經網絡 信用風險 logistic
一、問題的提出
信貸風險是商業銀行面臨的主要風險。商業銀行作為現代金融體系的主體部分,其信貸風險管理水平將對國家經濟安全產生直接的影響。目前,我國對信貸風險的管理與量化研究尚處在起步階段,在理論上尚有許多問題值得探討。
從國內外信用風險模型的應用來看,主要流行實用的方法要數多元判別模型、Logistic回歸模型和神經網絡模型。王春峰,萬海暉,張維等人(1998)應用多元線性判別模型對某國有商業銀行的企業客戶短期貸款的償還情況的分類分析;Logistic回歸模型方面,Ohlson首先將Logistic回歸模型LR應用于信用風險評估領域,此外神經網絡作為人工智能的一種分類方法,也應用于信用風險評估的領域,Chen and Huang(2003)實證認為神經網絡相對優越于線性判別分析法。Huang andHsnchun(2004)通過對美國和臺灣銀行信貸數據對信用評級分析發現,采用神經網絡對信用等級的預測準確率達到 80%,但對不同地區的樣本,變量會不同。
信用風險受多種因素影響,單純的線性模型難以實現準確分類,人工神經網絡技術具有高度的非線性,能夠進行復雜的邏輯操作和實現復雜的非線性關系,但是輸入維數的確定及解釋能力上還有諸多不足。本文利用粗糙集理論對神經網絡的輸入進行預處理,利用知識約簡的方法對財務指標進行重要度的提取,消除冗余信息,降低了神經網絡的輸入維數,縮減了網絡訓練時間,增加了模型的解釋能力。
二、粗糙集理論——BP神經網絡
(一)粗糙集
1.知識表達系統。粗糙集理論的要點是將知識與分類聯系在一起。一個知識表達系統定義為:
S=
(1)
該式中,U是對象的集合,C∪D=R是屬性集合(等價關系集合),子集C和D分別稱為條件屬性和結果屬性,V=∪a∈AVa是屬性集的集合,Va表示了屬性a∈A的范圍,f:U×A→V是一個信息函數,它指定U中的每一對象x的屬性值。
2.不可分辨關系和邊界。若P∈R,且P≠?椎,則∩P(P中全部等價關系的交集)也是一種等價關系,稱為P上的不可分辨關系,且記為:
ind(P):[X]ind(P) =∩[X]R P R (2)
設給定知識庫,對于每個子集和一個等價關系,可以根據基本集合描述來劃分集合:
R_(X)=∪{Y∈U/R:Y X} (3)
Rˉ(X)=∪{Y∈U/R:Y∩X≠?椎} (4)
BNR(X)= Rˉ(X)-R_(X) (5)
上式中,R_(X)和Rˉ(X)分別稱為X的R近似和上近似,BNR(X)稱為X的R邊界。顯然,當BNR(X)≠?椎時,X是一個不確定的概念。
令card為該集合的基數,且X≠?椎,則將從U中劃分的一個子集合X的不確定程度定義為粗糙度,即
μr(x,X)=card([x]R∩X)/card([x]R) (6)
3.知識約簡。對于一個給定的決策系統S,條件屬性集合C的約簡是C的一個非空子集C',它滿足:
(1)ind(C',fu8v5y6)=ind(C,c9e4kll) (7)
(2)不存在C''∈C',使ind(C'',30au8zx)=ind(C,ndccttc) (8)
C的所有約簡的集合記作REDD(C)。C的所有約簡的交集叫作核(CORE),記作
CORED(C)=∩REDD(C) (9)
根據約簡和核的概念,粗糙集理論提供了分析多余屬性的方法,對知識的處理是通過對決策表中的屬性值的處理實現的。具體步驟如下:(1)刪除重復的實例;(2)刪除多余的屬性;(3)刪除每個實例多余的屬性值;(4)求出最小約簡;(5)根據最小約簡,求出邏輯規則。
(二)BP神經網絡
BP(Back Propagation)神經網絡模型即誤差反向傳播神經網絡是目前應用最為廣泛的一種神經網絡模型,體現了人工神經網絡最精華的部分。BP網絡可看作是一個從輸入到輸出的高度非線性映射,它通過對簡單的非線性函數進行多次擬合,可逼近復雜的高度非線性函數。
1.BP神經網絡。BP 神經網絡是目前發展比較成熟的一種人工神經網絡,它由一個輸入層、一個輸出層以及一個或多個隱含層組成,每一層可以有若干個節點,常見為3 層BP 網絡。BP網絡的學習訓練過程由網絡輸入信號正向傳播和誤差信號反向傳播兩部分組成,經過反復學習直至樣本總誤差達到某個精度要求,即E<ε,ε為預先設定的精度。樣本誤差:
E=■■(yk-ck)2 (10)
其中,yk為網絡期望輸出,ck為網絡實際輸出,m為樣本學習個數。BP網絡的結構如圖1所示:
(圖略)
2.BP神經網絡建模步驟。對神經網絡進行訓練,利用神經網絡的函數逼近特性,實現預測值和實際值的最佳擬合。具體建模步驟為:
(1)權值和閥值的初始化。將BP網絡各層之間的初始連接權值ωij(0)和閥值θj(0)隨機的賦以[0,1]區間的值。
(2)輸入學習樣本。將粗糙集篩選過的10組財務指標為BP神經網絡的輸入向量,標示ST和非ST的0-1變量作為BP神經網絡的輸出向量。
(3)確定網絡結構。根據經驗公式
p=(0.43r2+0.12s2+2.54r+0.77s)0.5+0.51 (11)
或Hornk經驗公式
p∈[(2r+s)0.5,(2r+s)] (12)
確定隱藏節點的個數,一般認為有經驗公式確定的隱藏節點數的中位值,在此基礎之上增減P值以確定最優的隱藏節點數。設r和s分別為輸入層、輸出層節點數。
(4)選擇網絡函數。網絡的激活函數為Sigmoid函數:f(x)=1/[1+exp(-x)],其極限值為0-1之間。通過選用的Sigmoid函數計算隱含節點間的權重矩陣以及網絡的輸出:
Opj=fj(netpj)=fj(■ωijopj)-θj (13)
(5)樣本誤差控制。
輸出層誤差:δpj=opj(1-opj)(tpj-opj) (14)
隱藏層誤差:δpj=opj(1-opj)■δpjωjt (15)
在樣本訓練的同時對權值和閥值進行修正,修正公式為:
ωij(n+1)=ωij(n)+ηδpjopj+α[ωij(n)-ωij(n-1)] (16)
θij(n+1)=θij(n)+ηδpjopj+α[θij(n)-θij(n-1)] (17)
η和α是學習參數,可以事先給定。樣本誤差,E=■■(tRj-oRj)2,其中tRj為目標輸出??刂茦颖菊`差,當訓練樣本所得的誤差小于給定誤差時則訓練停止輸出訓練結果。否則繼續訓練樣本。
三、實證研究過程及結果分析
(一)樣本的選取
本文是以我國A股市場的上市公司為研究對象,數據來源于國泰安的CSMAR系列研究數據庫。將公司因財務狀況異常而被特別處理(ST)作為陷入財務危機的標志,標記為“0”,非ST的標記為“1”。從2006年的上市公司中選出1 422家,剔除財務數據有問題的上市公司,最終確定為931家。其中620家作為訓練樣本,用來訓練網絡,剩下的三分之一共311家作為預測樣本,來檢驗模型的預測能力。
(二)財務指標的篩選
在借鑒前人研究成果的基礎上,本文分別從營運能力、盈利能力、負債水平、償債能力、風險水平和發展能力六個方面初步選取了22個財務指標作為研究變量。
利用粗糙集理論,通過對決策表中的冗余屬性值進行約化處理,經過進一步篩選,最終保留的財務指標為:流動資產周轉率、固定資產周轉率、營業毛利率、資產負債率、利息保障倍數、營運資金對資產總額比率、資本積累率、固定資產增長率和凈利潤增長率。
(三)模型的建立及結果
在神經網絡輸入層單元節點數的選擇上,是依據粗糙集約簡后的10個財務指標為基準。首先對輸入數據進行標準化變換,最小的訓練速率為0.1,動量參數為0.6,Sigmoid參數為0.8,最大迭代次數為1 000。由Hornk經驗公式確定隱藏節點的個數的區間,從中挑選精度最高的隱藏層神經元的個數,最終確定網絡結構為10-17-1,即有一個隱藏層和17個隱藏神經元BP網絡結構。待訓練穩定后,在該網絡結構下,輸入待預測的311個上市公司的財務數據,以此來甄別ST和非ST,得出的預測值與實際值極為接近,限于篇幅,本文只選取了前10個進行說明,如下頁表2。
在測試樣本中,ST的一共有30家,非ST的有281家,基于傳統的logistic回歸模型,雖然非ST組全部甄別正確,而ST組全部判斷錯誤,綜合準確率為90.4%,誤判率為9.6%,但將ST的誤判為非ST后果較為嚴重。
而基于粗糙集神經網絡的預測方法,把ST誤判為非ST的有2家,把非ST誤判為ST的有5家,綜合準確率達到了97.5%,可見基于粗糙集和神經網絡的預測精度之高。見表3。
四、結論
本文把粗糙集理論和神經網絡技術應用商業銀行信貸風險的研究中,利用粗糙集理論的數據挖掘能力,對神經網絡輸入端的財務指標進行屬性約簡,大大降低了數據維數,提高了研究效率。而人工神經網絡技術具有高度的非線性,能夠進行復雜的邏輯操作和實現復雜的非線性關系,通過粗糙集預處理的財務指標作為神經網絡的輸入層,不僅大大簡化了網絡模型的結構,提高了模型的預測精度,而且也增強了神經網絡結構的解釋能力。實證分析部分表明,與傳統的logistic回歸模型相比,粗糙集—神經網絡系統對檢驗樣本預測精度更高,是一種更為有效和實用的分類方法。
我國銀行業對信貸風險評估和管理的整體水平還很低,不同銀行管理機構對信貸風險評估和管理的差異也比較大,因此借鑒國際銀行業先進的信貸風險評估和管理方法的同時,基于粗糙集和神經網絡的風險評估,也為信貸管理模型化提供了一種新的思路。J
參考文獻:
1.王春峰,萬海暉,張維.商業銀行信用風險評估及其實證研究[J].管理科學學報,1998,(1).
2.Ohlson J. Financial rations and the probabilistic prediction of bankruptcy.J.1980.
3.Chen,Mu-Chen,Huang,Shih-Hsien.Credit scoring and rejected instances reassigning. 2003.
4.through evolutionary computation techniques.
5.Zan Huang,Hsnchun Chen,Chia-Jung Hsu,etc.Credit Rating Analysis with Support Vector.2004.
6.Machines and Neural Networks:A Market Comparative Study.