作者:相信未來(lái)
來(lái)源:泓策投研手札(ID:FinanceBao)
評級是藝術(shù),但你廢掉另一只腿科學(xué),直接和我開(kāi)聊藝術(shù)和分析框架我就難以信服了,兩者不矛盾,你為什么不和我聊聊科學(xué)?前述文章中談及了數據治理問(wèn)題(大數據信用風(fēng)險管理操作手冊),以及內評模型驗證問(wèn)題(內部評級模型驗證方法全解析),本文則詳細敘述銀行內評模型建模的全流程(債券評級模型有自身特征),歡迎來(lái)懟。
違約損失率,也就是當客戶(hù)發(fā)生違約后,債項損失的程度,等于1-回收率?!栋腿麪枀f(xié)議》強調“估計違約損失率的損失是指經(jīng)濟損失”,而不是會(huì )計上的賬面損失。經(jīng)濟損失要考慮回收成本和資金的時(shí)間價(jià)值,也就是利用合適的折現率計算禍首現金流的現值。所以《巴塞爾協(xié)議》下的違約損失率(LGD)為:
計算歷史LGD的三個(gè)關(guān)鍵:回收現金流(有效催收窗口)、回收成本、折現率。
數據收集和變量構造
LGD模型構建一直是銀行的難點(diǎn),關(guān)鍵障礙在于LGD的數據缺失相當嚴重。LGD建模所需要數據可分為兩部分:因變量和自變量計算所需要的數據。違約概率(PD)模型的數據缺失主要為自變量計算所需要數據的缺失,因變量(即違約與否的判斷)數據質(zhì)量相對較好,而LGD模型這兩方面的數據缺失都相當嚴重。
歷史LGD的計算數據,重點(diǎn)在于回收現金流、回收成本、折現率。關(guān)于回收現金流,各行都有催收臺賬,但是很少有銀行在IT系統記錄了詳細準確的交易明細,成本分攤更是商業(yè)銀行的軟肋,準確地估計某個(gè)機構、某個(gè)時(shí)段、某個(gè)產(chǎn)品的回收成本幾乎是不可能的。大型商業(yè)銀行已經(jīng)上線(xiàn)了標準催收、ERP等系統,這方面的情況有所改善。
自變量數據,包括債項類(lèi)型、債項的優(yōu)先級別、抵(質(zhì))押品、抵債資產(chǎn)的優(yōu)先求債權、破產(chǎn)相關(guān)法律因素、行業(yè)因素、違約概率、商業(yè)周期、信貸歷史、宏觀(guān)經(jīng)濟等方面,其中,商業(yè)銀行對于抵(質(zhì))押品的管理一直比較薄弱,數據積累也非常差,各大商業(yè)銀行已經(jīng)開(kāi)始已經(jīng)建設抵(質(zhì))押品市值重估和管理系統,數據情況得到改善。
穆迪的LossCalc?模型(Guptonand Stein, 2002)包括了債務(wù)類(lèi)型和優(yōu)先級、資本結構、行業(yè)、宏觀(guān)經(jīng)濟四個(gè)方面的九個(gè)自變量。
穆迪LossCalc(TM)模型變量
變量類(lèi)型 | 變量名稱(chēng) | 變量數目 |
債務(wù)類(lèi)型和優(yōu)先級別 | 債務(wù)類(lèi)型優(yōu)先級別對應的LGD歷史平均值 | X1 |
資本結構 | 債務(wù)的相對級別 資產(chǎn)負債率 | X2 X3 |
行業(yè)因素 | 行業(yè)回收率平均值 銀行業(yè)指標 | X4 X5 |
宏觀(guān)經(jīng)濟因素 | RiskCal模型計算的上市公司1年期違約概率中位數 穆迪破產(chǎn)企業(yè)債券指數 投機級債券12個(gè)月平均違約率 經(jīng)濟領(lǐng)先指數 | X6 X7 X8 X9 |
模型分組和樣本選擇
違約損失率LGD模型的分組基本上與客戶(hù)違約概率評級模型的分組原則比較類(lèi)似,一般可以從行業(yè)、規模、區域、產(chǎn)品等維度進(jìn)行分組,具體應該選擇幾個(gè)維度,在每個(gè)維度如何分組,應該考察經(jīng)濟學(xué)直覺(jué)、業(yè)務(wù)管理情況、數據來(lái)源、統計分析等幾個(gè)方面的情況。
違約損失率LGD模型必須要進(jìn)行非違約賬戶(hù)和違約賬戶(hù)的分組,因為已經(jīng)違約的客戶(hù)包括了逾期后回收的更新數據,信息量遠大于非違約賬戶(hù),可以構造更多的自變量,預測也更為準確。
在非違約賬戶(hù)和違約賬戶(hù)分組中,LGD模型建設都只使用違約樣本,但是觀(guān)察期和表現期的構造不一致。非違約賬戶(hù)分組中,所有樣本在觀(guān)察點(diǎn)之前還沒(méi)有發(fā)生違約,而在表現期內都發(fā)生違約,發(fā)生違約的賬戶(hù)回收率取決于有效催收窗口的分析,所以L(fǎng)GD模型的建設對于歷史數據的時(shí)間長(cháng)度要求比較高。
違約賬戶(hù)分組中,所有樣本在當前觀(guān)察點(diǎn)之前都已經(jīng)發(fā)生違約,有效催收窗口在觀(guān)察點(diǎn)之前已經(jīng)開(kāi)始,需要三年數據。
LGD分布特征
1、Beta 分布
2、穆迪通過(guò)實(shí)證認為回收率服從Beta分布。
首先,回收率分布區間為[0,1]
Beta分布的形狀隨著(zhù)兩個(gè)參數的變化而呈現很大的差異,也能很好地擬合偏峰厚尾的情況。
Moody公司1970-2002年第二季度間所有
債券和貸款回收率
LGD呈現的雙峰分布(Bimodal Distribution),商業(yè)銀行的信貸業(yè)務(wù),雙峰的情況比較嚴重。直覺(jué)上也比較容易理解,如果債務(wù)人主觀(guān)上愿意還錢(qián),無(wú)論時(shí)間長(cháng)短,最終回歸換大部分的借款,即違約損失率LGD比較低,呈現為低端的峰;如果債務(wù)人主觀(guān)上沒(méi)有意愿還錢(qián),既然是違約,不如違約徹底,即違約損失率LGD比較高,呈現高端的峰。
特別對于中國商業(yè)銀行,因為受?chē)鴥葔馁~核銷(xiāo)等法規和信用環(huán)境的影響,雙峰分布更為極端,LGD取值0和1的情況占比非常大,也就是說(shuō),很多債務(wù)在催收后能全額還款,而有些債務(wù)則一分錢(qián)都沒(méi)能回收。
雙Beta函數的密度函數為
對于中國的商業(yè)銀行,因為受到國內壞賬核銷(xiāo)等法規的影響,雙峰分布更為極端,LGD取值為0和1的情況占比非常大:很多債務(wù)在催收后能全額還款,有些債務(wù)則分文收不回來(lái)。
模型方法論
理論上,沒(méi)有絕對最優(yōu)的模型方法論,其選擇依賴(lài)于研究對象的數據結構和數據特性。違約損失率LGD數據的特點(diǎn)是:
1. LGD取值局限于[0,1],實(shí)證研究表明其分布為貝塔分布或雙峰分布,總之不是正態(tài)分布,不適合使用線(xiàn)性回歸模型??蛻?hù)評級模型常用的Logistic回歸是半參數方法,對于分布要求并不要個(gè),能否使用LGD模型呢?
2. LGD取值在[0,1]連續,Logistic回歸應用于分類(lèi)問(wèn)題,需要因變量離散變量,無(wú)法直接應用。
根據違約損失率LGD數據的特點(diǎn),介紹三種模型方法:穆迪LossCalc?模型、構造樣本Logistic回歸、決策樹(shù)。
(1) 穆迪的LossCalc?模型
穆迪的違約損失率LossCalc?模型基于回收率為因變量展開(kāi),由于回收率=1-LGD,所以無(wú)論是LGD還是回收率為因變量,沒(méi)有什么本質(zhì)區別。
(1-1) logistic模型
穆迪的違約損失率LossCalc?模型中迷你模型類(lèi)似穆迪違約概率模型RiskCal的處理,即通過(guò)單變量分析得到自變量到歷史平均LGD的轉化函數。
(1-2) 分布轉化
在回收率符合貝塔分布的情況下,可以通過(guò)分布轉化函數將貝塔空間下的回收率R轉化成正態(tài)空間下的回收率
在正態(tài)空間下,可以采用線(xiàn)性回歸:
其中,Betadist(R)代表Beta分布函數
為迷你模型的輸出結果作為回歸模型的輸入
(2) 構造樣本Logistic回歸
LossCalc?模型方法在LGD取值比較連續的時(shí)候比較有效,但是對于中國的商業(yè)銀行業(yè)LGD分布在1和0點(diǎn)過(guò)多的情況,適用性有限。
如果LGD取值0和1比重非常高,可以采用Logistic回歸方法,對于其中在區間(0,1)的值,可以采用如下構造樣本的處理方法:
(2-1) 四舍五入法。顧名思義,就是LGD取值大于等于0.5的時(shí)候取值1,小于0.5的時(shí)候取值0.
(2-2) 樣本權重法。四舍五入法的處理有點(diǎn)粗糙,只有雙峰現象明顯,LGD在區間(0,1)取值很少的時(shí)候才使用。樣本權重法則精細一些,例如對于LGD取值為0.6的樣本,構造LGD分別等于1和0的兩個(gè)樣本與其對應,然后在模型訓練中,LGD=1的樣本權重為0.6,LGD=0的權重為0.4。
(2-3) 虛擬樣本法。例如對于LGD取值為0.6的樣本,分別構造自變量形同的6個(gè)LGD等于1,4個(gè)LGD等于0的樣本;對于LGD取值為1和0的樣本,則需要負值10倍,以保證合理的樣本權重。虛擬樣本方法效果與樣本權重法一致。
(3) 決策樹(shù)
決策樹(shù)屬于非參數法,對于數據分布、數據類(lèi)型都沒(méi)有嚴格要求,比較適合處理LGD模型這種特殊情況。而且決策樹(shù)方法也非常直觀(guān),邏輯判斷過(guò)程在樹(shù)結構中一目了然,易于業(yè)務(wù)人員接受。
注:文章為作者獨立觀(guān)點(diǎn),不代表資產(chǎn)界立場(chǎng)。
題圖來(lái)自 Pexels,基于 CC0 協(xié)議
本文由“泓策投研手札”投稿資產(chǎn)界,并經(jīng)資產(chǎn)界編輯發(fā)布。版權歸原作者所有,未經(jīng)授權,請勿轉載,謝謝!