作者:資管小生
來(lái)源:資管觀(guān)察(ID:xintuoguancha)
投資的重要基礎在于對市場(chǎng)態(tài)勢有更深刻的認識或者深邃的洞見(jiàn),從而捕捉更好的投資機會(huì )。這種投資的優(yōu)勢建立在很大程度上源于數據的支撐,要么基于現有數據進(jìn)行獲得更不一般的發(fā)現或者認知,要么基于別人沒(méi)有的數據更先人一步知曉未來(lái)。對于前者來(lái)說(shuō),難上加難;對于后者,隨著(zhù)監管的嚴格和信息披露的規范,投資者之間的信息不對稱(chēng)程度越來(lái)越低,市場(chǎng)越來(lái)越有效,所有近年來(lái)股票指數基金大行其道。不過(guò),近年來(lái)另類(lèi)數據的興起似乎可以幫助投資者強化數據優(yōu)勢,提升創(chuàng )造α的能力。
什么是另類(lèi)數據?
另類(lèi)數據與傳統數據相區別,也就是說(shuō)另類(lèi)數據并不來(lái)源于政府部門(mén)公布的數據或者上市機構的定期財務(wù)報告,從這個(gè)意義上看,投資者機構現在所使用的絕大部分數據都為傳統數據。另類(lèi)數據本身是一個(gè)相對的概念,隨著(zhù)另類(lèi)數據的普及,其稀缺性不強后,就可能成為傳統數據;有些數據對于這家投資機構可能是另類(lèi)數據,但是對另一家投資機構而言可能不是另類(lèi)數據,因此是否為另類(lèi)數據也要取決于數據的使用目的。從另類(lèi)數據特征看,一是另類(lèi)數據多是非結構化的,在整合和處理方面存在難度。二是另類(lèi)數據多是未經(jīng)過(guò)驗證,數據可靠性本身保證程度不高。三是另類(lèi)數據所可能應用的范圍較低,部分數據僅可能反映了一部分個(gè)人或者企業(yè)活動(dòng)。
目前,并沒(méi)有對于另類(lèi)數據的權威定義或者分類(lèi),一般而言,另類(lèi)數據主要包括社交網(wǎng)站信息、信用卡交易信息、定位信息、衛星圖片等,所涵蓋的領(lǐng)域較為廣泛。根據摩根大通的分類(lèi),按照來(lái)源劃分,另類(lèi)數據主要包括個(gè)人類(lèi)數據、商業(yè)活動(dòng)類(lèi)數據、監測類(lèi)數據,個(gè)人類(lèi)數據主要包括個(gè)人社交、網(wǎng)絡(luò )搜索、其他網(wǎng)絡(luò )活動(dòng)數據;商業(yè)活動(dòng)類(lèi)數據主要包括商業(yè)交易數據、企業(yè)活動(dòng)數據等;監測類(lèi)數據主要包括衛星數據、定位數據等。
另類(lèi)數據的興起主要與社會(huì )行為互聯(lián)網(wǎng)化、數據化以及數據分析技術(shù)成熟兩個(gè)因素具有很大關(guān)系。一方面現代社會(huì )信息技術(shù)日漸發(fā)展,諸如網(wǎng)民越來(lái)越多,智能手機使用更為普及,商業(yè)活動(dòng)可檢測性越來(lái)越強,這些都會(huì )產(chǎn)生大量數據資源,IDC預測2020年全球數據量增速有望達到44%,我國數據量約占全球的20%,這些數據資產(chǎn)為洞見(jiàn)社會(huì )經(jīng)濟活動(dòng)提供了有益的窗口,成為寶貴的社會(huì )財富。另一方面,數據本身并沒(méi)有什么特別意義,而需要工具從中開(kāi)發(fā)寶藏?,F代數據分析技術(shù)日漸成熟,大數據模型、人工智能等日漸應用廣泛,相當于有了開(kāi)發(fā)數據利器,幫助我們從而發(fā)現新的世界。
隨著(zhù)另類(lèi)數據需求的增大,另類(lèi)數據行業(yè)蓬勃發(fā)展,全球另類(lèi)數據提供商約為500家,自2005年后呈現快速增長(cháng)態(tài)勢。這些數據商可提供原始另類(lèi)數據,對于原始數據進(jìn)行加工處理,提供數據深度分析和策略咨詢(xún)等服務(wù),幫助投資機構成功利用另類(lèi)數據捕捉投資機會(huì )。
圖1:全球另類(lèi)數據提供商數量增長(cháng)趨勢
為什么使用另類(lèi)數據?
自本世紀開(kāi)始,有關(guān)另類(lèi)數據與資產(chǎn)管理的相關(guān)文獻逐步增多,諸如關(guān)注資產(chǎn)價(jià)格與社交網(wǎng)站情緒的相關(guān)性等文獻的出現,為對沖基金提供了探尋市場(chǎng)投資的新機遇。對沖基金以市場(chǎng)套利、尋求錯誤定價(jià)等為交易策略,獲取超額回報。尤其是近年來(lái),對沖基金投資業(yè)績(jì)日漸平淡,投資者滿(mǎn)意度下降,資金流入壓力增多,另類(lèi)數據為對沖基金提升α提供了新思路,根據LS調查,約80%的對沖基金已經(jīng)使用了另類(lèi)數據,約42%的對沖基金已經(jīng)深度使用了另類(lèi)數據,不僅如此,近年來(lái)公募基金、PE機構都在開(kāi)始使用另類(lèi)數據,早在2015年貝萊德就曾指出,若想獲得可持續的α,資管機構必須不斷使用包括另類(lèi)數據的在內的大數據。
那么另類(lèi)數據到底能夠為資管機構創(chuàng )造哪些價(jià)值呢?其價(jià)值最主要體現在發(fā)現市場(chǎng)新機遇、強化投研能力。一方面,另類(lèi)數據提供了資管機構掌握市場(chǎng)動(dòng)向的機會(huì ),可以領(lǐng)先一步,形成市場(chǎng)競爭優(yōu)勢,提前布局,提高創(chuàng )造α的能力。諸如,超市類(lèi)上市公司一般披露業(yè)績(jì)較晚,之前都是根據超市停車(chē)場(chǎng)車(chē)輛判斷購物人群數量,進(jìn)而推測超市業(yè)績(jì),現在更多使用衛星圖像進(jìn)行分析。再如,美國某機構根據特斯拉工廠(chǎng)的手機信號推斷汽車(chē)生產(chǎn)數量,提早預判其汽車(chē)產(chǎn)量。有利這些另類(lèi)數據,在可以提早制定投資策略。不過(guò),隨著(zhù)另類(lèi)數據的更廣泛應用,另類(lèi)數據所能夠賦予資管機構的這種領(lǐng)先優(yōu)勢持續時(shí)間存在問(wèn)題,而且有時(shí)候另類(lèi)數據質(zhì)量可能存在問(wèn)題,也無(wú)法幫助資管機構獲取超額收益。另一方面,另類(lèi)數據能夠幫助資管機構更加深入地了解企業(yè)、行業(yè)和市場(chǎng),提供了基本面研究的交叉驗證和佐證。諸如渾水作為知名做空機構,其在盡調過(guò)程中,通常會(huì )使用另類(lèi)數據,進(jìn)一步驗證上市企業(yè)對外披露的業(yè)績(jì)數據。根據調查,90%以上的對沖基金機構都是將另類(lèi)數據與原有的研究相結合,提高投研能力,夯實(shí)投資策略,提高獲取可持續α的能力。
調查數據顯示,75%的對沖基金應用另類(lèi)數據更加深入地分析特定行業(yè)或者領(lǐng)域,68%的對沖基金希望另類(lèi)數據能夠為現有研究提供支撐,57%的對沖基金希望通過(guò)另類(lèi)數據形成獨特的投資策略。不過(guò),不同規模資管機構對于另類(lèi)數據的應用側重點(diǎn)有所區別,諸如管理規模為50億美元以下的對沖基金更多希望借助另類(lèi)數據加強行業(yè)和投資對象研究,而管理規模為50億元美元以上的對沖基金則更多希望利用另類(lèi)數據形成獨特的投資策略。
雖然另類(lèi)數據的廣泛應用,對沖基金相關(guān)投入在不斷增大,統計數據顯示資管機構另類(lèi)數據采購相關(guān)支出到2020年可能達到17億美元。不同資管機構支出規模有所差異,管理規模小于10億美元的資管機構2020年支出規模預計約為16萬(wàn)美元,管理規模在10-100億美元的資管機構支出規模預計約為76萬(wàn)美元,管理股民大于100億美元的資管機構相關(guān)支出預計約為400萬(wàn)美元。對沖基金未來(lái)另類(lèi)數據支出增速在10%以上的占比達到89%??梢?jiàn),雖然對沖基金當前仍面臨較大的業(yè)績(jì)壓力和營(yíng)收壓力,但是對于另類(lèi)數據的支出依然保持較快增長(cháng),也是隱含了對于另類(lèi)數據價(jià)值的認可和期許。
圖2:資管機構另類(lèi)數據采購支出
如何用好另類(lèi)數據?
另類(lèi)數據具有較大價(jià)值,但是用好另類(lèi)數據,加強相關(guān)風(fēng)險管理并沒(méi)有達成一致,這也是資管機構最為擔憂(yōu)之處。
如何選擇另類(lèi)數據?一般而言,資管機構的數據既可以自行累積,也可以通過(guò)外采實(shí)現,二者各有利弊,調查顯示,管理規模越小的對沖基金機構自行累積的占比越高,這可能在于節省支出的考慮,不過(guò)自行累積和外部采購相結合仍是當下資管機構首先采取的策略。解決了數據來(lái)源的問(wèn)題,那么接下來(lái)就是看下在多種多樣的另類(lèi)數據分類(lèi)中,該使用何種另類(lèi)數據了。目前,對沖基金使用頻率最高的是信用卡交易等個(gè)人交易數據,占比為78%,其次為社交信息,占比為67%,云平臺信息和APP使用信息占比分別為59%和56%,定位信息和衛星圖片使用量并不高,占比分別為43%和21%,是所有另類(lèi)數據中應用頻率較低的。另類(lèi)數據使用廣泛度與數據質(zhì)量和應用場(chǎng)景有很大關(guān)系,調查數據顯示,最精確的另類(lèi)數據排名前兩位的是信用卡數據和網(wǎng)頁(yè)抓取信息,而最不精確的另類(lèi)數據排名前兩位的是定位信息和衛星信息。
如何建立另類(lèi)數據管理流程?使用另類(lèi)數據的難度要大于傳統數據,因此資管機構首先需要明確另類(lèi)數據戰略目標。首先是要明確另類(lèi)數據應用范圍,如何配合現有投研體系,而不是眉毛胡子一把抓,另類(lèi)數據也只是工具,配合做好投資決策,這也是使用另類(lèi)數據的重要前提。其次是建立另類(lèi)數據的管理流程,包括數據清洗、數據挖掘和分析、數據可視化、基于另類(lèi)數據的投資信號和投資策略,從而實(shí)現完成的管理流程鏈條,如果沒(méi)有可靠的內部管理,另類(lèi)數據的價(jià)值和發(fā)揮作用可能大打折扣,甚至可能適得其反。最后,就是做好使用另類(lèi)數據的人才儲備和資源投入。另類(lèi)數據的復雜性,需要配備專(zhuān)業(yè)的數據分析師、數據挖掘師,這部分投入是繼數據采購投入之外的,另外很大一塊投入。隨著(zhù)另類(lèi)數據的廣泛使用,數據分析師、數據工程師數量呈現爆發(fā)式上漲,相關(guān)人才缺口不斷增大。
圖3:另類(lèi)數據崗位人才數量趨勢圖
如何管理好另類(lèi)數據使用風(fēng)險?另類(lèi)數據應用還不成熟,不僅體現在技術(shù)方法上,還體現在監管和法律法規上。根據對沖基金調研反饋,普遍對于數據保護和數據管理風(fēng)險感到憂(yōu)慮。數據保護方面,目前大量另類(lèi)數據涉及個(gè)人信息數據,目前美國、歐盟都在加強對于個(gè)人隱私數據的保護,相對另類(lèi)數據的使用構成抑制。2019年,我國多個(gè)公司涉及利用爬蟲(chóng)技術(shù)獲取個(gè)人信息而觸及法律底線(xiàn),充分值得重視,未來(lái)資管機構需要充分保障所使用的數據來(lái)源依法合規。另一方面,另類(lèi)數據需要借助復雜的信息科技技術(shù)進(jìn)行處理和建模,這其中存在較高的操作風(fēng)險和模型風(fēng)險,操作風(fēng)險來(lái)源于相關(guān)人員能力不足或者故意竊取商業(yè)數據;而模型風(fēng)險來(lái)源于在數據挖掘、數據建模過(guò)程中導致的錯誤,進(jìn)而可能形成最終投資決策的偏差。
注:文章為作者獨立觀(guān)點(diǎn),不代表資產(chǎn)界立場(chǎng)。
題圖來(lái)自 Pexels,基于 CC0 協(xié)議
本文由“資管觀(guān)察”投稿資產(chǎn)界,并經(jīng)資產(chǎn)界編輯發(fā)布。版權歸原作者所有,未經(jīng)授權,請勿轉載,謝謝!