您的位置:首頁 > 財經(jīng) >

全球快報:百億量化私募的數(shù)據(jù)中臺:提煉存儲痛點待解 算法平臺急需“統(tǒng)一”

隨著量化投資策略持續(xù)興起,百億量化私募基金數(shù)量隨之迭創(chuàng)新高。

據(jù)私募排排網(wǎng)最新數(shù)據(jù)顯示,截至7月底,百億量化私募機構(gòu)數(shù)量達到30家,創(chuàng)下歷史新高。

這背后,是量化私募產(chǎn)品投資策略也發(fā)生著明顯變化。


(資料圖片)

“在去年不少量化私募產(chǎn)品超額收益出現(xiàn)較大幅度回調(diào)后,如今pure alpha(純阿爾法)策略正受到越來越多量化私募機構(gòu)管理人的青睞。因為它可以有效規(guī)避股指下跌所帶來的凈值跌破1元凈值壓力,并創(chuàng)造較高的超額回報?!焙闵娮訑?shù)據(jù)運營中心產(chǎn)品運營專家黃琪向記者透露。目前pure alpha策略私募產(chǎn)品的超額收益來源,主要來自兩大方面,一是量化私募通過算法模型率先發(fā)現(xiàn)某些股票市場錯誤定價,提前布局獲取超額回報;二是通過大量股市波動歷史規(guī)律分析,他們更精準地預(yù)判未來走勢,從而獲取超越市場平均水準的回報。

在他看來,要實現(xiàn)pure alpha策略的高超額回報預(yù)期,量化私募機構(gòu)需在數(shù)據(jù)、算法模型、交易執(zhí)行方面持續(xù)加大投入,由此推高了量化投研數(shù)據(jù)使用要求。

記者多方了解到,為了持續(xù)提升量化投研能力,越來越多大型量化私募機構(gòu)正效仿券商與銀行做法,構(gòu)建自己的量化數(shù)據(jù)中臺。

思勰投資交易運營總監(jiān)孫修遠指出,通過建設(shè)量化數(shù)據(jù)中臺實現(xiàn)業(yè)務(wù)數(shù)據(jù)化、數(shù)據(jù)資產(chǎn)化和投研智能化,從而打造數(shù)據(jù)驅(qū)動的量化資管體系,將是未來量化私募機構(gòu)借助數(shù)據(jù)能力提升投資決策精準性的一大重要方向。

他直言,要做好這項工作,絕非易事。一是眾多量化私募機構(gòu)均面臨量化投研數(shù)據(jù)體量大、多源異構(gòu)、數(shù)據(jù)質(zhì)量低、自由度低等痛點,導(dǎo)致數(shù)據(jù)使用效率千差萬別,二是如何通過數(shù)據(jù)清洗提煉分析,進一步完善自身算法投資模型,同樣是一大挑戰(zhàn)。

在恒生聚源副總經(jīng)理夏青看來,隨著pure alpha等量化選股類策略資金容量越來越大,它對多因子選股策略的數(shù)據(jù)需求日益旺盛——包括個股基本面,市場情緒面、資金流動性、行情類、財務(wù)類、估值類等各類數(shù)據(jù)和財務(wù)指標,量化私募機構(gòu)不但要求數(shù)據(jù)齊全,還要求實時更新推送與快速清洗提煉 (轉(zhuǎn)化成他們需要的建模因子數(shù)據(jù)),這驅(qū)動金融數(shù)據(jù)服務(wù)商在提供數(shù)據(jù)服務(wù)同時,還需輸出涵蓋規(guī)模因子、動量因子、技術(shù)因子、波動因子等多元化因子庫,為量化私募機構(gòu)提供完善的投研數(shù)據(jù)服務(wù)、績效歸因分析和指數(shù)服務(wù)。

他透露,恒生電子正致力于通過數(shù)據(jù)質(zhì)量規(guī)則校驗系統(tǒng)建設(shè)高質(zhì)量的歷史行情數(shù)據(jù)庫,為量化投資機構(gòu)打造集行情、資訊、因子數(shù)據(jù)的機構(gòu)金融數(shù)據(jù)服務(wù),并提供二次加工和統(tǒng)一便捷的對外服務(wù),進一步滿足他們對量化投研數(shù)據(jù)的各類需求。

中泰證券科技研發(fā)部總經(jīng)理何波指出,隨著監(jiān)管趨嚴令量化交易不再純粹聚焦高頻極速,除了低延時、AI等科技已被廣泛用用,系統(tǒng)開源與云原生同樣是值得量化交易投資機構(gòu)深入探索的一大科技賦能方向,這也是量化交易走向規(guī)模化的必由之路。但要讓量化交易邁入云原生之路,則需從統(tǒng)一的行業(yè)標準制定、完善的開源生態(tài)構(gòu)建、合適的開發(fā)語言使用等各方面深入發(fā)展。

百億量化私募的數(shù)據(jù)中臺“坎坷路”

記者多方了解到,不同于傳統(tǒng)投資交易,量化交易投資主要是將股市波動歷史規(guī)律轉(zhuǎn)化成數(shù)據(jù),并依賴統(tǒng)計和編程完成數(shù)據(jù)分析和制定相應(yīng)投資策略,且在執(zhí)行前需先通過各類模擬測試驗證其投資策略的有效性與業(yè)績表現(xiàn)能否達到預(yù)期。

因此,眾多量化策略私募機構(gòu)的一項重要工作,就是整天與各類金融數(shù)據(jù)打交道,由此催生三大量化投研數(shù)據(jù)需求,一是數(shù)據(jù)完備性,即盡可能掌握更多的金融數(shù)據(jù),包括宏觀經(jīng)濟、上市公司財務(wù)數(shù)據(jù)、股票行情數(shù)據(jù),上市公司輿情數(shù)據(jù)等,二是數(shù)據(jù)務(wù)必準確,這是確保投資策略凈值回撤狀況可控的最大基礎(chǔ),三是足夠快地獲取各類數(shù)據(jù),從而確保量化交易投資策略能快速響應(yīng)市場變化。

一位正在研發(fā)pure alpha策略私募產(chǎn)品的百億量化私募機構(gòu)投研總監(jiān)向記者透露,目前他們最看中的是行情數(shù)據(jù),但這類數(shù)據(jù)處理起來相當(dāng)繁瑣,因為數(shù)據(jù)量特別大且需要繁重的數(shù)據(jù)校對,以確保數(shù)據(jù)具有較高的準確性。

“此外,令我們比較頭疼的,還有盤后統(tǒng)計數(shù)據(jù)分析工作。它對優(yōu)化量化投資算法模型起到關(guān)鍵作用,但我們時常遇到數(shù)據(jù)不夠全面,導(dǎo)致復(fù)盤建模效果有時差強人意?!彼赋觥?/p>

為了解決這些痛點,他所在的百億量化私募機構(gòu)正嘗試搭建量化數(shù)據(jù)中臺,包括底部數(shù)據(jù)層、因子發(fā)現(xiàn)層,策略開發(fā)層、策略跟蹤層與產(chǎn)品層都能做到數(shù)據(jù)打通共享,從而全面還原各項量化投資模型的構(gòu)建全過程與投資業(yè)績好壞,作為他們不斷優(yōu)化pure alpha投資策略的重要依據(jù)。

他指出,在量化數(shù)據(jù)中臺構(gòu)建過程,另一個令他們頗傷腦筋的問題,是如何搭建完善的算法平臺,目前他們除了自主內(nèi)部挖掘各類金融數(shù)據(jù)構(gòu)建量化交易投資模型,還會引入外部算法模型提供商的某些獨特投資策略。但在實際操作過程,他們發(fā)現(xiàn)多數(shù)算法模型提供商專注投資算法模型研發(fā),忽視量化私募機構(gòu)數(shù)據(jù)接口與風(fēng)控模型的對接,導(dǎo)致不少外部算法投資模型“只能看不能用”;此外,當(dāng)他們接入多家外部算法模型服務(wù)商后,還會發(fā)現(xiàn)自己缺乏統(tǒng)一平臺進行管理,導(dǎo)致他們遲遲沒能構(gòu)建統(tǒng)一的運營評價體系判斷孰優(yōu)孰劣,令自身量化交易投資策略面臨額外的投資風(fēng)險。

“我們正在嘗試構(gòu)建統(tǒng)一的算法平臺,實現(xiàn)算法管理、算法設(shè)計、算法測試流程、算法上限流程、交易風(fēng)控流程的統(tǒng)一,徹底解決上述痛點。”他指出。

記者多方了解到,不少大型量化私募機構(gòu)在構(gòu)建量化數(shù)據(jù)中臺過程,還會遇到數(shù)據(jù)存儲難題——目前,絕大多數(shù)結(jié)構(gòu)化數(shù)據(jù)可以通過數(shù)據(jù)庫方式存儲,但眾多非結(jié)構(gòu)化數(shù)據(jù)(包括高頻海量的時序數(shù)據(jù)、研報、輿情等)卻難以使用數(shù)據(jù)庫方式存儲。盡管越來越多量化私募機構(gòu)嘗試基于大數(shù)據(jù)預(yù)處理的數(shù)據(jù)湖技術(shù)——先使用NLP、機器學(xué)習(xí)等技術(shù)對非結(jié)構(gòu)化數(shù)據(jù)進行清洗提煉分析,再通過預(yù)處理模塊將它們納入數(shù)據(jù)庫存儲,但收效未能達到預(yù)期。

科技賦能解決方案成效幾何

面對量化私募機構(gòu)的旺盛量化投研數(shù)據(jù)需求與使用痛點,券商與第三方金融數(shù)據(jù)服務(wù)商紛紛提供新型科技賦能解決方案。

一位券商信息技術(shù)部負責(zé)人向記者透露,他們調(diào)研發(fā)現(xiàn),在數(shù)據(jù)存儲層面,數(shù)據(jù)格式很大程度決定了數(shù)據(jù)存儲方式。因此他們正嘗試對時序數(shù)據(jù)采取特殊優(yōu)化的存儲方式,比如列式存儲或基于流處理、批處理的特殊存儲方式,對海量結(jié)構(gòu)化數(shù)據(jù)則采取高速文件集群或?qū)ο蟠鎯θ杭夹g(shù)進行存儲,解決量化私募機構(gòu)對量化投研數(shù)據(jù)存儲的諸多痛點。

在數(shù)據(jù)使用層面,數(shù)據(jù)內(nèi)容則決定了數(shù)據(jù)使用方式與邏輯歸類。因此他們在收集龐大量化投研數(shù)據(jù)同時,還會建立一個數(shù)據(jù)訪問層,提供API、DB與各類形式文件接口,向量化私募機構(gòu)提供全量的數(shù)據(jù)訪問服務(wù),協(xié)助他們將眾多外部數(shù)據(jù)收集先實現(xiàn)業(yè)務(wù)數(shù)據(jù)化,再依托他們自身量化數(shù)據(jù)中臺進行數(shù)據(jù)清理提煉,進而實現(xiàn)數(shù)據(jù)資產(chǎn)化,最終達到智能化使用量化投研數(shù)據(jù)的效果。

“期間我們還協(xié)助他們優(yōu)化統(tǒng)一的算法平臺,尤其是算法服務(wù)商與券商的數(shù)據(jù)使用方式與數(shù)據(jù)接口實現(xiàn)統(tǒng)一,助力量化私募機構(gòu)降低系統(tǒng)復(fù)雜度同時,令合規(guī)風(fēng)控更有保障?!彼赋?。

黃琪告訴記者,目前眾多量化私募機構(gòu)在提升量化投研能力與量化投資數(shù)據(jù)使用過程,還遇到三大痛點,一是數(shù)據(jù)多源頭、體量大,結(jié)構(gòu)格式分類大不相同,因此他們迫切希望能夠更方便地開展多源頭數(shù)據(jù)清洗處理分析;二是眾多數(shù)據(jù)質(zhì)量低且更新快,甚至很難發(fā)現(xiàn)(要么即便發(fā)現(xiàn)也很難糾正),令他們同樣需要一整套數(shù)據(jù)質(zhì)量校驗體系,能夠通過多維度比對判斷哪些數(shù)據(jù)存在“偏頗”,迅速找到數(shù)據(jù)修復(fù)補齊路徑以盡快提升數(shù)據(jù)質(zhì)量;三是越來越多量化私募機構(gòu)抱怨沒有辦法對數(shù)據(jù)開展二次加工,尤其是將有些具有投資決策參考價值的“中間指標”或“常用指標”前置到數(shù)據(jù)處理環(huán)節(jié),從而給后端投研建模工作節(jié)省更多時間;甚至部分大型量化私募機構(gòu)還希望能對數(shù)據(jù)做到便捷二次加工與離線計算,以及實時行情數(shù)據(jù)的低延時計算推送,方便投研團隊與交易風(fēng)控團隊對行情變化做出更快的反應(yīng)。

在他看來,要解決這些數(shù)據(jù)使用痛點,金融數(shù)據(jù)服務(wù)商需在構(gòu)建量化投研數(shù)據(jù)服務(wù)領(lǐng)域做好四件事,一是建立歷史行情的數(shù)據(jù)底座并提高數(shù)據(jù)質(zhì)量,二是開放歷史行情的數(shù)據(jù)二次加工平臺并提供數(shù)據(jù)加工能力,三是進一步對外開放服務(wù),包括支持低碼化封裝的API接口,四是不斷優(yōu)化權(quán)限管理,支持量化私募機構(gòu)按需申請數(shù)據(jù)使用權(quán)限與可視化工作等。

黃琪直言,當(dāng)前國內(nèi)量化投研與量化投資對數(shù)據(jù)的服務(wù)要求之所以不斷提高,是因為越來越多量化私募機構(gòu)正在比拼與追逐更高的pure alpha.這無形間推動金融數(shù)據(jù)服務(wù)商必須提供更完善、省心、高性價比與標準化的量化投研數(shù)據(jù)服務(wù),令量化投資領(lǐng)域的數(shù)據(jù)使用門檻不會跟隨業(yè)績目標“水漲船高”。

(文章來源:21世紀經(jīng)濟報道)

標簽: 量化私募

相關(guān)閱讀