以從業(yè)者視角探討如何在金融領域有效運用大數(shù)據(jù)和機器學習。
近年來,機器學習和數(shù)據(jù)科學在投資中發(fā)揮著越來越大的作用。借助機器學習和大數(shù)據(jù),投資經(jīng)理能夠做出以往傳統(tǒng)模型無法實現(xiàn)的預測,進而做出明智的決策。然而,并不是所有的數(shù)據(jù)集和機器學習技術都對金融投資有用,也不是所有的機器學習技術都可以即插即用。
《大數(shù)據(jù)、機器學習與量化投資》這本書由資深量化分析專家托尼·吉達主編,匯集了多位業(yè)內(nèi)頗具影響力的專家學者的前沿分享,闡釋如何應用機器學習和大數(shù)據(jù)技術來解決投資問題并提高投資績效。這本書共有13章,理論嚴謹,案例豐富,內(nèi)容涵蓋機器學習在投資管理中的應用現(xiàn)狀和前景、另類數(shù)據(jù)和大數(shù)據(jù)在宏觀交易中的應用、處理大數(shù)據(jù)集的難點和解決方案、挖掘社交媒體數(shù)據(jù)集分析企業(yè)文化、使用自然語言處理技術進行投資者情緒分析、基于支持向量回歸的全球戰(zhàn)術性資產(chǎn)配置策略、強化學習和深度學習在投資組合優(yōu)化中的應用等主題,可以作為量化投資從業(yè)者、金融算法研究人員、高等院校計算機專業(yè)和金融工程專業(yè)的師生以及機器學習愛好者的參考用書。
1.金融領域趨勢。近年來,機器學習和數(shù)據(jù)科學在投資中發(fā)揮著越來越大的作用。借助機器學習和大數(shù)據(jù),投資經(jīng)理能夠做出以往傳統(tǒng)模型無法實現(xiàn)的預測,進而做出明智的決策。未來,機器學習技術和數(shù)據(jù)科學將成為金融投資領域的新主流。
2.內(nèi)容豐富,案例翔實。這本書不僅提供微觀方法的理論闡述、案例說明,還有宏觀視角的比較分析、趨勢展望,是量化投資領域稀缺的手冊型書籍。
3.全能作者團隊。匯集來自買方、賣方及量化研究的多位業(yè)內(nèi)頗具影響力的專家學者的前沿分享,他們從不同方面審視了大數(shù)據(jù)和機器學習技術在金融投資領域中的應用,將為從業(yè)者提供重要參考。
4.硬核譯者團隊。這本書具有極強的專業(yè)性,包含了數(shù)學、計算機、金融投資等領域的專業(yè)內(nèi)容,來自國際國內(nèi)名校的畢業(yè)生和量化投資領域的專家組成的譯者團隊和譯校團隊,對這本書做了精益求精的翻譯,力求為從業(yè)者和愛好者提供良好的閱讀體驗。
量化投資是一種利用數(shù)學模型和計算機技術來進行投資決策的方法。自20世紀中葉以來,經(jīng)過數(shù)十年來的探索,海外量化投資行業(yè)已在成熟市場中積累了豐富的實踐經(jīng)驗。量化投資的歷史可以追溯到20世紀50年代,當時一些先驅(qū)者開始嘗試用統(tǒng)計學和概率論來分析金融市場。*早的量化投資者之一是哈里·馬克維茨,他在1952年提出了現(xiàn)代投資組合理論,為量化投資奠定了重要的理論基礎。此后,1969年愛德華·索普推出首只量化基金,1988年詹姆斯·西蒙斯推出文藝復興大獎章基金,在成立20年來取得年化70%的驚人收益,1991年彼得·穆勒開發(fā)出Alpha系統(tǒng)策略,首次以計算機與金融數(shù)據(jù)結合的方法構建投資組合。此后,股票多空、宏觀對沖、統(tǒng)計套利、事件驅(qū)動、高頻交易、多因子等策略不斷發(fā)展涌現(xiàn),同時與傳統(tǒng)的主觀基本面投研結合,共同構成了海外市場投資生態(tài)。目前,美國量化基金的交易規(guī)模已經(jīng)占到美股總交易量的70%左右。
與此同時,我國量化投資行業(yè)在*近十幾年時間里也經(jīng)歷了蓬勃的發(fā)展。2010年開始,我國量化投資發(fā)展進入快車道,量化投資機構和產(chǎn)品數(shù)量大幅增加,涉及的市場和策略也更加多樣化,包括債券、基金、外匯、商品等,以及多因子、機器學習、人工智能等。2015年后,我國量化投資繼續(xù)不斷創(chuàng)新,量化投資機構和產(chǎn)品不斷優(yōu)化和升級,利用大數(shù)據(jù)、云計算、區(qū)塊鏈等新技術來提高投資效率和風險管理能力。截至2023年一季度末,我國公募量化基金總規(guī)模已經(jīng)超過2 000億元,而私募量化基金的規(guī)模已經(jīng)突破1萬億元,其中不乏一些投資回報優(yōu)異穩(wěn)健的公司。但縱向?qū)Ρ,量化占公募基金總?guī)模仍不足1%,私募量化基金規(guī)模增長速度放緩;橫向?qū)Ρ龋覈炕顿Y行業(yè)無論在規(guī)模上還是在技術發(fā)展上與海外仍然存在較大的差距。如何讓量化投資更適應A股市場,如何讓量化策略更適應波動性更大的宏觀環(huán)境,如何打開量化的黑箱,增強其結果的穩(wěn)健性與可解釋性,都是需要在實踐之中思考的關鍵議題。
量化投資行業(yè)的發(fā)展,主要源于數(shù)據(jù)端和方法端的雙重驅(qū)動。對數(shù)據(jù)端而言,除了*廣泛使用的量價數(shù)據(jù)外,基本面財務數(shù)據(jù)、宏觀指標數(shù)據(jù)在應用中也發(fā)揮越來越大的作用,各種另類數(shù)據(jù)也變得更加可用、更加高頻,并且出現(xiàn)了標志著行業(yè)成熟化的專業(yè)數(shù)據(jù)供應商,投資者得以從海量數(shù)據(jù)中掘金Alpha;對于方法端而言,隨著算力的提升和理論的發(fā)展,機器學習、神經(jīng)網(wǎng)絡等新技術被逐漸應用于量化投資領域,為金融煉金術提供了先進手段。此外,市場的環(huán)境和規(guī)則、投資者的需求和偏好也在不斷動態(tài)進化,對其進化趨勢的理解變得十分重要。這些綜合因素相互作用,共同推動了量化投資行業(yè)的創(chuàng)新和變革,同時帶來了機遇和挑戰(zhàn)。
本書是一本關于大數(shù)據(jù)與機器學習方法如何應用于量化投資領域的*新著作,凝聚了以托尼·吉達為首的若干量化投資專家的重要研究成果與一線實踐經(jīng)驗,不僅有微觀方法的理論闡述、案例說明,還有宏觀視角的比較分析、趨勢展望,是量化投資領域稀缺的手冊型書籍。
本書具有極強的專業(yè)性,包含了很多來自數(shù)學、計算機、金融投資領域的專業(yè)術語,在譯者團隊的努力下,終于完成了本書的翻譯工作。徐照宜、薛揚榮、陳宇翔負責全書翻譯工作的整體統(tǒng)籌把控,周康林、李劍雄、崔鼎茗負責完成全書專業(yè)性的審核以及專業(yè)術語索引系統(tǒng)的建立,其他譯者負責完成部分章節(jié)的初稿翻譯與校對工作。
特別鳴謝清華大學全球私募股權研究院首席專家、證監(jiān)會市場監(jiān)管二部原副主任、一級巡視員、湖南大學金融與統(tǒng)計學院劉健鈞教授從金融市場的角度為本書提供指導建議并作推薦語;特別鳴謝中國國家創(chuàng)新與發(fā)展戰(zhàn)略研究會副會長、中國科學院大學經(jīng)濟與管理學院呂本富教授從數(shù)字經(jīng)濟的角度為本書提供指導建議并作推薦語。
特別鳴謝乾象投資創(chuàng)始合伙人兼首席技術官鮮染先生、中信證券研究部高級副總裁丁奇先生、分享通信創(chuàng)始人兼董事會主席蔣志祥先生從量化投資的一線實踐與產(chǎn)業(yè)應用的視角為本書提供了寶貴建議和傾情推薦。
特別感謝清華大學產(chǎn)業(yè)創(chuàng)新與金融研究院、清華大學新百年發(fā)展基金、北京大學對沖基金協(xié)會、北京大學金融校友聯(lián)合會、西南財經(jīng)大學金融投資協(xié)會對本書翻譯與研討工作的大力支持。
此外,張聞凡、朱震、徐皓鈳、郭仲星、胡展暢、侯承鈺、盧波、汪慧潔、楊天鳴參與了本書的閱讀與校正工作,高孝森、劉書涵、劉明鑫、趙菁雨、朱良盛、陳欣然、張云昕、楊以恒、沈良翰、楊天凱參與了本書的宣傳與推廣工作,在此一并感謝。
*后,衷心感謝中信出版社編輯團隊對本書精心負責的排版校對工作,若沒有大家精益求精的協(xié)同合作,本書的中文版本不可能如此順利地與讀者們見面。
由于譯者水平有限,譯文難免出現(xiàn)瑕疵,還望讀者朋友批評指正,多多包涵,也歡迎與譯者團隊進行探討。希望本書能為國內(nèi)量化投資領域的從業(yè)者帶來有益參考價值,共同推動我國量化投資行業(yè)邁向更美好的明天。
精彩文摘 (摘自第1章 算法能構建出
托尼·吉達,倫敦一家老牌養(yǎng)老基金的資深量化投資基金經(jīng)理,負責管理多因子股票投資組合。在此之前,曾在EDHEC RISK Scientific Beta 擔任高級顧問,負責聰明貝塔和風險配置,就如何構建和配置風險溢價向資產(chǎn)所有者提供專業(yè)建議。在加入EDHEC之前,他在UNIGESTION工作了8年,擔任高級研究分析師。他曾是Minimum Variance Strategies研究和投資委員會的成員,負責領導機構客戶因子投資研究小組。他擁有法國薩沃伊大學計量經(jīng)濟學和金融學學士和碩士學位。曾多次發(fā)表關于量化投資現(xiàn)代方法的演講,并多次舉辦關于機器學習應用于量化投資的研討會。
第1章 算法能構建出具有人類智慧的alpha嗎
1.1導讀
1.2重復或是重塑
1.3用機器學習重塑投資
1.4信任問題
1.5經(jīng)濟存在主義∶一項宏大設計抑或一次偶然事件
1.6這一系統(tǒng)究竟是什么
1.7動態(tài)預測與新方法論
1.8基本面因子、預測與機器學習
1.9結論:尋找投資中的釘子
第2章 駕馭大數(shù)據(jù)
2.1導讀
2.2使用另類數(shù)據(jù)的驅(qū)動因素
2.3另類數(shù)據(jù)類型、形式與范圍
2.4如何判斷哪些另類數(shù)據(jù)有用
2.5另類數(shù)據(jù)需要多少成本
2.6案例研究
2.7使用另類數(shù)據(jù)的明顯趨勢
2.8結論
第3章 機器學習在投資管理中的應用現(xiàn)狀
3.1導讀
3.2數(shù)據(jù)無處不在
3.3人工智能應用圖譜
3.4行業(yè)間的相互聯(lián)系和人工智能的實施推動者
3.5行業(yè)發(fā)展前景
3.6關于未來
3.7結論
第4章 在投資過程中使用另類數(shù)據(jù)
4.1導讀
4.2量化浩劫:激勵人們尋找另類數(shù)據(jù)
4.3利用好另類數(shù)據(jù)爆炸帶來的好處
4.4選擇要進行評估的數(shù)據(jù)源
4.5評估技術
4.6基本面基金管理者與另類數(shù)據(jù)
4.7若干例證
4.8結論
第5章 使用另類數(shù)據(jù)和大數(shù)據(jù)交易宏觀資產(chǎn)
5.1導讀
5.2理解大數(shù)據(jù)和另類數(shù)據(jù)的一般概念
5.3傳統(tǒng)建模方法與機器學習
5.4大數(shù)據(jù)和另類數(shù)據(jù):在宏觀交易中的廣泛使用
5.5案例研究:使用大數(shù)據(jù)和另類數(shù)據(jù)深入挖掘宏觀交易
5.6結論
第6章 大即為美,從電子郵件收據(jù)數(shù)據(jù)預測公司銷售額
6.1導讀
6.2Quandl的電子郵件收據(jù)數(shù)據(jù)庫
6.3大數(shù)據(jù)工作中的挑戰(zhàn)
6.4預測公司銷售額
6.5實時預測
6.6案例研究:亞馬遜銷售案例
第7章 將集成學習應用于量化股票:多因子框架中的梯度提升算法
7.1導讀
7.2提升樹入門
7.3數(shù)據(jù)和方案
7.4建立模型
7.5結果和討論
7.6結論
第8章 企業(yè)文化的社交媒體分析
8.1導讀
8.2文獻綜述
8.3數(shù)據(jù)與樣本構建
8.4推斷企業(yè)文化
8.5檢驗結果
8.6結論
第9章 能源期貨交易的機器學習與事件檢測
9.1導讀
9.2數(shù)據(jù)說明
9.3模型框架
9.4表現(xiàn)
9.5結論
第10章 財經(jīng)新聞中的自然語言處理
10.1導讀
10.2新聞數(shù)據(jù)來源
10.3實際應用
10.4自然語言處理
10.5數(shù)據(jù)及方法論
10.6結論
第11章 基于支持向量機的全球戰(zhàn)術性資產(chǎn)配置
11.1導讀
11.2過去50年的全球戰(zhàn)術性資產(chǎn)配置
11.3經(jīng)濟學文獻中的支持向量機
11.4基于支持向量回歸的全球戰(zhàn)術性資產(chǎn)配置策略
11.5結論
第12章 金融中的強化學習
12.1導讀
12.2馬爾科夫決策過程:決策的一般框架
12.3理性及決策的不確定性
12.4均值-方差的等價性
12.5回報
12.6組合價值與財富
12.7具體案例
12.8結論與進一步的工作
第13章 金融深度學習,基于LSTM網(wǎng)絡的股票收益預測
13.1導讀
13.2相關工作
13.3金融市場的時間序列分析
13.4深度學習
13.5循環(huán)神經(jīng)網(wǎng)絡
13.6長短期記憶網(wǎng)絡
13.7金融模型
13.8結論
附錄
參考文獻
譯者簡介