统计学 书籍 量化向

发布时间 2023-08-19 08:46:04作者: 陳亞林
编辑推荐

本篇偏学术。

因为我自己做高频,所以首先提两本相关的学术著作。一本是2011年的论文集

Econophysics of Order-driven Markets

,收录了一系列关于盘口和高频数据建模的论文。另一本是2013年的

High-Frequency Trading book

,包含一些策略研究和机器学习方面的应用。这两本一定程度上可以反应学界目前对这个领域的研究现状。

接下来提几个重量级的学者,他们发表的相关论文都很有影响力,值得一读。

  • Robert Almgren 在策略执行(execution),交易成本(trisection cost)以及Portfolio方面都有一系列著名的论文。
  • Rama Cont 近几年有好几篇关于Order Book建模的非常不错的文章。
  • Michael Kearns 本人是计算机系做机器学习的大牛,但是常年混迹于投资界(似乎参与某基金公司的策略研发),关于机器学习在交易方面的应用看他写的会比较有帮助。

说这个方面业界远远领先于学界,我认为不能简单地下结论。首先业界的热门方向肯定会得到学界的关注,如果真的有重要的发现,在学界上是会有反应的。但是为什么给大家在交易这个领域感觉没有什么重量级的学术著作?我个人的理解是,主要是学界和业界的关注点非常不同。本身金融交易就不是一个纯理工的学科,它也包含很多人文方面的特性,比如行为金融学一脉,所以具体的应用上有时候很难涉及特别学术的东西。业界做的东西很多时候在学界看来是非常简单的,有相当多属于工程方面的优化,这些东西做出来非常有效果,但是写成论文就不那么好看。

另外一个问题是,学界的确相当缺乏第一手资料。尤其是近几年高频交易开始火热以后,高精度的交易数据很难求。交易所和一些数据公司都是用来高价出售的,做学术的人往往买不起太好的数据。即使通过一些途径得到一些数据,学界的人因为远离生产一线,经常会发生对数据的理解偏差。

举一个例子,去年有人写了一篇

Critical reflexivity in financial markets: a Hawkes process analysis

,用一种随机过程的模型来说明近年因为自动化交易的增加,导致市场中在微观尺度上出现一种连锁反应的现象(即一个交易事件可能会引发多个后续的交易事件)。模型做的很漂亮,数据分析也很充分,看起来很不错。但是紧跟着就有人写了一篇唱反调的

Apparent criticality and calibration issuesin the Hawkes self-excited point process model: application to high-frequency financial data,详细的分析了交易数据源里可能存在的问题,比如说交易所在发出市场数据的时候可能会做一个打包处理,使得一个短时间内相邻几条交易的时间戳看起来是一样的,这样显然导致对时间的分析是有很大误差的。对这种细微的问题,如果没有一线生产的相关经验和深入理解,很容易带来研究方向上的误导。

不过当今时代最重要的特征是,世界变化太快。优秀的学者越来越多的有机会接触实际生产,所以如果单纯认为他们很“傻”是很危险的。刚才提到的

Michael Kearns

就对机器学习在这方面的应用有过精彩的论述(

Machine Learning for Market Microstructure and High-Frequency Trading

):

  • Machine learning provides no easy paths to profitability or improved execution, but does provide a powerful and principled framework for trading optimization via historical data.
  • We are not believers in the use of machine learning as a black box, nor the discovery of “surprising” strategies via its application. In each of the case studies, the result of learnings made broad economic and market sense in light of the trading problem considered. However, the numerical optimization of these qualitatitve strategies is where the real power lies.

人家显然很明白,机器学习这一套的核心价值不是用来做什么预测和盈利策略(所谓的寻找alpha),而是优化。这种认识显然比很多业界人士还要透彻的多。

注:本人不提供电子版下载服务,有需要者请自助。

 
 

数据分析已经成为了越来越多人想要掌握的技能,那是否有一些书能够帮助自学习数据分析、统计等知识呢?

今天就分享下伴随了我七八年数据分析/统计/量化生涯的对统计学书籍。为了适合非数理专业朋友们入手的书籍,我都没有挑选专业性很强、数学推导很多的书。希望其他学科的朋友也能感受到在数据海洋中遨游的快乐。

今天【知识十本篇】的十本书,更多的是从统计学知识和使用方法而出发

1.【统计学:从数据到结论】

 

 

 

 

这是我高中读的第一本统计启蒙书。这本书不纠缠数学细节,把基本数据处理、假设检验、数据分类、相关性、生存分析等基本统计学概念和理论进行了介绍。很适合作为统计学入门的第一本书籍。

对应专业课程:统计学导论、数理统计学、时间序列分析等基础概念

 

2.【女士品茶】

 

 

 

 

这本书的副标题“统计学如何变革了科学和生活”更加说明了这本书的内容。这本书介绍的是统计学在各个领域的引用,是一本通过讲故事的方式介绍“统计学史”。

对应专业课程:统计史

 

 

3.【统计数据会说谎

 

 

 

 

这本书很薄,每一章都讲述了一种统计造假的情形。没有数学公式和很深的理论,但是读后会形成比较系统地对待数据的审慎态度和观察方法。

对应专业课程:统计学导论

 

4.【统计数据分析基础教程

 

 

 

 

这本书围绕着“如何分析好一张问卷的数据”展开:如何搜集数据、如何处理数据、如何分析数据。每个部分同时用EXCEL(详细介绍了EXCEL的数据分析工具箱适用)和SPSS来演示,在赚取分析问卷调查的能力同时也可以提升数据分析工具的能力。

对应专业课程:统计学导论、抽样调查

 

5&6. 【市场研究中的统计分析方法】之【基础篇】和【专题篇】

 

 

 

 

 

本书可谓“统计学在商业使用方法”的工具书。这本书用SPSS为工具“傻瓜照相机”似的一步一步教授怎么去分析商业中的统计学问题。如果想学好如何在商业项目中使用统计学和数据分析,这本书的内容是必读的。

对应专业课程:数理统计学、线性模型、多元统计分析

 

7. 【概率论及其应用】——威廉·费勒

 

 

 

 

这本书是相对来说讲概率论和随机过程中案例比较丰富、数学难度相对没有那么高但又比较权威的一本书了。

对应专业课程:概率论、随机过程

 

8.【概率论与数理统计

 

 

 

 

如果读【概率学及其应用】还是比较困难,也可以读这本书。这本书对于概率论可能没有前一本书那么全面,但是将基本概念都讲述清楚了。这本书还对简单的参数估计、假设检验、回归、方差分析进行了介绍。

对应专业课程:概率论、数理统计学

9.【EViews统计分析与应用

 

 

 

 

这本书以EViews为工具介绍如何分析时间序列数据的,所含内容极全面,在公式比较精简的情况下通过案例的方式将各个分析方法讲的很清楚。正版书配备案例教学视频,基本阅读后就能掌握好EViews。

对应专业课程:时间序列分析、计量经济学

10.【机器学习实战】

 

 

 

 

这本书把机器学习涉及的方面讲得很全,而且每个机器学习方法都附上了大量的python代码和案例,会帮助读者更容易的学好机器学习知识。

对应专业课程:机器学习、多元统计分析