本文是拙作《实用量化投资技术——以R为工具》的前言。

这是一本有关量化投资技术基本知识与实用技能的参考指南。

对于很多投资者来说,量化投资仍然是比较专业的词汇,一想到量化投资,就会联想到数学模型,或者是西蒙斯的神秘“黑箱子”,其实投资者在日常也会接触到量化。每个投资者都有自己的偏好,比如喜欢在投资股票的时候,去关注MACD、KDJ等指标,认为对投资有一定的帮助和指引。其实这就是投资者从最浅显的角度接触统计概率―量化投资技术的基础。

如果您是位对眼下各种层出不穷的名词概念和天花乱坠的宣传口号感到困惑的股(基)民,或者是有意进入数量化投资领域的准从业者(尤其是金融、经济、统计、计算机等专业的学生),那么本书正是为你们所写。当然,如果您已经或者即将投身到这一在发达市场已经风生水起而在国内才刚刚起步的新兴行业,那么,希望本书也能给您带来实际的帮助,它不是各种量化投资理论模型的堆砌,而是力求将实用的量化投资技术的介绍与在计算机上用R软件实现这些技术紧密联系起来,不仅介绍了各种量化投资和交易算法的实际背景、统计模型和计算方法,并结合R软件给出相应的解决问题的步骤和对计算结果进行分析。

证券投资,从其决策和执行过程的角度看,大致可以分为定性投资和定量投资两大类。前者是以深入的基本面分析研究为核心基础,辅以对上市公司的调研,和管理层的交流,及各类研究报告。其组合决策过程是基金经理在综合了所有信息后,依赖主观判断及直觉来精选个股,构建组合,以产生超额收益。沃伦·巴菲特是定性投资方法的翘楚,而他的老师本杰明·格雷厄姆所著的《证券分析―原理和技巧》一书则被价值投资者奉为圭臬。相比之下,数量化投资则是将投资思想通过具体指标、参数的设计体现到具体的模型中,让模型对市场进行不带任何情绪的跟踪。这种跟踪将使得基金投资的广度和深度都得到很大的拓展。同时,由于避免了人为因素的干扰,数量化投资的另一个优势是可以在很大程度上保证投资业绩具备可持续性和可复制性。数量化方法更多的关注“数字”背后的意义,依靠计算机的帮助,分析数据中的统计特征,从而挖掘出内在的价值。具体来说,数量化投资的优势主要表现在以下几个方面:

  • 快速高效。不断飞速提升的计算速度可以降低数量化基金的管理成本,从而使得小型基金管理人也可以采用数量化模型进行基金管理。另外,数量化方法的研究与选择的范围可以覆盖整体市场,因而可以建立更加分散化的投资组合。
  • 客观理性。这种基于计算机运算的数量化方法很大的一个优势是客观、公正而理性的去分析和筛选股票,并且不受外部分析师的影响,甚至不受公司投资者相关关系的影响。因此,完全的数量化分析过程将极大地减少投资者情绪的影响。
  • 收益与风险并重。数量化模型比主动型基金管理人更注重风险管理,这也是个人投资者逐渐选择数量化基金的原因之一。数量化模型采用系统化的投资策略,也就是说抛开个人的情绪,这也是吸引机构投资者的重要因素,而现在也吸引到了个人投资者。
  • 个股与组合并重。通过统计分析、多因素分析、敏感性分析等量化方法,数量化技术不仅可以在选股方面发挥独特的优势;同样的,在资产配置领域,通过统计分析、最优化技术等量化方法发挥巨大的优势。

从1971年巴克莱投资管理公司发行世界上第一只指数基金至今,定量投资在海外的发展已有30多年。1970年定量投资在海外全部投资中占比为零。而到2009年,定量投资在全部投资中占30%以上。其中指数类投资几乎全部使用定量技术,主动投资中大约有20%到30%使用定量技术。从2000年到2007年,美国定量投资总规模翻了4倍多,与此相比,美国共同基金总规模(定性与定量之和)只翻了1.5倍。在我国证券市场,过去20年基本面研究占据市场的主流地位,然而随着我国资本市场市值的迅速扩大、上市公司数量的急剧增加,以及QDII陆续出海,如何在众多的境内外上市公司中迅速、有效地选择投资目标,降低调研和投资的成本,更科学地分配规模庞大的资产,成为机构投资者面对的新问题。在此背景推动下,数量化投资目前在基金、保险资产、QFII、QDII等机构投资者中的应用大大增加,在基本面投资的基础上应用数量化策略正在成为投资经理共同关心的问题。

量化投资的基础是计量经济学,后者是统计学和经济学的交叉学科,它把各种数理统计方法应用于经济数据,以分析各个经济变量之间的关联关系,验证经济学所提出和构造的数理模型,并得到各种数值结果。

今天,市场上关于计量经济和数理统计的教材已非常多,这类教材主要是以数理统计的理论为基础,讲清其理论、方法与应用背景,但对于计算,讲的较少,基本是以手工计算为主,目的是为了帮助读者理解相应的统计方法,可操作性不强。

关于统计计算的书也不少。目前,统计计算的教材一般是讲算法(这一点与数值分析或计算方法差不多),而没有相应的软件做支撑,有些内容是数值分析内容的重复,统计味不足。

结合软件讲统计的书,目前最多的是结合SAS、SPSS或EViews,这些庞大而昂贵的软件都提供菜单式的人机界面以使操作“傻瓜化”,副作用则是在数值计算和输出方面给用户制造了一个新的“黑箱子”。这类书籍基本上相当于软件的使用说明书,虽然谈到一些统计概念,但讲的很少(更不用提数理统计和计量经济学在量化投资领域的具体应用)。

作为一款优秀的统计软件,“R”同时也是一种数学计算环境。它最初由奥克兰大学统计学系的Ross Ihaka和Robert Gentleman编写,自1997年R开始由一个核心团队开发,这个团队的成员大部分来自大学机构,除了这些作者之外,R还拥有一大批贡献者,他们为R编写代码、修正程序缺陷和撰写文档。迄今为止,R中的程序包已经是数以千计,各种统计前沿理论方法的相应计算机程序都会在短时间内以软件包的形式得以实现,这种速度是其它统计软件无法比拟的。除此之外,R还有一个重要的特点,那就是它是免费、开源的!

本书既不是单纯的关于数理统计或计量经济的教科书,也不只是一本关于R软件的使用手册,而是一本将两者相结合并着重讲述它们在数量投资领域具体应用的参考书。它既包含了相关的量化投资技术的理论、模型和思想,又利用R众多程序包中的内置函数,再结合适当编程,将抽象的金融模型通过R的数据处理和图形形式来加以解释、验证和求解,旨在使读者通过阅读本书,既熟悉当前量化投资技术的理论背景,又能够熟练使用R软件来处理量化投资过程中的定量计算与分析问题。既可作为数学、统计、金融、经济、信息等专业本科生及研究生的一本跨学科的参考教材,也可以作为金融机构和经济研究部门工作人员以及对投资原理感兴趣的读者的实用指南。

投资艺术正在向投资科学演变,这个演变正在悄然发生并将持续下去。演变的方向虽然明确,但节奏在不断变化。随着越来越多新一代科学型投资经理人的成长,他们将更多地依靠科学的分析、程序及结构化而不是凭借直觉、忠告和奇思怪想。当然,这并不意味着超凡的个人投资洞察力会过时,而是意味着投资经理们可以用更系统的方式获取和运用他们的天赋。

最后,相信本书对量化投资技术原理及其R实现方法的介绍将激起读者们对量化投资这一新兴领域的浓厚兴趣。

量化投资——以R为工具