大数据(Big Data)给金融行业带来革命性的变化,同时我们可以预估在未来这种变化将对金融领域研究带来显著影响。基于此,Itay Goldstein, Chester S Spatt, Mao Ye三位学者着重探讨了大数据对金融领域基本问题前沿面发展的推动作用。文章于2021年发表在The Review of Financial Studies。
[ 想要获得此文章的PDF文档请在公众号后台回复关键词 “ 金融研究中的大数据 ”。 ]
首先,作者将“大数据”定义为具有大规模、高维度和复杂结构(large size, high dimension, and complex structure)三项特征的数据。
第一,大规模是在绝对意义和相对意义上都成立的,就相对意义而言,是相对于现有的最佳“小数据”而言。相较而言,大规模数据的优势体现在克服了小数据集中的样本选择偏误,或捕获了小数据集中没有描述的重要经济活动。
第二,高维度意味着相对于样本大小,数据集中具有的许多变量。为了解决高维度带来的挑战,一种常用的方法就是机器学习。机器学习作为大数据研究的一个重要标志,在金融领域的应用也在不断增加。
第三,复杂结构表明数据可能不仅仅是传统的行列格式。非结构化数据包括文本、
、视频、音频和语音。如果非结构化数据能够表征结构化数据无法捕获的经济活动,则非结构化数据是有应用价值的。对非结构化数据的特征提取和分析,就需要借助需要深度学习和计算机科学的帮助。总之,大数据除了规模大之外还包含了其他特征,这些特征使得大数据相较于小数据而言更具优势,因此大数据在金融领域的使用也日益广泛。
进而,作者基于六篇论文展开了具体分析和说明,文章涵盖了资产定价、公司金融和市场微观结构等主题,充分说明了大数据在金融研究中的覆盖之广:
Erel et al. (2021) 表明,在遴选新董事会成员中,机器学习优于人为选择,算法将会优先选择具有多样化特征的董事会成员。
Li et al. (2021) 利用机器学习对企业文化等相关问题展开研究,作者试图量化企业文化的概念,并了解其对企业的影响。
Easley et al. (2021) 指出机器学习有助于解决跨资产市场微观结构中的高维度挑战,大数据集一直是此类文献的规范。
Anand et al. (2021) 利用大数据分析了机构交易员与其经纪人之间的代理冲突问题。基于三重差异分析,作者发现TSP处理过的股票的执行质量提高了,因为TSP限制了经纪人将订单发送到ATS场所。
Benamar, Foucault, and Vega (2021)对金融市场交易背景下的非结构化数据大型数据集进行了处理。
Giglio, Liao, and Xiu (2021)则探讨了资产定价的问题。通过提出一种新的框架来严格执行线性资产定价模型中的多假设检验,从而说明机器学习是如何应用的,重点是解决数据窥探问题。
除此之外,文章还讨论了
一、大数据的反馈效应:“大数据”的出现降低了管理者从市场价格中学习的动机,因为公司现在拥有更多的信息来源,还是因为价格从投资者收集的“大数据”中收集了更多的信息而增加了激励?
二、大数据的异质性影响:大数据对不同类型代理的影响及其对社会的聚集效应将是一个值得研究的新方向。
三、大数据相关法规:关于大数据的另一项有希望的研究是关于隐私的规定以及算法和数据的公平性(例如卡恩斯和罗斯2020年)。
四、理论的重要性:在机器学习和人工智能时代,理论可能变得更加重要,原因很简单。人类的判断可能是不一致的,而机器则倾向于根据它们的模型做出一致的决定。
五、跨学科合作:未来有关金融大数据的研究可能会涉及到更多来自其他领域的学者。我们相信,这种合作将扩大金融和经济学研究的工具和范围,并帮助研究人员克服大数据挑战。
总之,大数据与金融领域的融合趋势日益凸显,相信这也是未来学者需要关注的一个重要话题!
Itay Goldstein, Chester S Spatt, Mao Ye, Big data in Finance, The Review of Financial Studies, Volume 34, Issue 7, July 2021, Pages 3213-3225.
转自:“社科学术汇”微信公众号
如有侵权,请联系本站删除!