原文信息:
Garcia, D., Hu, X., & Rohrer, M. (2023). The colour of finance words. Journal of Financial Economics, 147(3), 525-549.
01
背景
情感分析在金融和会计中得到了广泛的应用,但是以往的研究往往是基于已有的语言学分析对情感进行分析。本文挑战了金融研究(The Journal of Finance)2011年Loughran and Mcdonald(以下简称LM)经典论文,创新使用机器学习(Machine Learning,下面简称ML)的方式给金融词汇进行情感分析,从而形成新的词典。结果显示,机器学习和人工分类相比,能更好的预测盈余公告发布前后的股票收益。
数据
02
作者使用了三种数据,财报电话会议(earnings calls),年报(10-K statement)和华尔街日报(WSJ articles)。这三种数据有很大的区别,但是也紧密联系。例如内容,字数等等,具体的区别如表1所示。
表1 不同数据的差别
方法:作者使用机器学习中标准的方法:多项逆回归(multinomial inverse regression model)来建立字典。作者不仅局限对单词进行情感分析,还拓展为两词短语,三词短语。基准回归方程如下:
其中
公司j在财报电话会议、年报和华尔街日报发布前一天(t-1)到发布后第二天(t-2)四天的净收益。
代表情绪的不同测量方式,
为控制变量。
03
结果
由表2可以看出,当使用财报电话会议作为情感分析文本时,ML对盈余报告前后的收益有更强的预测能力,同时运用其他两种不同数据也能得到相似的结果。
表2 基准回归结果
检验
04
虽然机器学习方法有更加显著的结果,但是算法结果往往是一个“黑箱”,因此作者对为什么机器学习方法表现更好进行了多种方式的检验。(因为部分内容涉及机器学习且难度较高,在本文中略过,有兴趣的同事可以自行查阅)
作者将传统LM方法和ML方法的词典进行了比较,如表3所示。表3展示了LM方法中最频繁出现的被认为是正向和负向的30个词语。其中蓝色标记的是ML方法也认为是正向的词语,而红色标记的是ML方法认为负向的词语,其中有几个点非常有趣:
1. 两种方法在大多数improve相关的词语上判断一致,例如“improvement, improved and improving”都被判断为正向情感,但是唯独没有Improve本身
2. Confident被ML判断为负向情感
3. recall, against and volatility 都不被ML判断为带有负向情感的词汇
表3 人工词汇中机器学习情感分类
通过表4,当我们看ML出现最频繁的正向/负向词语时,有一些更有趣的现象:
1. ML认为think是一个积极的词语
2. ML认为一些积极的词语在人类看来并不能完全确定,例如:growth, up, well, over, really, continue(d), increase(d), lot, great, across
3. ML认为一些金融术语是是积极的词语,例如:share, cash, operating, margin, income, flow
表4 机器学习高频词汇中人工词汇的表现
为什么机器学习会选择这些词语?作者又进行了进一步的分析,首先,相较于LM,机器学习方法能有效识别虚假的中性词,使结果更加集中于三角的三个角落。(如图1所示)
图1 ML和LM对词语情感的分析
其次,作者发现,ML通过对双词语境的词语有更为准确的判断,从而达到更加准确预测收益的效果。例如之前提到的improve并没有被认为是积极的词语,很大程度上是因为这个词用在不同的语境中表达了不同的情感。如表5所示,ML认为continue improve这个词组中只有continue是正向的,而“improve performance”会被认为是负向的。Confident同理,在更加自信的语境下ML认为是正向的,但是在保持自信的语境下ML会认为是负向的。这也部分解释了为什么机器学习方法能比人工更好预测收益,因为ML可以通过对更长的单位进行分析,从而得到更为准确的信息。
表5 两词词组分析
推文作者简介
作者简介:张昱辰,复旦大学国务学院研一在读。研究兴趣:资产定价。交流邮箱:rickyzhang_hnu@163.com
Abstract
Our paper relies on stock price reactions to colour words, in order to provide new dictionaries of positive and negative words in a finance context. We extend the machine learning algorithm of Taddy (2013), adding a cross-validation layer to avoid over-fitting. In head-to-head comparisons, our dictionaries outperform the standard bag-of-words approach (Loughran and McDonald, 2011) when predicting stock price movements out-ofsample. By comparing their composition, word-by-word, our method refines and expands the sentiment dictionaries in the literature. The breadth of our dictionaries and their ability to disambiguate words using bigrams both help to colour finance discourse better.
转自:“香樟经济学术圈”微信公众号
如有侵权,请联系本站删除!