在波士顿绿树成荫的飞地中,迈克·陈(Mike Chen)和他的团队教过机器来阅读普通话。 他们知道中国投资者经常使用同音异义词,即具有相同拼写但含义不同的单词对,在公共论坛上欺骗状态传感器。 通过破解此代码,这些机器可以找出投资者对中国领先企业的真正看法。
这只是PanAgora资产管理公司可持续投资总监Chen所开发的几个语言学项目之一,它使用机器学习算法开发,该算法可以从接收到的数据中识别模式并从自己的结果中学习。 当公司发布更新时,这些算法使PanAgora能够分析其利益相关者和公众的反应。
整个投资界也取得了类似的进步。 投资者正在使用机器学习来挖掘各种信息,从收益披露的细节到LinkedIn帖子的内容。 利用这些所谓的情感数据,他们可以筛选有关环境,社会与治理(ESG)问题的炒作,并准确了解公司的资历。
“通过了解人们对这些公司的评价,我们可以真实地了解他们所感知的品牌价值,” Chen说。 “不仅如此,当我们谈论经理们的企业ESG政策时,我们也许能够发现他们是否在“洗刷”。”
在整个投资界中,研究人员和工程师正在以同样破坏性的方式使用机器学习。 他们正在使用情感数据分析内容中的语言信息,包括将收入披露到LinkedIn职位,使用情感数据来查看公司是否真正致力于ESG,以及该承诺对其利益相关者有什么样的影响。
这种智能的价值是巨大的。 现在,专业管理下的所有资产中约有三分之一符合ESG标准。 2020年第二季度,当世界正受到冠状病毒危机的打击时,投资者向绿色股票中注入了超过700亿美元。 随着诸如气候变化和社会正义之类的问题日益受到关注,美国总统乔·拜登的先进政权取代了对ESG持怀疑态度的特朗普政府,这种知名度似乎还将进一步提高。
然而,对于批评者来说,用于评估ESG凭证的方法并未跟上需求的步伐。 迄今为止,ESG评级领域一直由MSCI,FTSE Russell和Sustainalytics等少数供应商主导。 每个提供商都有自己的一套严格的指标,但是对于构成“良好ESG”的标准没有统一的标准,他们的方法论和评级也明显不同。
一些提供商对公司进行绝对评分,因此每个人的评判标准都相同,而其他提供商的评分相对较高,这可以奖励进步程度较低行业中表现最差的公司。 去年夏天,快时尚零售商Boohoo在几周前就收到MSCI的AA评级,据报道该公司的某些工人的工资据称低于最低工资,因此该方法存在缺陷。
这些提供商所依赖的数据也受到公司定期披露的严重影响。 这些数据不仅易于产生偏见,因为公司忽略了不利于其发展的因素,因此它也向后看。 如果一家公司在11个月前聘用了新的女性董事会成员,那么谁能知道这是否现在影响市场?
使ESG数据更易于访问
随着这些弱点变得越来越明显,机器学习也变得更加民主。 便宜的现成算法的出现,再加上计算能力的提高,意味着投资基金和为独立财务顾问服务的分析师可以创建自己的机器学习模型来处理海量数据(包括金融和非金融数据) , 实时。
这些模型的关键是自然语言处理(NLP),这是机器学习的子集,它使机器能够理解人类的语言模式。 使用NLP,研究人员可以超越传统的市场报告来分析书面和口头交流,从而了解ESG承诺的表达方式和接受方式。
分析师大多使用NLP来分析公司本身使用的语言; 他们的声明是具体的还是模糊的,是使用第一人称还是第三者避难。
通过将机器学习应用于新闻,投资经理可以有效地强调公司为促进积极影响而采取的确切ESG行动
例如,伦敦汇丰银行全球研究部的团队使用语言分析来筛选公司的收益电话。 数据科学和分析负责人马克·麦克唐纳(Mark McDonald)表示:“我们的主要重点领域是演讲者如何处理分析师的即兴问题,因为答案通常比起初的预先准备好得多。 这样可以提供更真实的情况,您可以汇总各个市场和地区的情绪。”
其他公司正在关注外部各方如何对这些声明做出反应。 他们梳理成千上万的新闻故事以获得即时反应,并经常将其与社交媒体上的评论相结合。
在多伦多的Act Analytics中,研究人员训练了一种机器学习算法,以搜寻来自News API的精心挑选的来源清单,该清单包含约30,000个实时网点。
Act Analytics的ESG负责人Elgin Chau表示:“从本质上讲,实时新闻旨在引起某种反应,无论是正面还是负面的,因为这是很卖力的。” “需要确定的是事件的严重程度及其对资产价格的影响程度。 通过将我们的算法应用于多个新闻来源,我们可以计算特定公司特定事件的综合情感评分。
“ ESG投资组合的大部分业绩取决于猜测或轶事。 有时,您会得到一些荒谬的报告,说您的投资组合已使200辆汽车驶离道路或种植了1000棵树。 这些本质上是声音,无法真正准确地衡量,并且依赖于评级提供商对公司公司披露的主观解释。 换句话说,这些类型的报告不能代表投资组合的实际ESG绩效。
“通过将机器学习应用于新闻,投资经理可以有效地强调公司为促进积极影响而采取的确切ESG行动。”
机器学习如何补充数据
数据提供商不必为此担心。 机器学习的拥护者一致认为,它不会取代传统的数据源,而算法将更有效地分析这些数据源并将数据置于上下文中。 正如Chen所指出的那样,投资者现在不仅可以衡量一家公司发布的数字,还可以衡量其可持续性计划的“可信度”。
随着消费者和选股者将越来越多的钱投入到符合道德的公司中,因此洗绿色的可能性将会增加。 就在本月,英国竞争与市场管理局的研究发现,十分之四的公司网站在其网站上提供误导性的环境信息。
通过机器学习,投资者现在可以找到这些主张背后的真相。 从字面上看,他们可以在两行之间阅读。