文章      动态     相关文章     最新文章     手机版动态     相关动态     |   首页|会员中心|保存桌面|手机浏览

mdekt

http://fabua.ksxb.net/commdekt/

相关列表
文章列表
  • 暂无文章
推荐文章
联系方式
  • 联系人:程林
  • 电话:13197257215
  • 传真:0719-8025036
数字金融变革:人工智能在量化投资中的革命性应用|LONGCHINA VIEW 系列
发布时间:2024-12-29        浏览次数:19        返回列表


数字金融变革:人工智能在量化投资中的革命性应用|Lo<em></em>nGCHINA VIEW 系列

人工智能在量化投资领域的应用使得金融与人工智能深度融合,引发数字金融大变革,为量化投资带来新机遇和新挑战。本文回顾了量化投资行业的历史,从数据收集、特征提取、模型开发、组合优化和交易执行等主流量化投资工作方法及应用案例出发,分析人工智能影响量化投资的理论机制,并就相关问题与未来发展提出预测。






量化投资作为一种基于数学模型和算法的投资策略,在过去20年中已经成为全球投资界的一个热门话题。尤其在美国,量化投资不仅在资金规模上迅速增长,也在交易量和交易占比上超越了传统的主观投资方式,成为资本市场的重要组成部分。中国的量化投资从2009年后开始崭露头角。在量化投资的早期,主要是学者和研究者在尝试应用数学和统计学原理来分析股市。极具代表性的人物哈里•马科维茨(Harry Markowitz)在1952年提出了现代投资组合理论(Moder Portfolio Theory,简称MPT)。MPT阐述了风险和收益之间的关系,并提出了多样化投资组合以降低风险的概念。在这个时期,计算机技术还处于起步阶段,导致复杂模型的运算和大数据分析难以实现。


20世纪90年代以后,随着互联网的普及和计算能力的大幅提升,量化投资开始迅速扩张,量化投资者开始利用更强大的计算资源和复杂的算法,不仅依赖传统的金融数据,还利用非结构化数据,如社交媒体数据、新闻数据、网络搜索趋势数据等。量化对冲基金和量化交易策略在全球范围内获得了显著增长,成为金融市场的一个重要组成部分,算法交易和高频交易开始兴起。


进入21世纪,量化投资领域出现了许多创新技术,人工智能(AI)被更加深入地应用于投资策略的开发和执行,包括使用深度学习来分析复杂的市场数据,制定模型和算法,运用强化学习来优化交易执行。这一时期投资策略极具多样化,如利用复杂算法进行市场趋势预测,以及基于行为金融学的模型融合不同资产类别的跨市场策略。随着算力提升和数据处理技术的进步,量化投资能够实现更高程度的自动化、智能化,赋能量化投资行业高速发展。






在数据收集环节,通过自然语言处理(NaturalLanguage Processing,简称NLP)技术、大语言模型(Large Language Model,简称L.LM)对财经网站新闻、股吧论坛评论、券商分析师研报等海量文本信息进行分析,判断文本情感,在传统量价等结构化数据的基础上,扩展构建因子的数据范围。


在特征提取环节,通过AI算法转化传统人工挖掘因子的思考、分析和设计过程,将其变成复杂数学空间中的搜索优化过程,从而实现超大规模金融信号的自动挖掘与自动建模。在量化投资领域,新闻舆情等文本数据一直是因子挖掘的重要对象。最初,人们通过搜索特定关键词词频来构建文本因子,但该方法缺乏上下文关联,无法准确捕提某一词语在复杂语境中的准确含义。随着自然语言处理工具的发展,人们尝试通过分词、词语向量、情绪词典等工具对文本数据进行情感打分,区分正面情绪和负面情绪。随着算力的不断提升,人们逐渐开始使用更复杂的深度学习模型对大文本数据进行处理和训练,试图更准确地理解词与词之间的关联,捕捉更加微妙和深层次的语义和情感。


随着AI的迅猛发展,大语言模型(如ChatGPT)的出现对传统新闻舆情因子的挖掘提供了显著的帮助。ChatGPT这样的大模型能够进行更精细的文本分析,更好地理解语境、讽刺、双关等复杂语言特征。人们可以站在巨人的肩膀上,运用大模型对文本强大的理解力和分析能力,快速处理和分析大量新闻、报告、社交媒体内容等文本数据,进行情感标注,以任意的量化方式,提取人们想要的任何信息,同时大大减少手动处理和分析大量文本数据的时间。在因子挖掘和构建方面,大语言模型有时甚至能够为人们提供意想不到的思路和解决方案。


在模型开发环节,大数据+大模型在赋能主动权益投资方面有着巨大的发展空间,在量化交易模型的开发中,能够帮助使用者更快速便捷地搜索和检验投资逻辑、生成新的交易洞察,从而更好地理解市场和发现潜在的市场影响因素。通过对历史数据和市场趋势的深入学习,大语言模型能够生成有价值的洞察,这有助于发现新的交易策略或改进现有策略。例如BloombergGPT是彭博(Bloomberg)训练出来的金融大语言模型,模型参数量为500亿,使用了包含3630亿个词例(token)的金融领域数据集及3450亿个token的通用数据集,将协助彭博改进现有的金融NLP任务,进行情感分析、新闻分类和问答等,在通用任务与金融特定任务上都有较好的表现。大数据和大模型为挖掘超额收益提供了更多的数据和工具,是未来投资研究的重要趋势。在组合优化环节:随着计算能力的提升和算法的发展,组合优化能够解决更复杂、规模更大的问题。


特别是启发式(鲁棒优化、随机优化)和元启发式算法(如遗传算法、粒子群优化、模拟退火等)的使用,为解决非线性、非凸甚至动态优化问题提供了有效的手段。机器学习和深度学习在组合优化中的应用也越来越普遍。这些技术被用来预测市场走势、识别隐藏的风险因素或自动调整组合策略,使得优化过程更加智能。在量化投资领域,高频交易已成为热点。组合优化在这方面也发展了许多专门的策略和算法,以便在面对高频数据和快速变化的市场环境下,能够更快速地响应市场变化,实现实时或准实时的决策调整。


在交易执行环节:当投资者有大量证券资产需要交易时,他们大多选择拆单交易,即分批次执行操作。通过算法交易将一笔大额交易拆分成数十笔小额交易,从而避免一次性大额交易对市场价格造成冲击,这样投资者在降低交易成本的同时,其实际成交数量也得到了保障。市面上的主要算法交易类型是被动型算法,如成交量加权平均价格(Volume-WeightedAverage Price,简称VWAP)策略、时间加权平均价格(Time-Weighted Average Price,简称TWAP)策略、成交量比例策略;还有部分主动型算法,对短期波动方向进行预测,从而获得更好的执行价格。主动型算法需要预测资产价格短期波动方向,因此有预测能力的机器学习和深度学习模型大量运用在主动型交易算法中。得益于市场微观的高频数据量巨大,模型训练样本充足,机器学习和深度学习模型可以获得较好的训练效果,因而此类主动型算法相对被动型算法能更好地降低交易成本,但主动型算法在有买入机会时要求尽快成交,因此有交易容量的问题。






新一代的量化投资技术的发展趋势是将AI深度融合到量化投资全流程中。从数据收集和清洗、特征提取、模型构建、组合优化、交易执行、风险分析,实现每个流程的模块化、自动化,将使量化投研效率高速提升,降低人力成本和时间成本。伴随着自动化AI的不断发展,算法的自我选择、优化,模型自动构建迭代都将成为可能。


但人工智能在量化投资中的应用也有它的局限性,如模型缺乏可解释性、对数据质量的高度依赖等,提升模型的透明度对于投资决策、风险管理至关重要。可解释AI的发展有望解决这一问题,当可解释AI应用在量化投资过程中,能够使策略模型构建和推理过程透明化,使模型呈现部分可解释性,帮助理解为什么模型推荐某一特定的策略、模型适合何种市场风格,帮助投资者评估策略运行状态是否正常。数据驱动AI依赖大量的历史数据和实时数据,数据驱动AI能在市场的持续变化中学习,并通过数据量的增加和算法的改进不断提高性能。区别于数据驱动AI,知识驱动AI是数据驱动AI的重要补充,两者深度融合成一个更全面、更精准的投资分析工具。知识驱动AI从金融事件行为、另类数据等多源异构数据中提取不同种类的有效信息,通过节点和关系建立关联,利用知识图谱整合,形成丰富的知识库。


算力是驱动人工智能产业发展的关键要素,传统的中央处理器(Central Processing Unit,简称CPU)、图形处理器(Graphics Processing Unit,简称GPU)算力无法满足高效的计算需求,量子计算应运而生。尽管量子计算仍处于起步阶段,但量子计算和AI双强结合不再是科幻,融合后的量子AI是未来科技发展的重要方向。量子计算为AI提供更快、更强的算力,为AI的发展注入了新的生命力。同样,AI也可以为量子计算提供更智能的计算和优化方法,量子AI将为人类带来前所未有的变革。AI的发展,将显著推进量化投资领域的计算变革,但在发展中仍将面临诸多挑战:


算力集中与算力竞争。AI的高速发展已产生大量的算力需求。智能世界中,算力是基础设施,算力设施包括以高性能服务器为中枢的硬件和以先进算法程序为核心的软件。算力设施建设需要投入大量的财力和人力,当今数字时代的算力作为新型生产力不可避免地导致算力资源集中在头部厂商,国内外市场均呈现头部厂商占据绝对主导的垄断格局。


数据质量和安全。高质量的数据是决定量化投资策略优劣的先决条件。挖掘各类数据信息中的联动关系,寻找深层次的投资信号,成为量化行业中新的竞争优势。随着数字经济的发展催生了海量异构的另类数据,另类数据以丰富的形态存在,包括文本形式、多媒体形式等,具有体量大、种类多、流动快、价值高等特点。与此同时,AI生成技术的不断发展,如利用深度学习和虚拟现实创建逼真的虚假内容,正逐渐模糊真实与虚假的边界。如何判断海量数据的真实性,从而有效识别有价值的信息,已成为量化投资行业的一项重要任务。此外,另类数据行业发展还面临隐私、网络安全、数据安全等合规方面的问题,还须有效防范相关风险。






在数智化时代,大数据+大模型叠加促使AI赋能量化投资方面有着巨大的发展空间,量化投资处于继往开来的阶段,机遇和挑战并存。随着人工智能在量化投资中的深度应用,投资者使用更高效、更准确的AI投资决策工具能够在一定程度上降低人工决策带来的交易风险。随着AI在量化投资领域应用场景(包括数据分析与预测、自动化交易决策等环节)的不断扩展,AI驱动的量化投资在金融领域将发挥更大更广泛的作用。


人工智能在量化交易中的应用也面临着挑战,挑战之一包括系统层面的复杂性,整个系统从底层的算力系统,到数据体系、推理引擎及最后应用层面的每一个环节都会影响量化投资的最终结果。融合海量知识,并且对这些海量知识进行快速推理,这对系统背后的低延时性、高并发性、吞吐量、算法计算效率和系统稳定性要求非常高,也意味着较高的开发成本。


量化投资的发展,对AI软硬件的迭代升级要求越来越高。量化投资目前正处在人工智能应用的风口上,未来新机遇和新挑战并存。


吴超,清华五道口数字中国项目校友、「领投中国LONG CHINA」项目首期班同学,现任高盈证券董事长、高盈科技董事长、北京金融科技研究院创始理事、清华五道口金融EMBA香港同学会秘书长、北京大学香港校友会名誉会长、美国管理技术大学(UMT)中国校友会会长、江西财经大学应用经济学院(数字经济学院)客座教授。


来源|《丽泽数字金融技术专刊》

编辑|李其奇

责编|郭冉

终审|赵建伟











秉承“专兼融汇,知行合一,创新卓越”的办学特色,清华大学五道口金融学院从实际问题出发,深度挖掘市场需求,于2021年全球首发的「领投中国LONG CHINA」项目,聚焦新发展格局下的中国产业投资发展之路,填补了针对高级别战略投资人的教育项目空白,引发产业界和投资界的广泛关注。目前领投中国三期班已启动报名,与产业投资领军人物一起共同探索中国的产业投资发展之路,推动中国产业创新发展。


「领投中国 LONG CHINA」项目第三期目前正在火热招生中,欢迎致电项目组老师,进一步了解课程详情。