21世纪经济报道记者 陈植 上海报道


(相关资料图)

随着量化私募日益增多,这个赛道的竞争程度趋于激烈。

在近日举行的2023·量化科技嘉年华论坛期间,多位与会量化私募基金负责人感慨,量化私募市场正变得越来越“卷”。

“几乎每家量化私募基金都在不遗余力地提升超额收益,因为这关系到他们能否募集到更多资金,在激烈市场竞争过程立于不败之地。”一位百亿量化私募基金负责人向记者指出。

但要持续获得高超额收益,绝非易事。

这意味着量化私募基金一方面需要在数据、算力、算法等方面持续突破,推动量化策略迭代升级;另一方面则要积极融合AI与大模型技术,通过深度学习技术挖掘出更多能提升投资回报率的因子。

上海人工智能研究院有限公司总工程师王资凯直言,AIGC会令财经领域数据信息呈现爆发式、指数式的增长,由此对量化交易产生一系列新挑战,比如大语言模型的诞生,将对量化策略形成三大冲击,包括内部工程效率全面提升,交互水平和内容分发机制全面的变迁,金融内容生产能力的跃升。

中金财富信息技术部总经理谢碧松直言,就量化策略的技术支持需求而言,5年前行业在交易性能方面比拼激烈,2年前在交易执行效率方面竞争白热化,近期行业又围绕深层次数据分析开启新的“内卷”,但这也给量化策略“新基建”带来新的发展空间。

值得注意的是,越来越多量化私募基金则感慨当前量化策略的金融基础设施依然不够完善。

记者多方了解到,目前量化私募基金在量化策略建模过程,主要面临三大痛点:

一是量化策略开发越来越广泛地使用更高频数据,随着高频行情数据与高频因子的数据量日益增加,传统的技术框架无法满足量化行业对海量数据存储和分析计算的性能要求;

二是量化私募在投研阶段通常使用Python编程,但实盘交易环节则使用C++编程,导致同一套因子需要开发两套代码且保证结果一致,开发成本较高;

三是如何将数据库中存储的海量因子数据以最高效的方式传输给PyTorch等因子模型的训练工具。

多位量化私募人士向记者透露,他们现有的技术解决方案存在改善的空间,比如使用MySQL、PostGreSQL等通用数据库进行海量数据存储与清洗,但其存在磁盘内存占用率较大、查询性能较低、数据导入Python耗时过长等痛点;在策略研发与因子计算方面通常使用Python技术,也存在因子计算与策略回测耗时长等问题,导致策略研发效率相对低下。

这无形间催生出专门为量化策略提供底层金融基础设施服务的量化金融服务商。

DolphinDB联合创始人兼COO 初阳春接受本报记者专访时表示,他们一方面提供基于自研的高性能分布式时序数据库的实时计算系统,在量化私募提供海量数据高效查询与高性能复杂计算场景,提升他们的策略研发效率,另一方面则研发流批一体技术,令投研与实时交易共用同一套因子代码,减少量化私募的因子实施成本与耗时。

他直言,DolphinDB之所以进入这个赛道,主要原因是前些年他们看到欧美市场存在专门的量化金融服务商,为欧美投资机构量化策略、中高频交易提供数据存储清洗与因子挖掘等赋能,但在中国,这个产业刚刚起步。

记者获悉,随着近年越来越多量化金融服务商相继面世,这个赛道竞争同样趋于激烈。

“谁能最终脱颖而出,取决于他们能否满足量化私募基金的新业务需求。”上述百亿量化私募金负责人向记者指出。具体而言,一是随着量化私募策略迭代提速,他们需要更高效的策略与因子开发,由此带来更多类型更大量数据的需求,且数据清洗与因子计算的性能要求更高,二是目前几乎所有的量化私募都在使用AI深度学习技术,期待它能创造出更多有价值的投资因子与量化策略。

初阳春告诉记者,DolphinDB将一面与主流的AI深度学习框架进行更好地连接,方便量化私募基金更好运用AI深度学习技术,一面则对IB高速网络与GPU等新型硬件进行适配开发,进一步提升量化私募的数据存储清洗与因子计算等性能。

湘财证券总裁周乐峰表示,在经历高速发展期后,量化投资领域的同质化问题开始出现,超额回报也有所衰减,在这种情况下,整个行业需持续扩容人才队伍,加快策略迭代效率同时,将响应速度、日常业务整合优化也提上议事日程,这或许也是量化投资行业下一阶段制胜的关键。

海量数据存储清洗分析痛点待解

面对日益激烈的市场竞争,越来越多量化私募基金纷纷建立数据库、数据分析系统与实时流计算系统等基础设施,进一步提升策略研发效率与博取更多高超额回报机会。

但在实际操作环节,不少量化私募基金发现这项工作实践效果差强人意。

究其原因,一是他们通过SQL语言查询海量数据时,需先将数据传输到分析系统再进行计算,导致他们对海量数据进行计算分析时,逾90%时间都耗费在数据传输环节,令策略研发效率大打折扣,二是他们使用Python技术进行数据回测与因子计算(比如日频量化因子计算)时,耗时过长,直接影响量化策略的研发实施效率。

这背后,是众多通用性系统均非针对量化交易的使用场景与数据量处理而设计,导致量化私募基金在使用大规模金融数据,尤其是使用中高频交易数据时,这些通用性系统性能远远无法满足量化私募的需求。且大规模数据在各个系统之间的转移耗时时间太长,成为整个量化策略系统性能提升的一大瓶颈。

一位量化私募基金技术总监向记者透露,他们也尝试使用多种数据库技术解决方案,比如NewSQL,但他们的性能不能满足中高频数据处理的需求;此外他们还使用过采用行存+BTree索引架构的知名数据库,其优点是点击查询一行数据时相当高效,但缺点是它存在数据库磁盘空间占用过大等问题,读取大数据量时性能不佳。

“这需要量化金融基础设施服务商从写第一行代码起,就需要着手解决量化交易场景里的上述问题。” 初阳春向记者直言。量化交易的需求,不只是海量数据的存储查找,更注重高性能复杂计算,所以量化金融服务商需同时提供高性能数据库、多范式编程语言、丰富的因子库与流计算引擎,才能满足量化交易的全链路需求。

记者了解到,为了解决量化交易所面临的数据存储清洗分析痛点,库内计算、高性能分布式计算与并行计算、实时流式计算引擎、向量化计算等技术必不可少。

所谓库内计算,就是复杂的量化金融计算任务可在数据库内直接执行,避免海量数据从数据库转移到计算系统,节省数据分析耗时。这要求数据库系统提供功能完备的编程语言与大量计算函数。

实时流式计算引擎则专门针对金融实盘场景设计,很大程度简化量化私募基金的实盘策略开发工作,包括在亚毫秒级完成上百个因子的实时计算,将实盘策略上线时间从2-3月缩减至1-2周。

初阳春向记者透露,为了实现库内计算与实时流式计算引擎的高效率,他们提供逾1500个内置函数,覆盖量化交易在数据库、数据分析与实时计算的绝大部分需求,以便量化私募基金直接使用他们脚本语言在库内运算,最大程度节省数据分析计算耗时。

在他看来,这也有助于大幅缩短量化策略从研发到上线实施的时间。因为传统的量化策略开发流程,通常是投研人员先使用Python技术进行因子挖掘与量化策略研发,但为了满足高频量化策略的低延时交易要求,他们又会采取C++语言对量化策略投资逻辑进行重写,导致整个高频量化策略的开发周期很长,通常以月为单位,其中不少时效性强的量化策略尚未上线就已经失效。

“随着越来越多量化私募基金在策略研发上线方面拼速度拼效率,量化金融服务商也需要与时俱进,满足量化私募策略迭代效率提升的诸多新诉求。”初阳春强调说。

AI时代下的量化策略迭代新挑战

值得注意的是,随着AI在量化策略研发的应用日益广泛,越来越多量化私募基金将它视为新的核心竞争力。

一位百亿量化私募投研总监向记者指出,现在几乎所有的量化私募基金都在使用AI技术。以往,不少量化私募基金认为AI在数据收集端,能提升后台的数据处理分析效率,但现在,越来越多量化私募基金都将AI深度学习技术应用于因子挖掘,数据特征抽取、特征数据组合搭建等领域,甚至还有私募机构尝试在交易订单执行方面使用AI技术以提升交易效率。

“目前,不少量化私募基金担心在未来某个时刻,当AI在量化投资算法模型搭建与算力维度取得突破性进展后,整个量化私募市场的竞争将进入前所未有的激烈,除非量化私募基金在数据挖掘与因子挖掘等方面具有前瞻性的布局与深厚积累,才有可能凭借策略先发优势获取较高超额回报,但在交易端,AI技术能令任何量价套利高回报机会迅速被捕捉殆尽。”他指出。

初阳春直言,一直以来,因子挖掘是量化交易的基础,尤其随着量化私募市场竞争加剧,越来越多量化私募基金更需要AI技术开发大量有价值的因子,但他们调研发现,不少量化私募基金在通过AI深度学习技术挖掘出因子后,因子存储成为一大痛点,其中包括因子数据量过于庞大、因子库需动态变化、多因子需对齐输出等。因此DolphinDB一直在提供有效解决方案破解这些痛点。

记者多方了解到,随着ChatGPT技术日益普及,越来越多量化私募基金围绕这项新AI技术试水一系列全新的量化策略,比如根据ChatGPT所显示的散户对个股的看涨情绪数据,构建新的量化投资组合;再如将同一个量化策略试水不同的市场交易情绪(对ChatGPT所提供的不同市场交易情绪数据进行分析),测试其有效性与投资回报高低。但是,这都需要一系列高效的数据回测引擎工具,以便他们能快速研发新的量化交易策略。

初阳春告诉记者,这意味着在AI时代,量化私募基金需要更多能够自定义的回测引擎与优化工具。目前DolphinDB致力于向量化私募基金提供上述引擎工具,以便他们使用DolphinDB回测框架与语法,一方面可以模拟历史交易并评估上述量化交易策略与因子策略的业绩表现;另一方面通过回放高频数据,实现多表有序的行情仿真。

卡方科技联合创始人郑盛表示,随着AI大模型技术的兴起,量化交易将进入“新范式时代”。尤其是未来ChatGPT5.0、6.0、7.0的出现,将进一步助力量化交易市场的投资交易风控。未来的量化私募基金的“军备竞赛”,将进一步集中在数据、算力和算法领域,也令量化金融服务商需使用更多AI技术赋能整个行业发展。

博时基金基金经理桂征辉认为,在量化投资领域,智能化也会成为一个新趋势,尤其是数据要素和智能科技在前沿领域的广泛应用,将不断拓宽了量化投资的内涵。通过大数据、机器学习等技术的进步,量化投资将会不断地迭代和升级。

推荐内容