刚刚过去的2022年,是人工智能(AI)产业焦点快速切换的一年。

红极一时的计算机视觉、智能语音等AI算法赛道回归冷静,数据智能新领域变得更加炙手可热。


(资料图片仅供参考)

随着2022年东数西算工程、“数据二十条”等政策推出,数据的生产力要素地位更加凸显,发展大数据产业成为数字经济发展的迫切要求。知名行研机构IDC预测,2026年中国大数据IT支出规模将达359.5亿美元(约合2438.13亿元人民币),复合增长率达21.4%。

知名国产大数据基础软件公司星环科技技术VP(高管)杨一帆告诉智东西,前几年AI企业落地以单一模态技术为主,比如以单纯的图象数据分析支持图像识别、身份认证等应用。近年随着技术市场和应用市场的逐渐成熟和深入,单模态、单模型难以应对实际落地过程中复杂场景的需求,为数据智能的进一步发展提供了动力。

作为人工智能三大要素之一,数据正为AI产业带来新的活力。杨一帆认为,面向新的2023年,多模态数据分析、可AI、开发运维一体化有望成为产业发展的三大新趋势。

一、打破数据孤岛,多模态数据分析兴起

进入十四五数字化转型时期,我们看到政企行业数据的丰富程度和增长速度都很可观,多模型、多模态数据成为AI产业发展的新特征。

随之而来的是严重的数据孤岛、知识壁垒,阻碍了AI落地进程。

以智慧零售场景为例,当某商场需要从消费商品评价研究特定人群的消费偏好时,他们至少需要使用人群“关系”、消费“记录”、商品“评价”等不同来源或形式的数据进行分析。按照传统方法,这些数据通常来自不同数据模型的数据库,而商场的分析团队需要适配多种数据库的连接、查询、开发、分析技术等,不仅流程复杂、效率低下会带来决策时效性差,而且数据不一致引起的决策误导也容易出现。

在这种背景下,一种基于统一架构的多模态数据分析工具应运而生。

面向多模态数据分析需求,星环科技多模型大数据基础平台TDH9.0(Transwarp Data Hub)提出统一架构通过统一接口、统一计算引擎、统一分布式存储管理系统、统一的资源调度,汇聚十种数据模型组合拳,打通了大数据业务全场景。

比如基于TDH9.0,前文提到的智慧零售数据分析难题将被解决,客户能一举实现跨三个表联合分析,同时无需额外数据导出或者转换,在准确分析的同时简化开发流程和用户操作。

值得一提的是,星环科技还通过知识图谱平台Sophon KG加持TDH9.0,增强多模态数据分析的认知智能化水平。

以金融行业为例,Sophon KG开发的图像和自然语言处理模块,支持从文本、图像、关联数据、表格数据等多种类型数据中,自动抽取和推理行业、公司及机构名、地址、人名、产品、时间等实体、关系和事件,从而通过多模态数据分析帮助相关机构智能化识别可疑交易、发现黑灰产团伙、画像贷款人违约风险、预测担保人风险等。

可以看到,多模态的数据分析已成为AI产业落地迫切需求。它有利于企业打破数据孤岛,进而从数据这一底层生产要素推动AI向认知智能进化,以此帮人们解决场景更复杂的问题。

二、提倡数据流通交易,可AI成刚需

随着AI落地进入深水区,AI还面临越来越多的可挑战。

比如AI模型可解释性的缺乏限制了AI独立应用,系统如何在使用数据的同时保护用户隐私,AI系统如何避免不稳定性带来的安全问题等,这些问题在近年来尤其凸显,《新一代人工智能治理原则》、《人工智能算法金融应用评价规范》《关于加强科技伦理治理的意见》等规范和标准相继发布。

进入2022年,东数西算、“数据二十条”、数据安全法及个人息保护法等政策制度的推出,全国多家数据交易所落成,让数据生产要素的地位凸显,数据交易和应用有望迎来规模化阶段。可AI技术,是促进数据智能产业规模化的前提和保障。

为实现“数据-AI模型-业务”全链路的可,星环科技提出了一种通用的可AI治理框架T-DACM。杨一帆对智东西解读道,这一领域具有“短板效应”,任意一个数据处理环节出问题都会导致最终模型不可。

为此,T-DACM框架覆盖了AI开发应用的全流程,从可数据(Trusted Data)、可算法(Trusted Algorithm)、可计算(Trusted Computation)、可管理(Trusted Management)四个层面,覆盖了数据安全、模型安全、隐私保护、风险控制、过程管理、可解释性、公平伦理、追溯追责等AI热点问题的解决方法。

杨一帆谈道,T-DACM框架能有效提升模型精度、解决模型黑盒问题。比如,在某银行授系统案例中,据称该方案助其模型精度提升至99.2%,失联用户率降低至0.4%,并通过引入模型可解释模块解决了客户评分差异无法解释等问题。

不过值得一提的是,从当前产业发展进程来看,AI模型的黑盒仍未完全解开。因此,可AI治理发展任重道远,需要产业继续完善可AI框架并在实际场景中迭代升级。

三、数据流水线成熟,AI开发运维一体化

开发运维一体化,是2022年AI行业发展的另一大趋势。

用数据科学赋能产业,说白了,就是通过数据特征提取、AI模型构建提供分析服务,来促进业务降本增效、提升体验。近年来,随着数据和模型种类变多,散落在企业多个部门的管理和运维成本也在变高,面临一系列挑战。

对此,杨一帆认为,面向数据科学全流水线的转型正成为一大新趋势,数字化转型的客户需要开发运维一体化。

面向AI落地,星环科技推出了企业级AI能力运营平台Sophon MLOps,围绕企业AI模型接入、运营管理、持续训练的全生命周期,分别提供规模化集成管理、高效模型推理、模型监控预警、模型性能评估、隐私安全保障等功能;同时,面向大数据开发,星环科技通过TDS(Transwarp Data Studio,星环大数据开发工具)提供DataOps能力;面向软件开发,星环科技通过TDC(Transwarp Data Cloud,星环数据云平台)提供DevOps和数据云服务能力。

杨一帆说,DevOps提供了一个开发集成的底座,DataOps提供了一个数据不停地集成开发的前提,MLOps进行AI数据分析方向的持续提升的使命。

通过将数据智能多个环节能力“连珠成链”,意味着产业流水线进一步走向成熟。可以预测,以星环科技为代表企业提出的全流程化的数据智能平台如果深入实践落地,有望促进产业生产力大大释放。

结语AI落地进入深水区,数据要素重要性凸显

数据智能成为AI落地深水区的一大新焦点,通过对话星环科技技术VP杨一帆,我们进一步透析了数据智能所面临的多模态数据分析、可AI、开发运维一体化几大发展趋势。

根据中国通院最新研究数据,2021年我国大数据产业规模达1.3万亿元。随着数字化转型和相关新政策推进,产业的大数据平台技术也加速落地和迭代,有望促进2023年数据智能产业呈现新突破局面。

推荐内容