7月6日至8日,以“智联世界生成未来”为主题的第六届世界人工智能大会(简称WAIC)在上海举办。今年大会上,“大模型”成为大众关注的焦点。日前,网易伏羲工程机械产品负责人杨新伟接受上海证券报记者专访,他认为,相较于大众熟知的语言大模型,工业类大模型有望更快落地。同时他也表示,数据采集对工业大模型至关重要。
上海证券报:今年展会上我们看到一系列的大模型产品,但主要还是语言类的,工业类大模型大家了解不多,能否和我们介绍一下这两者的区别?
(资料图片)
杨新伟:工业大模型和传统的语言类大模型区别还是比较大的。最主要的区别是,语言类大模型主要集中在文本领域,核心能力在于一些语义识别、语义理解上。但工业大模型其实是面向工业场景,那在这个领域,我们做得更多的可能是比如液压控制模型、运动控制模型、视觉感知模型等,它是针对特定工业场景所做的一系列特定优化。
上海证券报:统称为大模型,他们有哪些共同点?
杨新伟:一方面是“大”,包括我们常说的参数,基本都是百亿、千亿级的,然后训练它消耗的资源也比较多。另一方面,通用推理性更强,具备生成能力。也就是说,他不再局限于特定场景,生成特定的回答,而是根据不同的场景给出不同的答案。
上海证券报:也就是我们常说的,大模型的答案不是预备好的,都是即时推理生成的,对吧?
杨新伟:是的。具体到工业大模型领域,比如说我们的机械设备都由液压装置操控,但液压状态其实每时每刻都是不同的,液压本身是有损耗的,这意味着液压模型是不断变化的。所以我们的大模型需要针对不同的场景,不断地去学习,甚至每一天它的这个液压模型都会随着当天的状态实时反馈,实时演化,它的模型是不断迭代的。
上海证券报:所以相对于语料是训练语言大模型的数据,机械参数就是训练工业大模型的数据?
杨新伟:可以这么理解。
上海证券报:我们都知道数据对于大模型训练至关重要,目前国内工业领域,相关数据充足吗?
杨新伟:坦白说,目前工业领域数据量还是相对缺乏的,因为它需要从真实机器上去采集。目前我们有几种方式去弥补,一种方式是在工地上去安装大量传感器,去收集更多的数据。另一方面则是基于我们伏羲数字孪生系统。我们在整个仿真环境里去生成挖掘机、装载机,然后把一些从真机上收集到的数据,在仿真环境下,让它们在不同场景任务下去训练学习,从而进一步收集数据。
上海证券报:以网易伏羲为例,目前国内工业领域大模型落地情况如何?
杨新伟:工业设备之间差异很大,不像我们语言大模型,不同语言之间存在“迁移”能力,工业大模型还是需要根据不同场景进行调整。目前我们是利用去年积累的一个在挖掘机领域上的大模型,使用了我们 AOP的面向智能体编程技术,用了4个月的时间,把已有大模型迁移到无人装载机上。需要说明的是,在完成前期工作后,真正适配阶段其实只用了 5天时间,就能把过去液压的数据、感知的数据、运动控制的数据完整地迁移到一台物理装载机上。目前,我们跟中建八局一起在沪通铁路的搅拌站上已经完成初步验收和应用。
(文章来源:上海证券报·中国证券网)