当前消息！清华大学郑纬民：未来应基于AI大模型开发行业垂直模型，赋能工农业、智慧城市等领域

(资料图片仅供参考)

21世纪经济报道记者郭美婷骆轶琪广州报道

从去年底OpenAI推出ChatGPT，到近日大厂集体抢滩内卷AI模型，这一轮人工智能热潮给产业界创造了无限遐想，并且在人才、教育、科技等领域也带来了一系列连锁反应。

近日，在香港科技大学（广州）举办的“交叉科技与数字经济论坛”上，中国工程院院士、清华大学计算机科学与技术系教授郑纬民接受了21世纪经济报道记者的采访。谈起近日以ChatGPT为代表的AI大模型掀起的热潮，郑纬民认为，ChatGPT在技术理论上并没有达到太大的突破，其成功之处在于做好了三件非常重要的事情。

“第一是数据的清洗，训练ChatGPT的数据来自于互联网，杂乱而繁多，其中有非常多无用甚至有害的信息，需要取其精华去其糟粕；第二是反馈学习，ChatGPT能够从人类反馈中强化学习，通过微调人类反馈来调整语言模型；第三是ChatGPT做成了一个系统工程，即达到了软硬件的协同。” 郑纬民特别强调了系统工程的重要性，一个好的系统工程能够让使用8000块GPU的大模型达到使用10000块GPU的效果，降本增效。

AI大模型的核心硬件是芯片。目前，国外厂商如英伟达等在芯片生产上有着更多的话语权，国内则因起步较晚，自研的芯片在性能上仍稍显不足。在郑纬民看来，性能上的差距可以在生态上得到弥补。“所谓好的生态就是让芯片用起来不费劲，建立这样的生态，并让市场接受，需要一个过程。”

ChatGPT最初的爆红，在于其能够流畅地与人对话，写诗、作画、列提纲等更不在话下，然而，郑纬民认为，未来以ChatGPT为代表的AI大模型所带来的贡献应不止于此。如何基于大模型，研发针对行业细分领域的垂直的模型，并在工业、农业、智慧城市的建设等领域利用AI大模型赋能更加重要。

ChatGPT的出现同样给教育界带来了巨大冲击。早在去年12月上旬，洛杉矶联合学区就暂停了对ChatGPT网站的访问；纽约市公立学校、巴黎政治学院等均有推进过禁制令。国内，香港大学几度反转，两月内对ChatGPT禁了又放，香港科技大学提出允许学生“有限度使用”ChatGPT。

郑纬民认为，教育培养的是学生思考问题的能力。“以鸡兔同笼数学题为例，它或许可以利用解方程方式直接算出答案来，但相当于计算的思维过程就没有了，这对于学生的培养并不那么有利。当然，在学生已经完全理解了问题的分析、解决过程和思维逻辑后，这时候可以解放双手，让ChatGPT帮忙解决一些简单的问题。”