郑志明: 人工智能技术发展
及行业应用
4月22日,第31届中国国际广播电视信息网络展览会开幕式暨主题报告会在北京首钢国际会展中心成功举办。中国科学院院士、北京航空航天大学人工智能研究院院长郑志明,作题为《人工智能技术发展及行业应用》演讲。演讲内容全文如下:

数智化时代已经到来,人工智能技术正在重塑多个行业,行业大模型市场规模逐年增加,有望带来广电媒体行业新发展。但需要看到的是,传统大模型性能随着参数量、数据量、计算量的增加呈现幂律规律,导致计算资源和资金投入指数级增长,当前高门槛算力资源已经成为制约我国大模型快速发展的关键因素之一。
在此背景下,DeepSeek利用超高水平的工程路径,展现了我国大模型的研发实力。它通过计算压缩、数据压缩和并行计算等高效优化方法大幅降低训推成本,实现模型计算的参数脱敏,摆脱了模型性能对全参数的依赖,降低了我国大模型对美方特定硬件的依赖。
当前的人工智能技术凭借其强大的搜索与泛化能力,在有限组合优化领域获得显著的应用成果,例如制药、材料、生物等。但是新一代人工智能的发展重点是决策能力,多重线性统计方法累加而成的人工智能,本质是基于数据统计形成的算法。然而,统计只可以处理粗系统或者有限系统,无法处理颗粒度精细的动态物理世界。为了提高AI模型的决策能力,中国工程院今年推出了《人工智能品牌重大咨询项目(第六期)》,围绕着决策能力引领,直面大模型在垂直领域里面的关键问题。
第一是解决大模型垂域微调的灾难性遗忘问题。大模型缺乏统一的理论框架和可验证边界,在复杂场景和跨域领域应用的泛化能力明显不足。当大模型迁移到垂域应用时,往往出现原有知识和能力显著衰退的问题。这是因为大模型的设计和训练缺少理论支持,泛化边界不清晰,持续学习能力不足,影响了多任务协同性能。对此,需要采取结构稳定性理论支撑人工智能模型的实际部署与强泛化应用。
第二是解决大模型推理幻觉问题。大模型缺乏直观解释和严格验证,难以应用军事国防、国家广电等高精领域。大模型应该意识到知识是有边界的,当它跨越了边界就可能会产生所谓的幻觉。解决幻觉问题必须要建立跨尺度方法,通过局部变化影响全局的研究思路,实现垂直领域的可信推理。
因此,新一代行业大模型应当是内嵌数理机制的可解释高精度行业大模型。利用Science4AI技术构建精准可信的大模型,通过设计内嵌数学原理的新型算法框架提高模型决策的鲁棒性,通过强化模型决策验证机制确保系统在极端情况下也能作出准确可靠的决策。行业大模型需要突破偏离、边界、孤岛等关键科学问题,实现从稳态域到认知域到生态域的系统性跃迁。
为提升广电行业的智能化水平,广电领域在“十四五”期间的全面智能应用已经铺开,在“十五五”行业发展战略规划过程中,可以采取1+M+N发展布局,以精准智能为基础,发展M个共性AI技术,赋能N个广电行业应用场景,不断深化广电行业与人工智能的融合,重塑“内容+服务+体验”三位一体的智能传播新生态。