过去两年,人工智能以惊人的速度席卷全球。从ChatGPT的横空出世,到Sora等多模态模型的突破,再到中国DeepSeek R1的开源,AI技术正以前所未有的节奏重塑产业格局。算力消耗不断攀升,模型迭代从“年”缩短到“周”,全球AI正进入一场以算力为核心的新竞赛。
然而,随着算力的“狂飙”进入高原期,新的问题正在显现——
训练成本高企、能耗压力骤增、产业落地受限。AI的竞争,正在从“谁拥有更多算力”,转向“谁能更高效地使用算力”。在此背景下,中国AI产业如何突围,成为摆在业界面前的关键课题。
在2025湾区半导体产业生态博览会(湾芯展)上,云天励飞副总裁罗忆发表主题演讲,系统阐述了他对AI时代格局演变、算力结构变革及国产芯片机遇的深度思考。

AI推理时代开启,中国迎来新拐点
罗忆指出,人工智能已成为推动人类进入第四次工业革命的核心力量。过去三次工业革命中,中国与欧美的差距不断拉大;但在AI时代,凭借数据规模、场景深度和工程化创新,中国正逐步实现“弯道超车”。
他认为,AI产业正在经历从“训练时代”到“推理时代”的关键转折。
2022年底ChatGPT的出现,让AGI的概念从实验室走入公众视野;而2025年DeepSeek R1模型的开源,则标志着中国在算法与工程优化上的突破,证明国内团队已能在半年内追赶国际前沿水平。
“算法的平权与开源,正在推动AI应用百花齐放。”罗忆表示,“2025年很可能成为AI Agent产业落地的元年。”
从“堆算力”到“算力效率”的竞争
过去几年,全球AI产业的算力消耗呈指数级增长。根据国家发改委数据,中国AI产业的日均Token推理量在今年年中突破30万亿,预计年底将翻倍。英伟达、华为等企业和机构给出更大胆的预测——到2030年全球每日Token消耗量将是今天的一万倍。
“算力需求的增长已进入失衡状态。”罗忆指出,“算力建设速度每年增长一倍,但算力消耗每年却在增长十倍。”
这意味着,AI产业必须从“规模竞赛”转向“效率竞赛”——用更少的算力支撑更多的推理任务。
在这一趋势下,他预测两个重要拐点曙光将现:
用于推理的算力将首次超过训练算力;
国产AI芯片的使用量将首次超过国外芯片。
国产芯片的战略机遇期正在到来
算力结构的重构,为中国国产AI芯片带来了前所未有的战略机遇。一方面,美国对高端GPU出口的限制持续收紧;另一方面,国家层面出台多项政策,明确提出要构建自主可控的AI基础设施体系。
“到2030年,中国AI算力规模的年复合增长率有望达到100%,国产替代趋势已经非常明确。”罗忆在演讲现场说道。
在AI推理时代,核心竞争力不在于“更大的模型”,而在于“更高的算力效率”。有机构预测,未来三到五年,AI推理成本将每年下降一个数量级——从当前百万Token约10元,降至2030年的1分钱。而要实现这一目标,必须在软硬件协同优化与算法芯片化创新上双向突破。
云天励飞自2014年成立以来,始终坚持“算法芯片化”路线,构建了从边缘到云端的AI推理产品体系。
目前公司已推出四代自研神经网络处理器,广泛应用于视频边缘网关、智能机器人、推理服务器等场景。下一代产品将正式迈向GPNPU架构——一种兼具GPU通用性与NPU高能效特性的全新计算范式,面向云端大模型推理。
通过自研“算力积木”架构,让芯片能够像搭积木一样灵活组合、按需扩展,将标准计算单元模块化封装,形成不同算力级别的芯片,覆盖 8T 至 256T 的算力区间,满足不同产品、应用场景对算力的需求。
迎接AI产业的“再平衡”
在演讲最后,罗忆总结道:“AI推理时代的到来,将重塑算力产业格局。真正的竞争,不再是算力规模的堆叠,而是谁能在能效、成本与应用落地之间找到新的平衡。”
他表示,云天励飞将持续深耕芯片底座,推动“从芯片到系统”的全栈创新,打造具备可扩展性与普惠性的算力生态。“算力不应是少数巨头的资源,而应成为推动社会智能化的公共底座——这就是我们理解的‘计算时代新质生产力’。”






首页