2025湾芯展丨算力狂飙之后，中国AI芯片该如何突围？-文章-数字音视工程网DAV01.COM

　　过去两年，人工智能以惊人的速度席卷全球。从ChatGPT的横空出世，到Sora等多模态模型的突破，再到中国DeepSeek R1的开源，AI技术正以前所未有的节奏重塑产业格局。算力消耗不断攀升，模型迭代从“年”缩短到“周”，全球AI正进入一场以算力为核心的新竞赛。

　　然而，随着算力的“狂飙”进入高原期，新的问题正在显现——

　　训练成本高企、能耗压力骤增、产业落地受限。AI的竞争，正在从“谁拥有更多算力”，转向“谁能更高效地使用算力”。在此背景下，中国AI产业如何突围，成为摆在业界面前的关键课题。

　　在2025湾区半导体产业生态博览会(湾芯展)上，云天励飞副总裁罗忆发表主题演讲，系统阐述了他对AI时代格局演变、算力结构变革及国产芯片机遇的深度思考。

　　AI推理时代开启，中国迎来新拐点

　　罗忆指出，人工智能已成为推动人类进入第四次工业革命的核心力量。过去三次工业革命中，中国与欧美的差距不断拉大;但在AI时代，凭借数据规模、场景深度和工程化创新，中国正逐步实现“弯道超车”。

　　他认为，AI产业正在经历从“训练时代”到“推理时代”的关键转折。

　　2022年底ChatGPT的出现，让AGI的概念从实验室走入公众视野;而2025年DeepSeek R1模型的开源，则标志着中国在算法与工程优化上的突破，证明国内团队已能在半年内追赶国际前沿水平。

　　“算法的平权与开源，正在推动AI应用百花齐放。”罗忆表示，“2025年很可能成为AI Agent产业落地的元年。”

　　从“堆算力”到“算力效率”的竞争

　　过去几年，全球AI产业的算力消耗呈指数级增长。根据国家发改委数据，中国AI产业的日均Token推理量在今年年中突破30万亿，预计年底将翻倍。英伟达、华为等企业和机构给出更大胆的预测——到2030年全球每日Token消耗量将是今天的一万倍。

　　“算力需求的增长已进入失衡状态。”罗忆指出，“算力建设速度每年增长一倍，但算力消耗每年却在增长十倍。”

　　这意味着，AI产业必须从“规模竞赛”转向“效率竞赛”——用更少的算力支撑更多的推理任务。

　　在这一趋势下，他预测两个重要拐点曙光将现：

　　用于推理的算力将首次超过训练算力;

　　国产AI芯片的使用量将首次超过国外芯片。

　　国产芯片的战略机遇期正在到来

　　算力结构的重构，为中国国产AI芯片带来了前所未有的战略机遇。一方面，美国对高端GPU出口的限制持续收紧;另一方面，国家层面出台多项政策，明确提出要构建自主可控的AI基础设施体系。

　　“到2030年，中国AI算力规模的年复合增长率有望达到100%，国产替代趋势已经非常明确。”罗忆在演讲现场说道。

　　在AI推理时代，核心竞争力不在于“更大的模型”，而在于“更高的算力效率”。有机构预测，未来三到五年，AI推理成本将每年下降一个数量级——从当前百万Token约10元，降至2030年的1分钱。而要实现这一目标，必须在软硬件协同优化与算法芯片化创新上双向突破。

　　云天励飞自2014年成立以来，始终坚持“算法芯片化”路线，构建了从边缘到云端的AI推理产品体系。

　　目前公司已推出四代自研神经网络处理器，广泛应用于视频边缘网关、智能机器人、推理服务器等场景。下一代产品将正式迈向GPNPU架构——一种兼具GPU通用性与NPU高能效特性的全新计算范式，面向云端大模型推理。

　　通过自研“算力积木”架构，让芯片能够像搭积木一样灵活组合、按需扩展，将标准计算单元模块化封装，形成不同算力级别的芯片，覆盖 8T 至 256T 的算力区间，满足不同产品、应用场景对算力的需求。

　　迎接AI产业的“再平衡”

　　在演讲最后，罗忆总结道：“AI推理时代的到来，将重塑算力产业格局。真正的竞争，不再是算力规模的堆叠，而是谁能在能效、成本与应用落地之间找到新的平衡。”

　　他表示，云天励飞将持续深耕芯片底座，推动“从芯片到系统”的全栈创新，打造具备可扩展性与普惠性的算力生态。“算力不应是少数巨头的资源，而应成为推动社会智能化的公共底座——这就是我们理解的‘计算时代新质生产力’。”