随着生成式人工智能向边缘侧的加速渗透,全球算力基础设施正经历从“云端独大”向“云-边-端协同”的结构性跃迁。端侧AI设备的爆发不仅重塑了消费电子的生态,更对底层计算架构提出了极高要求。
一、 行业概述与市场规模:万亿级端侧AI蓝海全面开启
端侧AI(Edge AI)是指在智能手机、PC、IoT终端及机器人等本地设备上直接运行人工智能大模型推理的技术范式。相比于云端,端侧计算在数据隐私保护、极低时延、可靠性及运营成本控制方面具备不可替代的优势。
伴随AI功能从旗舰机型向中端机型的加速下沉,端侧AI硬件迎来了新一轮的换机红利与产业爆发期。
出货量与渗透率激增:据Counterpoint Research与IDC数据显示,2025年全球智能手机的AI渗透率预计将达到33%,至2027年将进一步攀升至43%,对应出货量将超过5.5亿台。
市场规模预测:在AI推理需求快速增长的驱动下,全球端侧AI市场规模预计将从2025年的3,219亿元人民币,激增至2029年的1.2万亿元人民币,年复合增长率(CAGR)高达39.6%。其中,中国AI推理芯片市场规模预计将从2025年的3,106亿元增长至2029年的1.38万亿元,复合增速约为45%。专为推理设计的NPU芯片占比将进一步提升。
二、 竞争格局与国际龙头:算力角逐与生态卡位的双线战役
在端侧算力市场,底层芯片厂商已经开启了新的角力场,国际巨头加快了架构迭代步伐并释放出巨大的产业声量。目前,智能手机与PC端侧AI芯片主要呈现寡头竞争的格局:
高通(Qualcomm):持续主导端侧AI话语权。其推出的第三代骁龙8及骁龙8s移动平台主打端侧人工智能,已支持运行130亿参数的多模态大语言模型(如Llama 2、智谱ChatGLM等)。同时,高通积极布局前沿技术,其在研的云端推理产品(如A1250)开始探索新型3D近存计算架构,以期实现带宽与能效的跨越式提升。
联发科(MediaTek):通过“硬算力+软生态”向高端市场猛攻。在硬件层面,其天玑9300+旗舰芯片采用全大核CPU架构,并率先在端侧支持AI推测解码加速技术。生态层面,联发科全面启动“AI先锋计划”,与头部大模型企业深度绑定,加速构建端侧AI的开发者生态。
本土企业的“异构”突围:在国际大厂环伺的背景下,国内芯片设计企业正通过多核异构架构、存算一体等底层创新,在细分赛道实现破局。如炬芯科技、微纳核芯等本土企业,凭借自主研发的低功耗架构和极高的性价比,正逐步抢占音频AI、IoT及中阶边缘设备的市场份额。
三、 架构演进:存算一体(CIM)打破“存储墙”与“功耗墙”瓶颈
尽管SoC巨头不断通过堆叠NPU面积来提升算力,但大模型推理在端侧仍面临严格的“高性能、低功耗、低成本”的不可能三角。在传统冯·诺依曼架构下,计算与存储物理分离,99%的运行功耗消耗在参数与KV缓存的频繁搬运上。
为了打破这一物理桎梏,存算一体(Compute-in-Memory, CIM)技术被产业界公认为下一代计算架构的核心解药:
底层重构:存算一体技术将计算单元直接嵌入存储阵列中,大幅缩减了数据搬运距离。预计到2030年,涵盖存算一体的中国数字经济融合计算市场规模有望突破万亿元。
3D-CIM融合创新:学术界与产业界正加速推进“3D近存+存内计算(CIM)”的异构融合。通过3D混合键合技术,将大容量DRAM与存内计算芯片垂直堆叠,可在提升1-2个数量级带宽的同时,将计算能效提升10倍以上。在22nm等成熟工艺下,该架构的等效算力密度已能媲美传统架构7nm水平,从而有效保障了供应链安全并大幅降低了晶圆制造成本。
四、 核心落地场景:存算一体(CIM)的多维商业化进程
端侧计算的终极价值在于将充沛的算力推向数据产生的源头。存算一体(CIM)凭借其打破冯·诺依曼架构物理瓶颈的特性,正从底层重构三大核心落地场景:AI Agent、高阶AI电子产品(消费电子/IoT)以及移动通信网络中的边缘计算基础设施。
1. AI Agent:下一代人机交互的硬件基石端侧算力的终极演进形态正从“工具执行器”向具备自主规划与多模态交互能力的“AI Agent”升级。
硬件性能的极致诉求:AI Agent 需要长期后台运行(Always-on)、持续感知环境变化,并进行瞬时的多模态响应。这对端侧芯片提出了“毫瓦级待机功耗”与“百瓦级瞬时算力”的极端要求。
CIM的商业化契合度:存内计算架构为功耗敏感型智能体应用构建了坚实的技术壁垒。在应对复杂大模型时,存算一体芯片通过将存储和计算紧密结合,大幅减少了数据在芯片内部的无效搬运,从而在有限的功耗预算下确保了持续的高性能输出。随着端侧推理应用和 AI Agent 的规模化普及,存内计算带来的断代级能效优势正成为芯片设计企业占据市场份额的核心护城河。
2. AI 终端:普惠算力驱动终端裂变AI电子产品正面临品类与形态的全面重塑,从智能手机、AI PC到智能穿戴、全屋智能等 IoT 终端,算力需求正呈现高度碎片化的特征。
突破物理与成本限制:移动消费电子设备内部空间极其受限且对发热容忍度极低,同时又具有极高的成本敏感性。存算一体架构能够显著降低系统功耗和延迟,相较于传统GPU,其能效比拥有显著提升,为端侧设备提供了更具性价比的节能解决方案。
规模化落地进展:目前,国内企业(如炬芯科技等)已在音频处理、健康监测及低功耗视觉等 IoT 应用场景中,通过存内计算架构实现了商业落地。中国庞大的消费电子终端市场体量,正帮助底层CIM芯片企业快速消化前期的研发成本,形成良性循环的产业生态,加速智能终端的底层革命。
3. 移动通信与边缘计算:重塑算力网络的端到端闭环随着5G-A及6G网络的演进,移动通信网络正从单纯的“数据传输管道”向“通信与计算深度融合的算网基础设施”转型。在政策和市场的双重驱动下,边缘计算正加速向电信网络边缘、设备边缘等深水区发展。
边缘大模型部署的困境与破局:在边缘侧(如基站边缘服务器或移动网关)部署大模型,长期面临着设备计算资源有限、功耗受限以及对实时延迟极度敏感的三重技术挑战。
CIM赋能算力网络:在业内前沿的落地实践中(如2024年世界移动通信大会 MWC),基于存算一体架构的创新芯片已成功支持参数规模超70亿(7B)的大语言模型在边端侧实现实时的端到端运行。通过深度优化算子实现与数据流调度,配合多核与多硬件线程设计,这类存算一体芯片能够在边端侧实现每秒15-20 tokens的高速推理,同时功耗可降低数倍。这标志着存算一体技术已具备为中国移动等大型电信运营商的算力网络提供多样性、高性价比AI算力支撑的成熟度。
Gemini
数据来源:
[1] 中国信息通信研究院 (CAICT). (2025). 《先进计算暨算力发展指数蓝皮书(2025年)》.
[2] 弗若斯特沙利文 (Frost & Sullivan). (2026). 《全球端侧AI硬件市场预测与趋势分析报告》.
[3] Omdia. (2024). Generative AI Software and Edge AI Market Forecast 2024-2029.
[4] Counterpoint Research. (2026). Global GenAI Smartphone Shipments and Penetration Forecast.
[5] 国际数据公司 (IDC). (2025). 《中国传统与新型AI终端出货量及市场演进分析报告》.
[6] 资策会产业情报研究所 (MIC). (2025). 《全球AI PC出货量及渗透率预测分析》.
[7] 量子位智库. (2024). 《存算一体产业发展报告及市场规模测算》.
[8] 亿欧智库. (2024). 《2026全球存储技术革命与国产突围报告》.
[9] 世界移动通信大会 (MWC). (2024-2026). 边缘计算与存算一体商业化部署相关公开披露产业数据.
免责声明:本报告由艾耐博资本基于公开信息及独立研究分析编制,旨在为投资者提供行业趋势、市场动态及企业价值的参考依据。艾耐博资本不对第三方数据的信息准确性、完整性及及时性作出明示或默示的保证,报告内容不构成任何投资建议。
艾耐博资本是一家专注于科技创新领域的融资财务顾问机构,长期服务于硬科技赛道的优质企业。目前在端侧AI算力赛道拥有涵盖多维应用场景的优质项目储备。如需进一步探讨产业趋势、获取深度标的解析或发掘潜在的投资与业务合作机遇,欢迎随时与艾耐博资本团队取得联系。