[国金证券]计算机行业点评:AI进入新临界点

本周观点   Agent生态持续扩张。1)大模型公司Anthropic大幅上调未来数年的营收预测,预计今年销售额将增长四倍,达180亿美元,而明年将达550亿美元。其AI编码助手Claude Code去年11月的年化收入已超过10亿美元。2)1月27日月之暗面发布并开源K2.5模型,最大亮点在于Agent集群。K2.5能根据任务需求,现场调度多达100个分身,并行处理1500个步骤。3)AI助手Clawdbot近期爆火,不仅吸引大量开发者尝试,更引来腾讯云、阿里云等国内云厂商火速接入。Clawdbot能接管个人终端几乎所有任务。可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的聊天APP,通过WhatsApp、Telegram等平台发送指令。Clawdbot带来的“贾维斯”式的未来人机交互体验,为Agent形式打开了新的思路。   Agent驱动的强化学习(RL)时代,CPU可能比GPU更早成为瓶颈。与传统单任务RL不同,现代Agent系统需要同时运行成百上千个独立环境实例,"环境并行化"让CPU成为事实上的第一块短板。主要源于三大核心逻辑:1)Multi-Agent带来OS调度压力,Agent的“推理-执行-反思”循环机制需要操作系统层面频繁调度,且沙盒(Sandbox)的运行高度依赖CPU算力。2)为解决长上下文导致的GPU显存容量问题,业界采用KV CacheOffload技术将数据迁移至CPU内存,这不仅要求CPU具备大内存,还需其承担繁重的调度与传输任务。3)高并发工具调用:检索、编码、网页浏览等非模型推理任务上由CPU执行,在高并发场景下,多线程/多进程的处理需求推高了CPU的负载。   DeepSeek Engram架构或进一步推动以存代算。DeepSeek推出Engram架构,把大模型里的“计算”和“超大规模记忆”解耦,Transformer的算子全部在GPU/加速卡上计算,而1000亿参数的Engram表存储运行则在CPU内存中。此外Anthropic推出的Claude Cowork,通过知识库为Claude设计的一种全新永久记忆方式。我们认为,类Engram架构能有效突破GPU显存限制,从而推动以存代算需求和CPU配比提升。   Agent驱动存储需求持续增长。近期美国存储厂商陆续披露亮眼业绩。Agent的执行过程需要记忆以及上下文缓存,对存储带来了巨大需求。三星发布白皮书深入探讨了Agentic AI时代,利用SSD进行KV Cache Offloading,可以解决GPU显存瓶颈、提高推理性能并降低成本。在Agent环境中,多轮对话需反复处理相似提示词。若KV缓存仅存于GPU本地,会话迁移时需重新预填充,引入高延迟。通过将KV缓存卸载至SSD等共享存储,可实现跨节点快速恢复。   投资建议   相关标的:   海外算力/存储:中际旭创、新易盛、兆易创新、大普微、中微公司、天孚通信、源杰科技、胜宏科技、景旺电子、英维克等;闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。   国内算力:寒武纪、东阳光、海光信息、协创数据、华丰科技、星环科技、网宿科技、首都在线、神州数码、百度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、亿田智能、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。   CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。   风险提示   行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。