谷歌新内存技术炸翻传统存储芯片市场大厂集体受挫

资讯
3月27日
编辑

领域圈

摘要： 美国东部时间3月26日，存储芯片股集体重挫，闪迪跌超11%，希捷跌逾8%，超威半导体、西部数据跌逾7%，美光科技跌近7%。业内人士分析，这一波动源自谷歌研究院即将在国际学习表征会议（ICLR 2026）上正式亮相的学术论文，该研究推出了一种新型AI内存压缩技术“TurboQuant”。谷歌宣称，...

美国东部时间3月26日，存储芯片股集体重挫，闪迪跌超11%，希捷跌逾8%，超威半导体、西部数据跌逾7%，美光科技跌近7%。

业内人士分析，这一波动源自谷歌研究院即将在国际学习表征会议（ICLR 2026）上正式亮相的学术论文，该研究推出了一种新型AI内存压缩技术“TurboQuant”。

谷歌宣称，该技术可将大语言模型推理中的缓存内存占用压缩至六分之一，并在英伟达H100 GPU上实现最高8倍的性能加速。

AI模型运行时存在一种“工作内存”，即KV缓存（Key-Value Cache）。每当模型处理信息、生成回答时，KV缓存便会迅速膨胀，且上下文窗口越长，缓存占用的内存越大。

TurboQuant本质上是一种极致的量化压缩算法，传统量化方法需要在压缩精度和额外存储开销之间妥协，而谷歌团队通过PolarQuant（极坐标量化）和QJL（量化JL变换）两项创新，实现了在“零损失”前提下将KV缓存压缩至3-bit精度。

Cloudflare首席执行官将这一成果称为谷歌的“DeepSeek时刻”，认为其有望像DeepSeek一样，通过极致效率大幅拉低AI的运行成本。

不过，摩根士丹利在最新研报中指出，市场对此存在误读。该技术仅作用于推理阶段的键值缓存，并不影响模型权重所占用的高带宽内存（HBM），也与AI训练任务无关。

分析师强调，所谓的“6倍压缩”并非存储总需求的减少，而是通过效率提升增加单GPU的吞吐量。这意味着在相同硬件条件下，可以支持4倍至8倍更长的上下文，或在不触发内存溢出的前提下显著提升批处理规模。

目前，谷歌尚未公布TurboQuant在Gemini等自研模型中的具体部署时间表，研究团队计划在下个月的ICLR 2026会议上正式发布相关成果。

声明：领域圈所有文章，如无特殊说明或标注，均来自于互联网或为领域圈用户原创发布。任何个人或组织，在未征得原作者同意时，禁止复制、盗用、采集、发布领域圈内容到任何网站、书籍等各类媒体平台。如若领域圈内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}}已认证

谷歌新内存技术炸翻传统存储芯片市场大厂集体受挫

都想错了！玩家硬刚《红色沙漠》清理采石场任务导致难度飙升

《红色沙漠》M站用户评分升至8.5 英语圈特别好评

烟雨江湖天山在哪？天山宝图位置大全[多图]

《人中之龙极３ / 人中之龙３外传 Dark Ties》付费DLC及合作企业介绍

光遇1.21大蜡烛在哪里光遇1月21日大蜡烛位置攻略2026

鸣潮穗波的名侦探成就完成方法鸣潮迷途的波仔位置大全

《生化危机9》数据挖掘出素材图：格蕾丝母女逛街照!

光与夜之恋日日夜夜复刻哪些物品光与夜之恋日日夜夜复刻物品详情介绍

关于我们

服务条款

隐私政策

版权申明

联系我们

关注我们

{{userData.name}}已认证

都想错了！ 玩家硬刚《红色沙漠》清理采石场任务导致难度飙升

《红色沙漠》M站用户评分升至8.5 英语圈特别好评

服务条款

隐私政策

版权申明

联系我们

都想错了！玩家硬刚《红色沙漠》清理采石场任务导致难度飙升