发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

谷歌TurboQuant技术来袭:AI内存需求降6倍,存储巨头股价应声而跌

2026-03-26来源:快讯编辑:瑞雪

谷歌近日发布了一项名为TurboQuant的AI推理优化技术,引发了存储行业的震动。美光、SK海力士等存储巨头股价应声下跌,其中美光股价单日跌幅超过4%,闪迪股价一度暴跌6.5%,SK海力士在韩国股市开盘后也迅速下跌3%。这项技术之所以能产生如此大的影响,是因为它直接针对AI推理过程中的内存瓶颈问题提出了创新解决方案。

TurboQuant的核心突破在于开发了一种高效的内存压缩算法,专门针对AI推理阶段的"键值缓存"(KV Cache)进行优化。KV Cache是AI模型在对话过程中记录上下文信息的短期记忆系统,随着对话长度增加,其占用的内存也会呈指数级增长。谷歌官方测试显示,这项技术能够将KV Cache的内存需求降低至原来的六分之一,这意味着在相同硬件条件下,AI模型可以处理更长的对话或更复杂的任务。

该技术实现内存压缩的关键在于两个创新:首先是通过PolarQuant方法将原本32位的高精度数据无损压缩至3bit级别,其次利用QJL算法对压缩过程中产生的误差进行修正。这种"压缩-修正"的双重机制确保了AI模型在内存占用大幅减少的同时,不会出现性能下降或理解能力减弱的情况。对于依赖长上下文处理的Agent类AI产品(如OpenClaw等)而言,这项技术可能带来革命性的提升。

从产业影响来看,TurboQuant有望重塑AI应用的成本结构。内存和算力是当前AI推理服务的两大主要成本,内存需求的六倍缩减将使许多高成本AI服务变得更易普及。更关键的是,这项技术可能推动AI从云端向边缘设备迁移——智能手机、车载系统甚至物联网设备都有望运行更强大的AI模型,这将极大拓展AI技术的应用场景和使用灵活性。

不过这项技术仍面临现实挑战。目前TurboQuant仅在Gemma和Mistral等开源模型上完成部分测试,其在谷歌自家Gemini模型及其他商业模型上的效果尚未得到验证。该技术专注于推理阶段的内存优化,并未涉及模型训练成本的降低,也无法提升模型本身的理解能力。存储行业分析师指出,虽然短期股价波动反映了市场担忧,但长期来看,内存需求的结构性变化可能催生新的技术竞赛和市场机遇。

中科院团队突破新型薄膜光伏瓶颈 认证效率达16.6% 产业化进程提速
月 25 日消息,据央视今日报道,中国科学院物理研究所孟庆波团队在新型薄膜光伏铜锌锡硫硒电池研发上取得突破,将电池权威认证效率提升至16.6%,并完成了高性能柔性电池及组件的研制。 按照薄膜光伏发展的一般规…

2026-03-26

2026中关村论坛年会启幕 机器人与AI“翻译官”共绘科技新画卷
北京市科委、中关村管委会中关村新技术新产品促进处副处长董晓鑫向记者介绍说,“它们将‘组团上岗’,为论坛年会的嘉宾提供咨询引导、科技展示、互动交流等多元化服务。” 董晓鑫表示,今年的中关村论坛年会持续强化“科技…

2026-03-26

玄铁C950发布:国产RISC-V架构CPU登顶全球 赋能多领域国产化替代
阿里达摩院正式发布玄铁C950处理器,该处理器凭借超高性能登顶全球RISC-V架构CPU,单核性能突破70分,大幅刷新行业纪录,为国产芯片自主可控迈出关键一步,将全面赋能AI、自动驾驶、物联网等核心领域。 A…

2026-03-26

TK出海必看!新手如何筑牢“环境隔离”防线,让播放量不再挂零
但如果你是准备深耕的跨境团队,或者需要同时管理多个账号,传统的“一机一号”模式不仅硬件成本极高,日常切换网络和设备的繁琐度也极易引发人工失误,导致账号关联受限。 运营无论你使用的是实体机还是指纹浏览器沙盒,在…

2026-03-26

苹果今日推送AirPods新固件8B39,多款耳机迎来更新升级
苹果在今天(3 月 25 日)推送了 iOS 26.4 正式版系统更新,该版本已支持 AirPods Max 2 耳机(今日发售,四月初上市)。需要注意的是,AirPods 与 AirPods Pro 的固…

2026-03-26