AI記憶體需求少六倍!Google新技術嚇壞市場,相關股票同步下殺

CryptoCity

Google 推出 TurboQuant,壓縮模型記憶體占用 6 倍、推理提速 8 倍,引發記憶體股下跌與需求結構轉向討論。

Google 推出 TurboQuant 演算法,將大型語言模型的記憶體占用壓縮至少 6 倍,同時在不犧牲模型準確率的前提下,將推理運算速度提升最高達 8 倍 。市場迅速將這項技術解讀為「需求側破壞」,背後邏輯相當直接:若 AI 模型在推理階段對記憶體的需求被壓縮數倍,意味著未來資料中心對 DRAM、HBM 甚至 NAND 儲存的需求成長曲線,可能出現結構性下修。

在消息釋出後,記憶體與儲存相關個股出現同步下跌,包括 SanDisk(SNDK)下跌 3.5%、Micron Technology(MU)下跌 3.4%、Western Digital(WDC)下跌 1.63%;亞洲供應鏈方面,Samsung Electronics 下跌 4.71%,SK Hynix 跌幅更達 6.23%。也有觀點認為,TurboQuant 更可能改變的是「資源使用效率」,而非單純削弱需求。

Google 最新演算法:記憶體用量少六倍、推理速度快八倍

根據 Google 研究團隊說明,TurboQuant 是一套針對大型語言模型與向量搜尋系統設計的量化(quantization)演算法,核心在於大幅壓縮 AI 模型中最吃資源的「key-value cache」與高維向量資料結構。在測試中,該技術可將記憶體占用壓縮至少 6 倍,同時在不犧牲模型準確率的前提下,將推理運算速度提升最高達 8 倍 。

這項突破直接命中當前 AI 基礎設施的關鍵瓶頸。生成式 AI 在算力層的擴展,高度依賴 HBM 等高頻寬記憶體,以承載模型權重與大規模 KV cache,避免推理過程記憶體卡死。然而 TurboQuant 透過結合 PolarQuant 與 Quantized Johnson-Lindenstrauss(QJL)等方法,在幾乎「零額外記憶體開銷」下完成壓縮,等同於用更少硬體資源完成同樣甚至更高效的運算。

Googlie 演算法衝擊記憶體!美韓記憶體廠普跌

市場迅速將這項技術解讀為「需求側破壞」。在消息釋出後,記憶體與儲存相關個股出現同步下跌,包括 SanDisk(SNDK)下跌 3.5%、Micron Technology(MU)下跌 3.4%、Western Digital(WDC)下跌 1.63%;亞洲供應鏈方面,Samsung Electronics 下跌 4.71%,SK Hynix 跌幅更達 6.23%。

背後邏輯相當直接:若 AI 模型在推理階段對記憶體的需求被壓縮數倍,意味著未來資料中心對 DRAM、HBM 甚至 NAND 儲存的需求成長曲線,可能出現結構性下修。特別是在 AI 產業逐步從「訓練導向」轉向「推理導向」的背景下,效率優化技術的邊際影響將被放大。

不過,也有觀點認為,TurboQuant 更可能改變的是「資源使用效率」,而非單純削弱需求。隨著成本下降與延遲降低,AI 應用場景反而可能進一步擴張,進而帶動總體算力需求持續成長,形成「單位需求下降、總量需求上升」的結構。大型記憶體廠今年的產能都已售完,或許市場要想的是:AI 成長的天花板,究竟有多大?

  • 本文經授權轉載自:《鏈新聞》
  • 原文標題:《Google 新技術嚇壞市場,AI 記憶體需求少六倍!SK 海力士、美光同步下殺》
  • 原文作者:Neo
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论