當一個數字震驚了所有人:大型語言模型(LLM)的關鍵記憶體需求,竟能驟降至少六倍!這項由Google研究團隊發表的「TurboQuant」全新壓縮演算法,如同平地一聲雷,瞬間將記憶體產業推向風口浪尖。市場對未來記憶體需求的疑慮大起,不僅導致多檔先前因漲勢過猛而被列為處置股的記憶體概念股遭遇重挫,其中尤以旺宏與宜鼎受創最深,宜鼎更因此跌出「千元俱樂部」,顯示這項技術的潛在影響力,已遠超市場預期。
表象:市場恐慌與股價跳水
近期,記憶體市場利空消息一波接一波,而Google的「TurboQuant」技術無疑是壓垮駱駝的最後一根稻草。許多原先因股價飆漲、交易過熱而遭列為處置股的記憶體大咖,包括旺宏(2337)、宜鼎(5289)、威剛(3260)、創見(2451)、晶豪科(3006)、宇瞻(8271)以及廣穎(4973),在消息傳出後,紛紛成為空頭狙擊的目標。26日盤中,這些個股普遍出現逾半根跌停,其中旺宏一度直接殺至跌停價位,而工控記憶體模組大廠宜鼎更是慘烈,股價大跌失守千元關卡,宣告退出高價股行列。
這股賣壓不僅限於處置股。美國記憶體大廠美光股價自高峰連四天回檔,也引發台系記憶體股的連鎖反應。即使是未被處置的上游製造廠,如華邦電(2344)、南亞科(2408)和力積電(6770),也難以倖免,股價跌幅都逾6%,呈現多空激烈交戰的局面。
真相:Google TurboQuant的革命性衝擊
究竟「TurboQuant」是何方神聖,竟能引發如此巨大的市場震盪?這項由Google研究團隊日前正式發表的技術,是一種「免訓練」(training-free)的全新壓縮演算法。其核心突破在於,它能將大型語言模型(LLM)中扮演關鍵角色的「鍵值快取」(KV caches)大幅壓縮至僅剩3位元(3 bits)。
根據輝達(Nvidia)H100 GPU 上的基準測試結果顯示,採用4位元版本的TurboQuant在計算注意力對數(attention logits)時,相較於未經量化的32位元金鑰,效能竟能提升高達8倍。然而,更令人震驚的是,在達到如此顯著效能提升的同時,對KV快取記憶體的需求量卻能「逆向降低至少6倍」。這項技術的出現,讓業界開始嚴肅思考,AI時代對記憶體的需求曲線是否將因此產生根本性的改變。
市場觀察家指出:「Google的這項技術,無疑是記憶體產業一道難以迴避的『黑天鵝』,它顛覆了我們對AI時代記憶體需求的既有認知,迫使整個供應鏈重新評估未來的市場走向。」
各方角力:產業鏈的蝴蝶效應
當Google的「黑科技」掀起波瀾,記憶體產業鏈上的各方參與者都感受到了壓力。上游的DRAM製造商,如台灣記憶體龍頭南亞科,即便在利空消息傳出之際,仍宣布完成大規模私募普通股案,引進Sandisk(晟碟)和Kioxia(鎧俠)等國際大廠,試圖強化資本結構與策略合作,但在市場信心動搖下,其股價仍面臨考驗。
中下游的記憶體模組廠與NAND Flash供應商更是首當其衝,因為他們的營運直接與記憶體顆粒的需求量掛鉤。如果未來大型語言模型普遍採用類似的壓縮技術,對記憶體原廠的採購量將可能大幅減少,進而衝擊整個供應鏈的獲利能力。
一位不願具名的業界人士表示:「當效能提升八倍,但記憶體需求卻能逆向降低六倍時,這對整個供應鏈的衝擊,絕非短期波動所能形容。我們必須嚴肅思考這是否會引發一場新的產業洗牌。」
深層影響:記憶體產業的典範轉移?
「TurboQuant」技術的問世,不僅僅是單一利空事件,它更像是一個訊號,預示著AI硬體架構與記憶體使用模式可能迎來一場典範轉移。過去,AI模型不斷擴大,記憶體需求也隨之水漲船高,被視為記憶體產業的長期成長動能。然而,這項壓縮技術的成熟,卻可能在不犧牲效能的前提下,有效抑制對高容量記憶體的需求。
這將促使記憶體廠商重新思考產品策略,或許未來更輕量、更高效能的記憶體解決方案將成為主流。DRAM和NAND Flash的發展路徑,也可能因此加速轉向優化單位成本效能,而非單純追求容量擴張。這不僅考驗著廠商的技術創新能力,更挑戰其對市場趨勢的敏銳洞察與快速應變能力。
未解之問:記憶體市場何去何從?
Google的「TurboQuant」技術無疑為記憶體產業投下了一顆震撼彈。然而,這是否代表記憶體需求的長期成長趨勢將徹底反轉?抑或這僅是AI技術進程中的一次陣痛,促使產業加速創新,尋找新的應用與增長點?
市場仍在消化這項重大利空,處置股的股價壓力何時能緩解?記憶體大廠又將如何應對這場技術變革,是跟進開發類似技術,還是尋求差異化競爭?這些問題,都將是未來一段時間內,記憶體市場乃至整個科技產業必須面對的未解之問。
分析師們紛紛呼籲:「投資人應密切關注後續發展,這項技術的普及程度、以及其他科技巨頭是否會跟進,都將是影響記憶體產業未來走向的關鍵變數。」