研究顧問機構 Gartner 今日(30日)發布最新警告指出,儘管預期到 2030 年人工智慧(AI)推論代幣單位價格將大幅下滑逾九成,然而企業在 AI 方面的總體支出負擔,恐因應用模式改變而持續存在甚至不減反增。這項預警提醒企業,單一代幣成本下降不代表總體開銷縮減,需警惕 AI 代理普及帶來的支出結構重塑。
Gartner 預估 AI 推論成本大幅下降
根據 Gartner 的預測,截至 2030 年,一個擁有高達一兆參數的大型語言模型(LLM)推論費用,相較於 2025 年將有超過 90% 的降幅。同時,相同規模模型的運作效率預計可提升達百倍之多。Gartner 高級總監分析師 Will Sommer 解釋,這顯著的成本效益提升,主要源於半導體與基礎設施效率的持續改進、模型設計的創新突破、晶片利用率的提高,以及推論專用半導體的擴展和邊緣裝置的廣泛應用。
AI 代理普及重塑成本結構:單位降價不等於總支出減少
Gartner 對成本迷思的警示
然而,Gartner 強調,單一 AI 代幣單位價格的下跌,並非直接等同於企業 AI 總成本的降低。主要原因在於,AI 代理(agent)的普及正在全面重塑企業的整體支出結構。目前,每項任務的 AI 代幣使用量已比過去增加 5 到 30 倍。這意味著,儘管單位成本持續下降,但總體使用量的激增,可能導致企業的推論費用總額反而隨之上升。
進階 AI 能力與架構挑戰
分析師 Sommer 進一步指出,基本的 AI 功能正逐步朝向幾乎零成本的方向發展,但用於進階推論(advanced reasoning)的運算資源與系統,目前仍然相對有限。他警示企業不應將架構上的效率不足,誤解為通用代幣價格下跌就代表進階推論能力已然普及。若企業僅僅依賴便宜的代幣成本來掩蓋系統架構本身的缺陷,未來在代理導向的 AI 擴展階段,恐將面臨嚴重的發展限制。
多模型協作策略:未來 AI 競爭力的關鍵
面對 AI 成本結構的複雜變化,Gartner 建議,未來的 AI 競爭力將不再取決於單一模型的表現,而是應採行「多模型協作」(multi-model orchestration)策略。企業應建立一種分層架構,將重複性且相對簡單的任務分配給小型或特定領域模型來處理,而高成本、高效能的模型則應選擇性地僅用於處理複雜且高附加價值的工作。透過這種策略,企業才能在同時實現成本效益與卓越性能表現。