近年來,隨著 AI 技術迎來爆炸式增長,輝達與超微等半導體巨頭紛紛將研發重心與產能全力投向利潤豐厚的 AI 低精度計算領域,但這一戰略轉向正引發意想不到的連鎖反應。
《路透社》報導,由於難以採購到滿足高精度科學計算需求的晶片,美國國家實驗室被迫將目光轉向新興的晶片新創公司,以確保國家安全任務不受影響。
位於新墨西哥州科特蘭空軍基地的桑迪亞國家實驗室 (Sandia National Laboratories),是美國三大負責核武器研發與維護的機構之一。該實驗室內的液冷超級電腦常年承擔極端複雜的模擬任務,從模擬高超音速武器穿越大氣層的軌跡,到推演核彈頭在鄰近區域引爆的物理場景,每一項都關乎國安。過去十幾年,支撐這些高機密任務的算力主要依賴輝達和超微等主流大廠。
但這一情況正在改變。桑迪亞實驗室高效能運算團隊主管 Steve Monk 坦言,隨著主流晶片公司日益向 AI 傾斜,實驗室在獲取滿足高精度科學計算需求的晶片方面壓力劇增。
Monk 說:「從供應鏈到運算能力,雙重壓力讓我們對未來任務的交付能力感到擔憂。」
核心分歧點在於一項名為「雙精度浮點計算」(FP64) 的關鍵指標。對於核武器物理模擬而言,晶片必須能在不損失精度的情況下處理極大和極小的數值。FP64 能表達超過 18.44 萬京個唯一數值,是現代飛機飛行、火箭升空乃至疫苗研發的基石。
相比之下,現代 AI 模型通常使用 FP8 精度進行訓練,僅能表達 256 個唯一值。
令人憂心的是,輝達最新發布的 Rubin GPU 雖在 AI 推理速度上達到前代的 2.5 倍,但其 FP64 峰值性能反而較四年前推出的 H100 有所下降。儘管輝達推出基於 Ozaki 方案的軟體模擬技術試圖彌補,但超微研究員 Nicholas Malaya 指出,這種方法在真實物理模擬中的可靠性存疑,且存在記憶體消耗翻倍等問題。
晶片分析師 Ian Cutress 也證實,輝達 Rubin 在雙精度性能上的倒退,已引起高性能計算科學家的廣泛焦慮。
與此同時,輝達與超微兩大巨頭的戰略真空,則為以色列新創公司 NextSilicon 打開了市場大門。
成立於 2017 年的 NextSilicon,經過八年研發,已累計融資約 3.03 億美元,其旗艦晶片「Maverick-2」採用革命性的智能數據流架構,能透過軟體定義硬體進行動態重構,大幅提升運算效率。
桑迪亞實驗室高級科學家 James Laros 對此給予高度評價:「NextSilicon 的結果令人印象深刻,展現出無需大量修改代碼即可提升算力的潛力。」
桑迪亞實驗室周一 (18 日) 跟 NextSilicon 及合作夥伴 Penguin Solutions 共同宣布,搭載該新創公司晶片的超級電腦系統已通過關鍵技術里程碑,預計今年秋季將正式接受核安全相關的高難度任務測試。
Laros 指出,與中小型晶片企業合作的核心目的,是構建多元化採購體系。「我們必須保持可用的選擇來完成使命,因為這項使命沒有退路。」
在 AI 浪潮席捲全球的當下,這場由美國國家實驗室發起的「算力突圍」,正揭示了科技發展中不可忽視的結構性風險。
新聞來源 (不包括新聞圖片): 鉅亨網