光速前進:上海交大全光AI晶片問世,算力快過A100百倍

在矽基時代逐漸逼近極限的今天,一項來自上海交通大學的突破性研究,正試圖用「光」重新定義人工智慧的未來。國際頂尖期刊《科學》最新刊登的論文揭示,研究團隊成功研發出全球首個大規模全光生成式AI晶片——LightGen。這塊僅指甲蓋大小的晶片,不靠電子運算,而是以純光學方式處理語義視覺生成任務,其端到端計算速度比輝達A100快上兩個數量級,能效與計算密度也同步躍升。這不僅是中國在先進晶片領域的一次領跑,更可能為生成式AI帶來顛覆性的算力革命。

過去,photon 計算長期受限於三大瓶頸:集成規模不足、無法精確控制信號維度,以及缺乏有效的訓練算法。傳統光子晶片通常只能集成數千個神經元,難以支撐高維生成任務;而光信號作為連續光斑存在,不像電子那樣容易進行dimension 轉換。更重要的是,生成式AI需要創造前所未見的內容,傳統依賴標籤的訓練方式根本行不通。上海交大陳一彤團隊提出的LightGen,正是針對這三大挑戰的系統性解方:透過三維封裝技術,單晶片集成超過210萬個光子神經元,規模躍升千倍。

核心創新之一,在於建立「optical 潛空間」(OLS)——一種可在全光環境中進行特徵壓縮與重建的結構。就像變分自編碼器在電子世界的作用,OLS將原始圖像嵌入低維空間,再由光子生成器還原為高解析圖像。實驗顯示,僅透過操控潛空間中的光斑幅度與相位,就能生成512×512解析度的動物圖像,毛髮紋理與眼神反光細節豐富,語義一致性高。更驚人的是,LightGen無需切割圖像分塊處理,直接完成全局生成,避免了常見的邊界斷裂問題,這對視訊與3D生成尤為關鍵。

為了讓晶片「自主學習」,團隊另提出一種名為BOGT的無監督訓練算法,algorithm 基於貝葉斯思想建模語義數據的機率分佈,徹底擺脫對預設標籤的依賴。在風格遷移、去噪、三維場景生成等多項任務中,LightGen表現與Stable Diffusion、StyleGAN、NeRF等主流模型相當。研究指出,若搭配更高速的空間光調制器,理論計算速度可達每秒5.69×10⁹ TOPS。這項成果不僅驗證了全光生成式AI的可行性,更為未來更高解析度與更複雜模型的擴展提供了清晰路徑。

反應 8

  • 光路先鋒

    看到全光計算真的走到生成模型這一步,有點感動。之前總覺得只是理論可能,現在連語義操控都能做,future 感拉滿。

  • 半導體阿凱

    計算速度比A100快百倍?這數字要小心解讀,是特定任務下的端到端延遲還是理論吞吐量?performance 指標需要更多上下文。

  • 清大光電生

    210萬光子神經元集成在一塊晶片上,還用三維封裝……這製程難度應該很高吧?technology 門檻才是最大護城河。

  • A
    AI實驗室小李

    不依賴標籤的訓練方法BOGT看起來很有潛力,這可能是比硬體更長遠的影響。

  • 老派工程師

    概念很強,但何時能商用?散熱、光源穩定性、與現有系統整合都是問題,market 接受度還很遠。

  • 科技觀察者

    從ACCEL到PED再到LightGen,陳一彤團隊真的在穩步推進光計算的邊界,不是炒話題,是紮實研究。

  • 學生小吳

    原來光也能有「潛空間」,這個類比幫我理解了抽象概念,idea 很巧妙。

  • 懷疑論者99

    實驗室成果光環再亮,沒量產等於零。先別急著喊超越,等看到實際部署再說。

本文基於事實,為英語學習目的重新構成,讀者反應是多元觀點的示例。

[email protected]