日前,矽谷創業晶片公司Tachyum公佈了一顆神奇的處理器“Prodigy”,號稱全球第一顆“通用處理器”(universal processor),最多擁有128個核心,而且頻率高達5。7GHz,著實不可思議。
現在,更多細節來了。
Tachyum Prodigy處理器採用的是自研架構,64位VLIW架構核心,順序執行,但對編譯器最佳化後也可做4路亂序執行。
每個核心有另兩個1024-bit向量單元、一個4096-bit矩陣單元、64KB一級指令快取、64KB一級資料快取、1MB二級快取,而且閒置的二級快取還可以給其他核心用作三級快取。
頂級型號“Prodigy T16128-AIX”,頻率高達5.7GHz,支援16通道DDR5-7200記憶體,最大容量8TB,還支援64條PCIe 5.0,功耗也高達950W,必須液冷散熱。
它主要面向高階AI、HPC領域,AI推理訓練效能12PFlops(1.2億億次計算每秒),FP64 HPC計算效能90TFlops(90萬億次計算每秒)
——AMD RISC-V MI250X計算卡可以跑到96TFlops,而且只需560W。
支援
雙路、四路並行
,也就是單系統最多可以做到512個核心、32TB記憶體。
另外三顆128核心
,分別叫做T16128-AIM、T16128-AIE、T16128-HT,頻率分別為
4.5GHz、4.0GHz、4.5GHz
,功耗分別為
700W、600W、300W
,其中HT版本記憶體頻率降至DDR5-6400。
64核心有兩款
,T864-HS、T864-HT,頻率分別
5.7GHz、4.5GHz
,支援八通道DDR5-6400、32條PCIe 5。0,功耗都是
300W
。
32核心也有兩款
,T832-HS、T832-LP,頻率分別
5.7GHz、3.2GHz
,後者記憶體頻率降至DDR5-4800,功耗分別為
300W、180W
。
不過,
Tachyum至今還沒有一顆矽片,一切順利的話預計8月中旬完成流片,使用臺積電N5P 5nm增強版,核心面積預估不超過500平方毫米,12月份獲得第一顆矽片。
這次現場展示的,還是用FPGA模擬的平臺,四顆模擬八核心。
即便第一代還停留在PPT上,Tachyum已經開始展望下一代了:
臺積電N3 3nm,支援PCIe 6.0,同等功耗下效能翻一番!