国产成人av综合久久视色,а√最新版在线天堂鲁大师,超碰97资源站,成人免费ā片在线观看,gogo西西人体大尺度大胆高清

英偉達發(fā)布Rubin CPX芯片,算力效率驚人

原創(chuàng) <{$news["createtime"]|date_format:"%Y-%m-%d %H:%M"}>  瑞財經(jīng) 9536閱讀 2025-09-10 01:32

Ai快訊 2025年9月9日周二,全球人工智能算力芯片龍頭英偉達宣布推出專為長上下文工作負載設(shè)計的專用GPU Rubin CPX,旨在翻倍提升當(dāng)前AI推理運算的工作效率,尤其適用于編程、視頻生成等需要超長上下文窗口的應(yīng)用。

英偉達CEO黃仁勛介紹,CPX是首款專為需要一次性處理大量知識(數(shù)百萬級別tokens)并進行人工智能推理的模型而構(gòu)建的芯片。由于Rubin是英偉達將于明年發(fā)售的下一代頂級算力芯片,基于Rubin的CPX預(yù)計要到2026年底出貨。下一代英偉達旗艦AI服務(wù)器全稱為NVIDIA Vera Rubin NVL144 CPX,集成36個Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU。

下一代旗艦機架將提供8exaFLOPs的NVFP4算力,比GB300 NVL72高出7.5倍,同時單個機架就能提供100TB的高速內(nèi)存和1.7PB/s的內(nèi)存帶寬。英偉達在Rubin GPU邊上再配一塊Rubin CPX GPU,目的是顯著提升數(shù)據(jù)中心的算力效率,讓用戶購買芯片能獲取更多收益。英偉達稱,部署價值1億美元的新芯片,將能為客戶帶來50億美元的收入。

作為行業(yè)首創(chuàng),英偉達的新品在硬件層面上分拆了人工智能推理的計算負載。推理過程包含上下文階段與生成階段,這兩個階段對基礎(chǔ)設(shè)施的要求截然不同。上下文階段屬于計算受限,需要高吞吐量的處理能力來攝取并分析大量輸入數(shù)據(jù)以生成首個輸出token;生成階段則屬于內(nèi)存帶寬受限,依賴高速的內(nèi)存?zhèn)鬏敽透邘捇ヂ?lián)(如NVLink)來維持逐個token的輸出性能。

當(dāng)前頂級的GPU是為內(nèi)存和網(wǎng)絡(luò)限制的生成階段設(shè)計,配備昂貴的HBM內(nèi)存,但在解碼階段并不需要這些內(nèi)存。通過分離式處理這兩個階段并針對性優(yōu)化計算與內(nèi)存資源,可顯著提升算力的利用率。

Rubin CPX專門針對“數(shù)百萬tokens”級別的長上下文性能進行優(yōu)化,具備30petaFLOPs的NVFP4算力、128GB GDDR7內(nèi)存。英偉達估計,約20%的AI應(yīng)用會等待首個token出現(xiàn),如解碼10萬行代碼可能需5 - 10分鐘,多幀、多秒視頻的預(yù)處理和逐幀嵌入會增加延遲,這也是當(dāng)前視頻大模型通常僅用于制作短片的原因。

英偉達計劃以兩種形式提供Rubin CPX,一種是與Vera Rubin裝在同一個托盤上,對于已下單NVL144的用戶,也會單獨出售一整個機架的CPX芯片,數(shù)量與Rubin機架匹配。

(AI撰文,僅供參考)

來源:瑞財經(jīng)

重要提示:本文僅代表作者個人觀點,并不代表樂居財經(jīng)立場。 本文著作權(quán),歸樂居財經(jīng)所有。未經(jīng)允許,任何單位或個人不得在任何公開傳播平臺上使用本文內(nèi)容;經(jīng)允許進行轉(zhuǎn)載或引用時,請注明來源。聯(lián)系請發(fā)郵件至ljcj@leju.com,或點擊【聯(lián)系客服

網(wǎng)友評論