亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Intel Sapphire Rapids CPU,吹響反攻DPU的號角

sakobpqhz ? 來源:算力基建 ? 作者:算力基建 ? 2022-12-19 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

152c5e5e-7f48-11ed-8abf-dac502259ad0.png

CPU、GPU和DPU是數(shù)據(jù)中心的三大芯片,通常情況下:CPU主要用于業(yè)務(wù)應(yīng)用的處理,GPU用于性能敏感業(yè)務(wù)的彈性加速,而DPU則是基礎(chǔ)設(shè)施加速。站在CPU的視角:一開始所有事情都是我的,然后GPU從我這“搶”過去了一部分工作,現(xiàn)在又出現(xiàn)個DPU來跟我“搶食”。是可忍孰不可忍,必須堅決反擊!

01CPU視角看硬件加速

站在CPU視角,最開始,一切處理都通過處理器CPU的常規(guī)指令集完成。隨著CPU性能瓶頸,需要硬件加速的方式來提升性能。硬件加速大致有如下幾種方式:

方式1:實現(xiàn)支持?jǐn)U展指令集的協(xié)處理器,實現(xiàn)一定程度的加速能力。比如Intel集成的AVX和AMX指令集,ARM的NEON指令集等。

方式2:獨立的單一架構(gòu)的加速器。比如GPU、AI芯片。

方式3:獨立的多架構(gòu)集成加速器。比如DPU。

方式4:即將開始的一種方式,集成單個或多個加速器。

155fa75a-7f48-11ed-8abf-dac502259ad0.png

這里需要大家區(qū)分兩個概念:處理器核和處理器芯片。處理器芯片是由同構(gòu)或異構(gòu)的處理器核組成的。

CPU已經(jīng)到了性能瓶頸,這是大家的共識;當(dāng)CPU遇到性能瓶頸的時候,通過加速的方式進一步提升性能,也是大家的共識。但是,加速的實現(xiàn)形態(tài),是分立的多個芯片,還是集成的單個芯片,就是“仁者見仁智者見智”的事情了。獨立的DPU公司會認(rèn)為,獨立的DPU有很多的優(yōu)勢;但是在CPU廠家而言,通過CPU集成加速器核,使得CPU成為某種程度上的類SOC芯片,也是完全可行的。

02獨立DPU的價值基礎(chǔ)并不牢靠

DPU作為獨立的集成加速平臺,其價值可以從四個方面進行闡述:

價值一:為了進一步提升性能,DPU實現(xiàn)CPU工作任務(wù)的卸載和加速;

價值二:從I/O的硬件虛擬化(也可以看做是I/O模擬的硬件卸載)開始,DPU實現(xiàn)I/O模擬、I/O Workload以及整個虛擬化和基礎(chǔ)設(shè)施層的全量卸載和加速;

價值三:從運維和管理視角,DPU重要的價值在于實現(xiàn)了業(yè)務(wù)和基礎(chǔ)設(shè)施分離,實現(xiàn)了業(yè)務(wù)主機的安全訪問;

價值四:面向更大計算量和數(shù)據(jù)吞吐量,DPU實現(xiàn)從“以計算為中心”到“以數(shù)據(jù)為中心”。

157eb41a-7f48-11ed-8abf-dac502259ad0.png

DPU的前三個價值,其實現(xiàn):可以是獨立的DPU芯片實現(xiàn),也可以是集成的DPU域?qū)崿F(xiàn)。這對功能和特征沒有任何影響,甚至集成的方式,還有一些優(yōu)勢:優(yōu)化訪問效率,提升性能;集成芯片進一步降低成本和功耗。

1593038e-7f48-11ed-8abf-dac502259ad0.png

DPU的第四個價值,一方面,和獨立或集成無關(guān),也就是說獨立或集成都可以;另一方面,DPU并不一定能夠?qū)崿F(xiàn)以數(shù)據(jù)為中心的價值。

上面這張圖,通常把左邊的稱為“以計算為中心”,右邊的稱為“以數(shù)據(jù)為中心”。然而,這種表述是有問題的。嚴(yán)格來說,左邊稱為“以CPU為中心”、“以控制為中心”或者“以計算為中心”是可以的,右邊這張圖稱為“以DPU為中心”是合適的,但如果稱為“以數(shù)據(jù)為中心”則是不準(zhǔn)確的?!耙訢PU為中心”并不一定等于“以數(shù)據(jù)為中心”,“以DPU為中心”,完全可能是“以‘CPU’為中心”,或者說是“以計算為中心”。

最終的結(jié)論是:很多DPU其實并非嚴(yán)格意義上的數(shù)據(jù)驅(qū)動處理器,并且即使DPU是數(shù)據(jù)驅(qū)動的,依然無法保證整個計算機系統(tǒng)是完全數(shù)據(jù)驅(qū)動的。

03Intel Sapphire Rapids CPU介紹

15aefa80-7f48-11ed-8abf-dac502259ad0.png

Sapphire Rapids是Intel新一代的數(shù)據(jù)中心CPU,用于接替Ice Lake。Sapphire Rapids相比Ice lake,從單個TILE變成了4個TILE的Chiplet集成。

Sapphire Rapids可以提供更高的單節(jié)點性能:

處理器方面,如更高性能的微架構(gòu)實現(xiàn)、更多的內(nèi)核數(shù)量、AMX擴展、多個集成的加速引擎等;

存儲方面,如更大的私有/共享緩存、DDR5/HBM等;

I/O方面,如采用PCIe 5.0、UPI2.0、支持新一代Optane等;

Chiplet封裝:EMIB總線實現(xiàn)多TILE集成。

除了單芯片的性能提升之外,Sapphire Rapids還提供更高的數(shù)據(jù)中心整體性能,例如快速VM遷移、更強的遙測能力、更強的I/O虛擬化、緩存和內(nèi)存性能一致性、新一代QoS、CXL1.1、更加的彈性,以及提升資源利用率等等。

而Sapphire Rapids的最大創(chuàng)新則是:AIA。通過AIA集成多種加速引擎,包括數(shù)據(jù)流加速器DSA(Data Stream Accelerator,不是Domain Specific Architecture)、QAT等。我們將在接下來的一節(jié)對AIA詳細(xì)介紹。

04Intel里程碑:AIA

4.1 背景知識:加速器接口/架構(gòu)

15db7ea2-7f48-11ed-8abf-dac502259ad0.png

相對于CPU,其他類型的處理器,都可以稱為加速處理器,如:GPU、DSA和ASIC等(FPGA需要具體的處理器實現(xiàn))。這些加速器都是非圖靈完備的,因此都需要和CPU組合成Host CPU+xPU的異構(gòu)計算方式工作。

加速器接口,也即加速器呈現(xiàn)給Host CPU的軟件訪問接口,也可以稱為加速器架構(gòu)。在這里,架構(gòu)和接口的概念是等同的。

4.2 AIA技術(shù)介紹

AIA(Accelerator interfacing Architecture,加速器接口架構(gòu))不是一個簡單的功能或特征實現(xiàn),而是一組相關(guān)技術(shù)能力的組合(類比Intel的VT-x和VT-d技術(shù))。從Intel新一代Xeon處理器Sapphire Rapids開始,提供加速接口技術(shù)AIA,其技術(shù)點包括如下:

任務(wù)分配指令(MOVDIRI、MOVDIR64B、ENQCMD/S)用于優(yōu)化任務(wù)卸載,ENQCMD/S支持共享任務(wù)隊列;

用戶態(tài)等待指令(UMONITOR、UMWAIT、TPAUSE),用于高效同步;

低延遲用戶態(tài)中斷;

共享虛擬內(nèi)存;

輕量的可擴展I/O虛擬化S-IOV。

AIA目前支持的加速類型有:數(shù)據(jù)流處理DSA、加解密和數(shù)據(jù)壓縮QAT等。

4.3 Intel AIA的戰(zhàn)略意圖分析

15ec3260-7f48-11ed-8abf-dac502259ad0.png

作為全能型的處理器,通吃整個計算市場幾十年的CPU,面臨性能瓶頸的巨大挑戰(zhàn)。于是,各種加速處理器,如GPU、DPU等,都在拼命地“挖CPU的墻角”。

作為CPU的霸主,Intel肯定不會“坐以待斃”,一定會“奮起反擊”。AIA就是Intel準(zhǔn)備的“核彈”級的武器,AIA是Intel CPU的重要里程碑,其戰(zhàn)略意圖(可能)是:

捍衛(wèi)CPU的核心地位,所有的一切加速器都需要圍繞著CPU技術(shù)生態(tài)展開;

Intel試圖通過AIA統(tǒng)一加速器接口、架構(gòu)和生態(tài)。以GPU作為案例:一方面GPU是獨立的架構(gòu)和生態(tài),與CPU架構(gòu)是解耦的,可以基于x86架構(gòu),也可以遷移到ARM或RISCv架構(gòu);另一方面,GPU架構(gòu)是各自封閉的,NVIDIA有自己的架構(gòu)和生態(tài),AMD有自己的架構(gòu)和生態(tài)。AIA也許無法把所有的不同加速器類型都統(tǒng)一到一個標(biāo)準(zhǔn)的AIA,但是把GPU統(tǒng)一一個,各種領(lǐng)域加速器DSA各統(tǒng)一一個,是完全可能并且技術(shù)上可行的。

一些常見的、關(guān)鍵的加速器,就自己搞定,集成到CPU中,比如Sapphire Rapids集成了數(shù)據(jù)流處理DSA(DSA可以把很多數(shù)據(jù)處理類的加速統(tǒng)一進來,如網(wǎng)絡(luò)和存儲等)和QAT,未來再集成AI、網(wǎng)絡(luò)、存儲、虛擬化卸載、安全等基礎(chǔ)設(shè)施層處理(也即DPU覆蓋的范疇)功能或加速器,其可能性也是非常的高。

05Intel CPU的未來發(fā)展分析

CPU發(fā)展的幾個重要里程碑:

里程碑0:CPU的出現(xiàn)?;诤唵芜\算指令的通用處理器,實現(xiàn)軟件和硬件的完全解耦。從此后,軟件作為獨立的工作領(lǐng)域而存在,軟件開發(fā)人員不用關(guān)心硬件細(xì)節(jié)。

里程碑1:多核CPU,從串行計算走向并行計算。

里程碑2:VT-x和VT-d等CPU硬件虛擬化技術(shù),實現(xiàn)無性能損耗的多租戶多系統(tǒng)的獨立運行;

里程碑3:AIA技術(shù)的出現(xiàn),通過AIA,支持獨立或集成加速器,并且規(guī)范加速器的接口/架構(gòu)和生態(tài)。

Sapphire Rapids的出現(xiàn),第一次從CPU的視角,試圖統(tǒng)一各種加速器和CPU的控制和數(shù)據(jù)交互方式,也即加速器呈現(xiàn)給Host CPU的架構(gòu)。未來,AIA的方式能否成功,大家拭目以待。

硬件加速,不管是獨立或集成的加速引擎/芯片,都是可行的路徑。但拋開具體的芯片實現(xiàn),在架構(gòu)上,硬件加速的形態(tài)會再往何處發(fā)展?這里我們拋磚引玉:

標(biāo)準(zhǔn)的交互(Host CPU和加速器的接口或稱為架構(gòu)),統(tǒng)一加速器架構(gòu)??赡軣o法把不同類型的加速器統(tǒng)一,但同類型的架構(gòu)走向統(tǒng)一。

標(biāo)準(zhǔn)交互的同時,需要開放,需要跟CPU架構(gòu)解耦,可以跨不同的CPU架構(gòu)實現(xiàn)同樣的交互協(xié)議;

基于標(biāo)準(zhǔn)的交互,基于一定的機制,要實現(xiàn)業(yè)務(wù)應(yīng)用的跨處理器類型運行。

Intel Sapphire Rapids,代表著CPU的一個重要的發(fā)展趨勢是:CPU芯片不斷融合各類加速器核,使得自己成為更加綜合和均衡的新型處理器。

06CPU、GPU、DPU,

從競爭/協(xié)同到混戰(zhàn)/融合

16088028-7f48-11ed-8abf-dac502259ad0.png

目前,CPU、GPU和DPU,數(shù)據(jù)中心的三大芯片,從“井水不犯河水”,走向“跨越邊界,侵入對方領(lǐng)地”的混戰(zhàn)階段。

CPU、GPU和DPU,既是協(xié)同的關(guān)系,又是競爭的關(guān)系。三者處于一個動態(tài)平衡的狀態(tài),在協(xié)同中競爭,在競爭中協(xié)同。這個趨勢不斷發(fā)展,走向更加深度地協(xié)同甚至融合。

16192e78-7f48-11ed-8abf-dac502259ad0.png

從CPU單個處理器的“合”,走向眾多加速器的“分”,再“從分到合”,逐步融合成一個新型的超級處理器。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11202

    瀏覽量

    222225
  • SoC芯片
    +關(guān)注

    關(guān)注

    2

    文章

    657

    瀏覽量

    36640
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    406

    瀏覽量

    26009

原文標(biāo)題:Intel Sapphire Rapids CPU,吹響反攻DPU的號角

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    易靈思Sapphire SoC中RISC-V平臺級中斷控制器深度解析

    隨著 RISC -V處理器在 FPGA 領(lǐng)域的廣泛應(yīng)用,易靈思 FPGA 的 Sapphire RISC-V 內(nèi)核憑借軟硬核的靈活支持,為開發(fā)者提供多樣選擇。本文深入探討 Sapphire SoC 中 RISC - V 平臺級中斷控制器(PLIC),解析其架構(gòu)與操作機制
    的頭像 發(fā)表于 11-08 09:35 ?3669次閱讀
    易靈思<b class='flag-5'>Sapphire</b> SoC中RISC-V平臺級中斷控制器深度解析

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為 AI 數(shù)據(jù)存儲、網(wǎng)絡(luò)和安全帶來突破性的加速。
    的頭像 發(fā)表于 11-03 14:48 ?346次閱讀

    康盈半導(dǎo)體總部基地正式奠基

    2025 年 9 月 29 日,康盈半導(dǎo)體總部基地在浙江省衢州市正式奠基。這一里程碑事件,標(biāo)志著康盈半導(dǎo)體存儲產(chǎn)業(yè)布局更進一步,打造存儲產(chǎn)業(yè)新高地的號角,同時是扎根國內(nèi)、立足全球的全新起點,為長三角半導(dǎo)體產(chǎn)業(yè)協(xié)同發(fā)展注入強勁
    的頭像 發(fā)表于 10-13 16:59 ?1195次閱讀

    RISC-V DPU,重塑數(shù)據(jù)中心算力格局?

    電子發(fā)燒友網(wǎng)綜合報道 在現(xiàn)代數(shù)據(jù)中心架構(gòu)中,數(shù)據(jù)處理單元(DPU)正迅速崛起為繼 CPU 和 GPU 之后的第三顆核心芯片。DPU 專為數(shù)據(jù)密集型任務(wù)設(shè)計,通過卸載 CPU 的低效工作
    的頭像 發(fā)表于 09-13 00:51 ?3746次閱讀

    AI+行動號角,聯(lián)想智能體憑什么領(lǐng)跑?

    提前起跑的聯(lián)想,《人工智能+行動》背后的基建力量
    的頭像 發(fā)表于 09-11 18:37 ?2918次閱讀
    AI+行動<b class='flag-5'>號角</b><b class='flag-5'>吹</b><b class='flag-5'>響</b>,聯(lián)想智能體憑什么領(lǐng)跑?

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?582次閱讀

    激光焊接技術(shù)在焊接脹板工藝中的應(yīng)用

    脹板憑借其內(nèi)部精密的微通道結(jié)構(gòu),成為高效熱交換領(lǐng)域(如制冷系統(tǒng)蒸發(fā)器)的關(guān)鍵組件。然而,其獨特的雙層或多層結(jié)構(gòu)以及超薄壁厚對焊接工藝提出了嚴(yán)苛要求。傳統(tǒng)的電弧焊、釬焊等方式常面臨熱輸入過大、變形
    的頭像 發(fā)表于 07-16 14:30 ?279次閱讀

    TPS53820 集成降壓轉(zhuǎn)換器,帶 SVID,用于 Intel CPU 功率數(shù)據(jù)手冊

    TPS53820 器件是 D-CAP+ 模式集成降壓轉(zhuǎn)換器,用于 Intel CPU 電源的低電流 SVID 軌。它提供多達兩個輸出,為 VCCANA (5.5 A) 和 P1V8 (4 A) 等低
    的頭像 發(fā)表于 04-24 16:03 ?601次閱讀
    TPS53820 集成降壓轉(zhuǎn)換器,帶 SVID,用于 <b class='flag-5'>Intel</b> <b class='flag-5'>CPU</b> 功率數(shù)據(jù)手冊

    隆基攜手Naif重塑中東地區(qū)能源格局

    在中東這片古老又充滿活力的土地上,能源轉(zhuǎn)型的號角已經(jīng)。隆基綠能科技股份有限公司(以下簡稱“隆基”)與戰(zhàn)略合作伙伴Naif Falcon Trading(以下簡稱“Naif”)攜手并進,共同開創(chuàng)可持續(xù)發(fā)展的新篇章。
    的頭像 發(fā)表于 03-21 17:37 ?1038次閱讀

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55

    廣汽集團召開高質(zhì)量發(fā)展大會

    春回大地,萬象更新。近兩日廣東省、廣州市聚焦“建設(shè)現(xiàn)代化產(chǎn)業(yè)體系”主題,相繼召開“新春第一會”——高質(zhì)量發(fā)展大會,奮進號角。廣汽集團黨委書記、董事長馮興亞作為省市重點產(chǎn)業(yè)高質(zhì)量發(fā)展代表參加會議,與產(chǎn)學(xué)研各界代表共聚一堂,共繪
    的頭像 發(fā)表于 02-07 10:18 ?921次閱讀

    弘信電子集團榮獲廈門市科學(xué)技術(shù)進步獎一等獎

    近日,廈門市召開全市科學(xué)技術(shù)大會,新一輪爭創(chuàng)國家區(qū)域科技創(chuàng)新中心的沖鋒號。
    的頭像 發(fā)表于 12-18 10:35 ?968次閱讀

    九聯(lián)科技與海思移動機頂盒集采落地開工宴

    凱歌而行,乘勢而上。近日,九聯(lián)&海思移動機頂盒集采項目落地開工宴火熱舉行,奮斗的號角,啟航?jīng)_鋒的征途!
    的頭像 發(fā)表于 12-17 11:15 ?1204次閱讀

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?1001次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍