動(dòng)態(tài)
-
發(fā)布了文章 2025-11-06 11:09
-
發(fā)布了文章 2025-11-03 15:34
-
上傳了資料 2025-10-29 14:00
-
上傳了資料 2025-10-29 13:58
-
上傳了資料 2025-10-29 13:55
-
發(fā)布了文章 2025-10-29 11:54
如何實(shí)現(xiàn)高效的RoCE網(wǎng)卡狀態(tài)采集與監(jiān)控?
當(dāng)下大規(guī)模AI訓(xùn)練成為常態(tài),RoCEv2憑借高性能、低延遲與低CPU開(kāi)銷的優(yōu)勢(shì),已成為構(gòu)建智算中心的優(yōu)先選擇。然而,RoCE對(duì)網(wǎng)絡(luò)無(wú)損的嚴(yán)苛要求,配置不當(dāng)會(huì)放大擁塞,如 PFC、ECN、Buffer滯留等引發(fā)的高延遲、性能下降等,而這些問(wèn)題統(tǒng)一表現(xiàn)為“GPU通信異?!薄6痦?xiàng)排查的操作相當(dāng)繁瑣。644瀏覽量 -
發(fā)布了文章 2025-10-22 14:23
-
發(fā)布了文章 2025-10-17 15:09
基于INT與Flowlet的自適應(yīng)路由:提升數(shù)據(jù)中心性能的關(guān)鍵
自適應(yīng)路由交換是一種智能的網(wǎng)絡(luò)數(shù)據(jù)轉(zhuǎn)發(fā)技術(shù)。它能夠讓網(wǎng)絡(luò)設(shè)備(如路由器、交換機(jī))實(shí)時(shí)地根據(jù)當(dāng)前網(wǎng)絡(luò)的狀況(如鏈路擁堵、故障),自動(dòng)地、動(dòng)態(tài)地為數(shù)據(jù)包選擇一條最優(yōu)的傳輸路徑。997瀏覽量 -
發(fā)布了文章 2025-10-14 14:43
-
發(fā)布了文章 2025-10-09 14:27
如何實(shí)現(xiàn) RoCE 配置的自動(dòng)同步(基礎(chǔ)篇) - DCBX協(xié)議
DCBX(Data Center Bridging Exchange)協(xié)議是實(shí)現(xiàn)數(shù)據(jù)中心網(wǎng)絡(luò)自動(dòng)化配置的核心技術(shù),能夠顯著降低運(yùn)維負(fù)擔(dān),減少因人工配置錯(cuò)誤導(dǎo)致的網(wǎng)絡(luò)故障。DCBX 為大規(guī)模組網(wǎng)中 RoCE 配置的自動(dòng)同步奠定了技術(shù)基礎(chǔ),具體內(nèi)容將在后續(xù)文章中深入介紹。681瀏覽量