亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為云黃瑾:昇騰云CloudMatrix 384超節(jié)點六大科技創(chuàng)新,定義下一代AI基礎設施

jf_21561199 ? 來源:jf_21561199 ? 2025-05-17 10:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,華為云 AI 峰會在北京召開,華為云副總裁黃瑾發(fā)表主題演講,介紹了更多 CloudMatrix 384超節(jié)點技術優(yōu)勢與細節(jié)。他指出,隨著大模型訓練和推理對算力需求的爆炸式增長,傳統(tǒng)計算架構已難以支撐 AI 技術的代際躍遷,超節(jié)點架構的誕生不僅是技術的突破,更是以工程化創(chuàng)新開辟 AI 產業(yè)的新路徑。華為云 CloudMatrix 384 超節(jié)點具備 MoE 親和、以網強算、以存強算、長穩(wěn)可靠、朝推夜訓、即開即用六大領先技術優(yōu)勢,以系統(tǒng)架構創(chuàng)新重新定義新一代 AI 基礎設施。

重新定義 AI 基礎設施架構,開辟算力新紀元

當前,大模型訓練從早期小模型在單卡訓練、小參數大模型在單機訓練,現在 MoE、長序列、多模態(tài)大模型都是在 AI 集群上訓練,AI 算力的瓶頸,從到單卡算力的瓶頸到單機內總線帶寬的瓶頸,到現在集群間通信帶寬的瓶頸,需求增長了 1 萬倍。

然而過去的 8 年里,單卡硬件的算力增長了 40 倍,但是節(jié)點內的總線帶寬只增長了 9 倍,跨節(jié)點的網絡帶寬只增長了 4 倍,這使得集群網絡通信成為當前大模型訓練和推理的最大挑戰(zhàn)。

黃瑾表示,面對這些挑戰(zhàn),華為云創(chuàng)新性的推出采用全對等互聯架構的 CloudMatrix 384 超節(jié)點。這項技術創(chuàng)新跳出單點技術限制走向系統(tǒng)性、工程性的創(chuàng)新算力架構直面通信效率瓶頸、內存墻制約、可靠性短板三大技術挑戰(zhàn)。通過新型高速互聯總線實現 384 張卡互聯成為一個超級云服務器,最高提供 300Pflops 的算力規(guī)模,比業(yè)界同類產品領先 67%。

解碼六大優(yōu)勢,CloudMatrix 384 超節(jié)點重構 AI 算力架構

目前,基于 CloudMatrix 的超節(jié)點集群已經在蕪湖、貴安、內蒙規(guī)模上線,黃瑾進一步深入解讀了六大技術創(chuàng)新點:

MoE 親和架構,從“小作坊”到“超級工廠”。在傳統(tǒng)架構下,MoE 模型訓練容易因通信延遲導致算力浪費,而 CloudMatrix 384 超節(jié)點的分布式推理平臺可以說是專為 MoE 大模型而生。黃瑾指出,對比一卡多專家的“小作坊模式”,超節(jié)點更像“大工廠模式”,通過高速互聯總線,能夠實現一卡一專家高效分布式推理,單卡的 MoE 計算和通信效率都大幅提升。這也是為什么有幾百個政務、零售、醫(yī)療、保險、制造、礦山、旅游等各行各業(yè)的客戶,基于華為云昇騰 AI 云服務部署 DeepSeek 模型的創(chuàng)新應用,例如智能助手、智能客服、互聯網搜索、內容創(chuàng)作等各種場景落地。

以網強算,雙層網絡破解“數據堵車”。當AI 算力走向規(guī)模化部署,單點的芯片性能不再是制約算力發(fā)展的唯一變量,如何由點及面地激活算力矩陣的共振效應,也是破解 AI 時代算力命題的關鍵一步。而釋放聯接力也正是超節(jié)點最大的創(chuàng)新突破之一,黃瑾介紹,傳統(tǒng)網絡像擁堵的城市道路,CloudMatrix 384 則構建了 AI 專屬高架橋,通過 MatrixLink 服務將單層網絡升級為兩層高速網絡,一層是超節(jié)點內部的 ScaleUp 總線網絡,確保超節(jié)點內 384 卡全對等高速無阻塞互聯,卡間超大帶寬 2.8T,納秒級時延;另一層是跨超節(jié)點間的 ScaleOut 網絡,可支持微秒級時延,資源彈性擴展;同時,基于全局拓撲感知的智能調度算法,保障客戶任務長穩(wěn)運行。

以存強算,彈性內存改寫“算存綁定”。華為云首創(chuàng)了 EMS 彈性內存存儲,打破傳統(tǒng) GPU 算力與顯存綁定的關鍵障礙,通過內存池化技術,實現顯存和算力解綁。一方面,用 EMS 替代 NPU 中的顯存,可使得首 Token 時延降低,最高降幅可達 80%;另一方面,當 NPU 的顯存不足時,EMS 獨立擴容,不必再通過堆 NPU 以獲得更多內存。同時,EMS 還支持算力卸載,這也使得系統(tǒng)吞吐量提升,有的場景達 100%的提升??傊?,這一技術創(chuàng)新大幅提升了資源利用率、性能和吞吐量。

長穩(wěn)可靠,故障自愈的“AI 醫(yī)生”。隨著模型訓練需求的不斷接入,大集群的運維難度大、復雜性高的問題日益凸顯。對此,華為云開發(fā)了昇騰云腦運維“1-3-10”標準,即 1 分鐘感知、3 分鐘定界、10 分鐘內恢復。通過 5 層壓測、靜默故障感知技術,昇騰云腦可將硬件故障感知率從 40%提升至 90%。同時,覆蓋計算、存儲、網絡、軟件四大種類故障模式庫也打通了全棧故障場景,這一全棧故障知識庫能夠覆蓋 95%常見問題以實現故障快速定界;在恢復機制上則,3 層快恢技術、快速建鏈技術、圖編譯緩存等技術能夠實現萬卡故障快速恢復。

朝推夜訓,算力資源“錯峰用電”。在大模型訓練中,提升算力利用率,避免算力閑置也是企業(yè)關心的重點之一。CloudMatrix384 超節(jié)點通過“訓推共池”“靈活調度”兩大關鍵技術實現朝推夜訓,白天進行模型推理,晚上閑時進行模型訓練,算力資源利用率可提升 30%以上。

即開即用,“算力水電”普惠模式。為助力客戶更好地專注業(yè)務模型開發(fā),華為云已經在全國三大樞紐數據中心——烏蘭察布、貴安和蕪湖完成了超節(jié)點規(guī)模布局,支持百 TB 級的帶寬互聯,10 毫秒時延圈覆蓋全國 19 個城市群,讓客戶能夠第一時間享受到即開即用的 AI 算力資源。同時,華為云擁有專業(yè)的超節(jié)點運維團隊,在為客戶免去繁瑣的管理和維護的同時,保障資源的穩(wěn)定運行。

做好智能世界云底座和使能器,加速行業(yè)智能躍遷

如今 AI 已經成為最有影響力的通用技術,如何將技術價值轉化為應用成果,成為千行百業(yè)面臨的核心課題。華為云超節(jié)點創(chuàng)新系統(tǒng)架構的背后,是華為云堅持“昇騰云服務支持百模千態(tài),盤古大模型重塑千行萬業(yè)”的戰(zhàn)略。

黃瑾強調,一直以來華為云持續(xù)推動昇騰 AI 云服務全面升級,通過打磨昇騰云的訓練、推理的性能、可靠性和性價比,為中國乃至全球客戶提供好用、易用的 AI 算力云服務。現已全面適配了 DeepSeek 在內的 160 多個大模型,以云服務的方式,協助客戶進行模型的開發(fā),訓練,托管和應用。昇騰 AI 云服務上線以來,面向政府、金融、零售、互聯網、交通、制造等行業(yè)已經服務六百多家創(chuàng)新先鋒企業(yè),加速行業(yè)智能化應用的快速落地。

在充滿突破和創(chuàng)新的 AI 發(fā)展過程中,每一個階段都會產生大量的新技術、新模式,企業(yè)唯有抓住 AI 時代機遇,才能搶占發(fā)展先機。黃瑾表示,面向智能世界,華為云致力于做好行業(yè)數字化的“云底座”和“使能器”,堅定打造 AI 算力底座,以安全、穩(wěn)定、高質量、持續(xù)創(chuàng)新的 AI 云服務,賦能千行萬業(yè)應用創(chuàng)新,攜手伙伴、客戶加速行業(yè)智能躍遷。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 云計算
    +關注

    關注

    39

    文章

    7996

    瀏覽量

    142678
  • AI
    AI
    +關注

    關注

    89

    文章

    37540

    瀏覽量

    293345
  • 華為云
    +關注

    關注

    3

    文章

    2800

    瀏覽量

    19032
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華為節(jié)點互聯技術引領AI基礎設施新范式

    今日,華為全聯接大會2025在上海啟幕,華為副董事長、輪值董事長徐直軍發(fā)表題為“以開創(chuàng)的節(jié)點互聯技術,引領AI
    的頭像 發(fā)表于 09-20 16:15 ?1493次閱讀

    商湯科技聯合華為騰實現節(jié)點適配多項創(chuàng)新

    近日,商湯大裝置SenseCore與384節(jié)點率先完成全面適配。
    的頭像 發(fā)表于 09-05 15:22 ?614次閱讀

    睿海光電領航AI光模塊:快交付與全場景兼容賦能智算時代——以創(chuàng)新實力助力全球客戶構建高效算力底座

    /ODM/JDM服務。通過AI驅動的供應鏈優(yōu)化算法,睿海光電實現了從原材料采購到成品交付的全流程提速,較行業(yè)平均水平快2-3天,為全球客戶搶占AI基礎設施部署先機提供強力支撐。 2.1 案例:某國際
    發(fā)表于 08-13 19:03

    重磅!華為384節(jié)點真機登場,中興攜廠商首秀GPU節(jié)點實力

    作為中國自主的算力核彈,華為384節(jié)點真機首次亮相。中興通訊、上海儀電、曦智科技、壁仞科技聯合打造的光互聯芯片及
    的頭像 發(fā)表于 07-29 00:45 ?1w次閱讀
    重磅!<b class='flag-5'>華為</b><b class='flag-5'>昇</b>騰<b class='flag-5'>384</b><b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>真機登場,中興攜廠商首秀GPU<b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>實力

    摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義一代AI基礎設施

    演講中表示,為應對生成式AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代AI訓練基礎設施,致力于為AGI時代打
    發(fā)表于 07-28 10:34 ?2252次閱讀
    摩爾線程“<b class='flag-5'>AI</b>工廠”:以系統(tǒng)級<b class='flag-5'>創(chuàng)新定義</b>新<b class='flag-5'>一代</b><b class='flag-5'>AI</b><b class='flag-5'>基礎設施</b>

    軟通動力攜手華為發(fā)布AI應用創(chuàng)新領航計劃

    華為開發(fā)者大會 2025期間,作為華為全球戰(zhàn)略合作伙伴,軟通動力受邀出席華為多場重要活動和會議。雙方聯合與伙伴
    的頭像 發(fā)表于 06-26 10:31 ?832次閱讀

    華為開發(fā)者大會2025(HDC 2025)亮點:華為發(fā)布盤古大模型5.5 宣布新一代AI服務上線

    HarmonyOS、AI服務、盤古大模型等最新科技創(chuàng)新成果。 在主題演講中,華為常務董事、華為
    的頭像 發(fā)表于 06-20 20:19 ?3700次閱讀
    <b class='flag-5'>華為</b>開發(fā)者大會2025(HDC 2025)亮點:<b class='flag-5'>華為</b><b class='flag-5'>云</b>發(fā)布盤古大模型5.5 宣布新<b class='flag-5'>一代</b><b class='flag-5'>昇</b>騰<b class='flag-5'>AI</b><b class='flag-5'>云</b>服務上線

    有關 AI 算力,華為騰刷新行業(yè)記錄

    電子發(fā)燒友網報道(文 / 吳子鵬)近日,GitCode 網站上更新了份題為《AI 算力集群基礎設施高可用技術系列報告》的文件。報告顯示,華為
    的頭像 發(fā)表于 06-16 01:08 ?5559次閱讀
    有關 <b class='flag-5'>AI</b> 算力,<b class='flag-5'>華為</b><b class='flag-5'>昇</b>騰刷新行業(yè)記錄

    NVIDIA 采用納微半導體開發(fā)新一代數據中心電源架構 800V HVDC 方案,賦能下一代AI兆瓦級算力需求

    全球 AI 算力基礎設施革新迎來關鍵進展。近日,納微半導體(Navitas Semiconductor, 納斯達克代碼:NVTS)宣布參與NVIDIA 英偉達(納斯達克股票代碼: NVDA) 下一代
    發(fā)表于 05-23 14:59 ?2430次閱讀
    NVIDIA 采用納微半導體開發(fā)新<b class='flag-5'>一代</b>數據中心電源架構 800V HVDC 方案,賦能<b class='flag-5'>下一代</b><b class='flag-5'>AI</b>兆瓦級算力需求

    華為節(jié)點創(chuàng)新算力基礎設施,推動千行萬業(yè)AI應用開發(fā)落地

    近日,“逐光向新·智領未來”華為 AI 峰會于北京成功舉辦。大會期間,華為面向客戶伙伴詳細介紹了 CloudMartix
    的頭像 發(fā)表于 05-17 10:30 ?2475次閱讀

    華為公布AI基礎設施架構突破性新進展

    近日,華為公司常務董事、華為計算CEO張平安在華為生態(tài)大會2025上公布了AI
    的頭像 發(fā)表于 04-12 15:09 ?1491次閱讀

    從虛擬化到AI基礎設施:Gartner定義下一代融合的“全?!甭窂?/a>

    近日,權威市場分析機構 Gartner 發(fā)布《2025 中國區(qū)融合市場競爭格局報告》,對中國融合市場的發(fā)展趨勢和主流廠商進行了深入解析。報告認為,中國融合市場已經達到了主流采用階段,
    的頭像 發(fā)表于 03-19 14:15 ?955次閱讀

    華為打造移動AI時代領先電信基礎設施

    使能平臺,助力運營商電信基礎設施從架構、自動化、綠色、AI等方面全面升級,從容應對復雜網絡挑戰(zhàn),使能AI業(yè)務創(chuàng)新,打造移動AI時代領先電信
    的頭像 發(fā)表于 03-08 11:39 ?1025次閱讀

    湖南 DeepSeek+騰云技術應用沙龍成功舉辦,拓維信息助力 AI 新范式探索

    近日,以“智共生·湘見未來”為主題的“湖南DeepSeek+騰云技術應用沙龍”在長沙成功舉辦。湖南本地企業(yè)開發(fā)者、企業(yè)技術負責人、AI領域研究者及
    的頭像 發(fā)表于 02-26 18:23 ?931次閱讀
    湖南 DeepSeek+<b class='flag-5'>昇</b><b class='flag-5'>騰云</b>技術應用沙龍成功舉辦,拓維信息助力 <b class='flag-5'>AI</b> 新范式探索

    百度李彥宏談訓練下一代大模型

    “我們仍需對芯片、數據中心和基礎設施持續(xù)投入,以打造更好、更智能的下一代模型。”
    的頭像 發(fā)表于 02-12 10:38 ?690次閱讀