近日,摩爾線程與智譜AI在人工智能領(lǐng)域開展了一輪深入的合作,共同對(duì)GPU大模型進(jìn)行了適配及性能測(cè)試。此次測(cè)試不僅涵蓋了大模型的推理能力,還涉及了基于摩爾線程夸娥(KUAE)千卡智算集群的大模型預(yù)訓(xùn)練,旨在全面評(píng)估摩爾線程GPU在大模型應(yīng)用中的性能表現(xiàn)。
在推理性能測(cè)試中,摩爾線程自研的全功能GPU展現(xiàn)出了卓越的性能。與基準(zhǔn)對(duì)比產(chǎn)品RTX 3090和RTX 4090相比,摩爾線程的GPU在全部測(cè)試用例中均優(yōu)于RTX 3090,而在多batch情況下更是超越了RTX 4090。這一結(jié)果充分證明了摩爾線程GPU在推理能力上的出色表現(xiàn),為用戶提供了更加高效、準(zhǔn)確的計(jì)算體驗(yàn)。
在訓(xùn)練性能測(cè)試中,摩爾線程夸娥千卡智算集群同樣展現(xiàn)出了強(qiáng)大的性能。測(cè)試結(jié)果顯示,夸娥千卡智算集群的訓(xùn)練精度與A100集群誤差在1%以內(nèi),這一數(shù)據(jù)足以證明其在訓(xùn)練過(guò)程中的精確度和穩(wěn)定性。同時(shí),夸娥千卡智算集群的性能擴(kuò)展系數(shù)超過(guò)90%,意味著在分布式計(jì)算環(huán)境下,該集群能夠充分利用各節(jié)點(diǎn)的計(jì)算能力,實(shí)現(xiàn)高效的并行計(jì)算。此外,模型算力利用率(MFU)與A100集群相當(dāng),進(jìn)一步證明了夸娥千卡智算集群在大模型訓(xùn)練中的高效性。
此次測(cè)試的成功不僅為摩爾線程和智譜AI的合作奠定了堅(jiān)實(shí)的基礎(chǔ),也為雙方在人工智能領(lǐng)域的深入探索提供了有力的技術(shù)支撐。未來(lái),雙方將繼續(xù)攜手合作,共同推動(dòng)GPU大模型在更多領(lǐng)域的應(yīng)用和發(fā)展。
-
AI
+關(guān)注
關(guān)注
89文章
37542瀏覽量
293462 -
人工智能
+關(guān)注
關(guān)注
1813文章
49596瀏覽量
260130 -
摩爾線程
+關(guān)注
關(guān)注
2文章
250瀏覽量
6079
發(fā)布評(píng)論請(qǐng)先 登錄
華為CANN與智譜GLM端側(cè)模型完成適配
摩爾線程亮相WAIC 2025:以“AI工廠”理念驅(qū)動(dòng)算力進(jìn)化,全棧AI應(yīng)用賦能千行百業(yè)
摩爾線程“AI工廠”:五大核心技術(shù)支撐,打造大模型訓(xùn)練超級(jí)工廠
摩爾線程“AI工廠”:以系統(tǒng)級(jí)創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施
摩爾線程率先支持騰訊混元-A13B模型
摩爾線程與AI算力平臺(tái)AutoDL達(dá)成深度合作
摩爾線程MTT S4000完成DeepSeek R1-671B大模型適配驗(yàn)證
摩爾線程GPU成功適配Deepseek-V3-0324大模型
摩爾線程與當(dāng)虹科技達(dá)成深度合作
摩爾線程GPU原生FP8計(jì)算助力AI訓(xùn)練
摩爾線程支持阿里云通義千問(wèn)QwQ-32B開源模型
摩爾線程完成DeepSeek開源庫(kù)FlashMLA和DeepGEMM適配
摩爾線程圖形顯卡MTT S80實(shí)現(xiàn)DeepSeek模型部署

摩爾線程與智譜AI完成大模型性能測(cè)試與適配
評(píng)論