亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

寒武紀(jì)引領(lǐng)AI芯片軟件新生態(tài)

寒武紀(jì)開發(fā)者 ? 來源:寒武紀(jì)開發(fā)者 ? 2025-11-06 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寒武紀(jì)成立的初衷是為“人工智能的大爆發(fā)”提供底層算力支持,不僅要硬件算力強(qiáng)大,更要軟件通用、易用。多年來,寒武紀(jì)堅(jiān)持訓(xùn)練推理融合、統(tǒng)一的基礎(chǔ)軟件平臺研發(fā)策略,構(gòu)建從自研芯片架構(gòu)到高性能軟件平臺的完整體系,實(shí)現(xiàn)了計(jì)算架構(gòu)、編譯優(yōu)化與算法調(diào)度的深度融合:硬件為算法提供極致的并行性能與能效比,軟件則通過編譯優(yōu)化、調(diào)度策略與模型適配,讓每一份算力都被充分釋放。

寒武紀(jì)基礎(chǔ)軟件平臺CambriconNeuWare,讓用戶與開發(fā)者能夠跨越不同的寒武紀(jì)硬件和應(yīng)用場景,降低上手難度,提升開發(fā)效率,快速遷移與部署AI應(yīng)用。經(jīng)過多年投入與積累,寒武紀(jì)基礎(chǔ)軟件平臺CambriconNeuWare已經(jīng)日趨成熟,全面兼容社區(qū)最新PyTorch版本和Triton算子開發(fā)語言,支持用戶模型和自定義算子快速遷移。經(jīng)過持續(xù)的全棧優(yōu)化,Cambricon NeuWare基礎(chǔ)軟件平臺在多項(xiàng)指標(biāo)上都已達(dá)到業(yè)界領(lǐng)先水平,特別針對當(dāng)前業(yè)界極具挑戰(zhàn)的大規(guī)模集群運(yùn)維實(shí)踐,進(jìn)一步豐富和完善了多項(xiàng)集群工具,為大規(guī)模訓(xùn)練推理業(yè)務(wù)在集群環(huán)境中的部署運(yùn)維調(diào)試和調(diào)優(yōu)提供了堅(jiān)實(shí)的底座。

寒武紀(jì)大模型和搜廣推訓(xùn)推解決方案,已完成大規(guī)模技術(shù)和產(chǎn)品驗(yàn)證

大模型技術(shù)正成為智能經(jīng)濟(jì)的核心驅(qū)動力,深刻重塑人機(jī)交互的方式?!八褟V推”場景 —— 即搜索、廣告與推薦系統(tǒng) —— 成為大模型技術(shù)落地最具價(jià)值的前沿陣地之一。大模型賦能的搜廣推系統(tǒng),不僅帶來用戶體驗(yàn)的顯著提升,更重塑了流量分發(fā)的邏輯:讓“找信息”、“看內(nèi)容”、“買東西”從被動推薦走向主動理解,從關(guān)鍵詞匹配邁向意圖洞察。

大模型與“搜廣推”的融合,不僅是一場技術(shù)革新,更是商業(yè)模式的再造。寒武紀(jì)在大模型與搜廣推的訓(xùn)練推理上,都已完成了大規(guī)模的技術(shù)和產(chǎn)品驗(yàn)證。

在搜廣推訓(xùn)練方向,寒武紀(jì)穩(wěn)步推進(jìn)技術(shù)和產(chǎn)品驗(yàn)證。驗(yàn)證結(jié)果表明,解決方案可支撐多場景下的流式訓(xùn)練任務(wù),可持續(xù)超數(shù)月穩(wěn)定運(yùn)行,精度與穩(wěn)定性均滿足要求。持續(xù)性能優(yōu)化方面,完成Layernorm/RMSNorm/L2Norm等多種圖匹配融合,顯著提升性能。在圖融合基礎(chǔ)上進(jìn)一步優(yōu)化XLA支持,并獲得更顯著的加速比結(jié)果。

在大模型訓(xùn)練方向,寒武紀(jì)重點(diǎn)支持DeepSeek V3/V3.1、Qwen2.5/Qwen3/Qwen3-next等MoE類模型訓(xùn)練,同時(shí)擴(kuò)展了GLM4.5、Flux、Wan2.1/2.2、Qwen3-VL、Hunyuan-Video等模型的訓(xùn)練支持?;谠鶩P8的計(jì)算能力,新增Qwen/DeepSeek等系列網(wǎng)絡(luò)FP8的訓(xùn)練支持,精度符合預(yù)期。

在大模型推理方向,寒武紀(jì)研究并實(shí)踐W4A4以及MX-FP8/MX-FP4等新型數(shù)據(jù)類型,探索并支持多種高效注意力機(jī)制,包括SparseAttention與Linear Attention。

寒武紀(jì)緊跟先進(jìn)模型的演進(jìn),支持Qwen-Omni等多模態(tài)融合模型、Hunyuan3D等3D生成模型、CosyVoice等語音生成模型,以及DLM和VLM等新興架構(gòu),確保技術(shù)棧的先進(jìn)性與完備性。

值得一提的是,通過深度的生態(tài)合作,針對DeepSeek V3.2-Exp模型,寒武紀(jì)實(shí)現(xiàn)發(fā)布即適配的支持,并與合作伙伴同步開源適配代碼。

與此同時(shí),持續(xù)優(yōu)化vLLM推理引擎,完善混合精度低比特量化推理機(jī)制,支持通算并行優(yōu)化,支持PD分離部署,支持基于類IBGDA的極致低時(shí)延大規(guī)模專家并行,支持Torch.compile特性優(yōu)化主機(jī)側(cè)瓶頸,實(shí)現(xiàn)了大模型應(yīng)用的全方位加速。

寒武紀(jì)持續(xù)開展對DeepSeek、Qwen、Wan、Hunyuan等系列最新開源模型的極致性能優(yōu)化,并專項(xiàng)攻堅(jiān)長序列與超低解碼延時(shí)等場景的性能優(yōu)化,持續(xù)保持性能領(lǐng)先優(yōu)勢。

寒武紀(jì)能夠在大模型與“搜廣推”訓(xùn)推方面取得快速突破,完成大規(guī)模技術(shù)和產(chǎn)品驗(yàn)證,源于寒武紀(jì)長期的技術(shù)深耕與軟硬協(xié)同能力。正是這種軟硬一體、兼具性能領(lǐng)先與部署高效的核心競爭力,讓寒武紀(jì)能夠快速獲得市場信任和認(rèn)可。

e33f8a8c-b8a2-11f0-8c8f-92fbcf53809c.jpg

▲ 寒武紀(jì)基礎(chǔ)軟件平臺Cambricon NeuWare,圖中僅列舉部分組件,相關(guān)縮寫詞注釋請見文末。

驅(qū)動和運(yùn)行時(shí)庫

底層驅(qū)動的高穩(wěn)定性是業(yè)務(wù)部署的重要前置條件,寒武紀(jì)的驅(qū)動支撐業(yè)務(wù)運(yùn)行數(shù)月不停機(jī)。同時(shí),寒武紀(jì)的驅(qū)動在業(yè)務(wù)優(yōu)化迭代中,大幅提升了吞吐能力,在極具挑戰(zhàn)的搜廣推和大模型推理場景中,最大限度地消除了主機(jī)側(cè)瓶頸,為端到端達(dá)成領(lǐng)先的計(jì)算效率打下了堅(jiān)實(shí)的基礎(chǔ)。寒武紀(jì)通過細(xì)粒度的并行技術(shù),解耦數(shù)據(jù)依賴和調(diào)度依賴,極限壓榨Kernel函數(shù)的吞吐能力,疊加多路DSA異步調(diào)度和協(xié)同優(yōu)化,Kernel函數(shù)調(diào)度吞吐可達(dá)每秒幾十萬個(gè)任務(wù),實(shí)現(xiàn)業(yè)界領(lǐng)先的Kernel吞吐能力。

全面支持Kernel graph的批量下發(fā)功能,可運(yùn)行時(shí)匯聚多個(gè)算子單次下發(fā),支持在設(shè)備側(cè)駐留和下發(fā),實(shí)現(xiàn)極低延遲的多Kernel下發(fā),延時(shí)水平與國際競品相當(dāng)。

增加類IBGDA接口,為通信庫進(jìn)行極低時(shí)延的專家并行通信提供系統(tǒng)保障。

支持豐富的設(shè)備切分使用場景:

visible cluster:運(yùn)行時(shí)可編程的彈性拆分,可用于快速部署;

sMLU:基于時(shí)分復(fù)用技術(shù),可用于docker快速部署;

MIM:物理劃分,全面對標(biāo)國際競品MIG技術(shù)。

編譯器和調(diào)試調(diào)優(yōu)工具

BANG C語言是寒武紀(jì)BANG異構(gòu)并行編程模型的編程語言,在C/C++語言基礎(chǔ)上針對MLU架構(gòu)特點(diǎn)進(jìn)行擴(kuò)展,可以高效編寫在MLU上運(yùn)行的并行程序,充分利用MLU大規(guī)模并行架構(gòu)來加速計(jì)算任務(wù)。BANG C支持豐富的編譯優(yōu)化技術(shù),包括鏈接時(shí)優(yōu)化(LTO)、基于Profiling反饋優(yōu)化(PGO)、基于函數(shù)調(diào)用關(guān)系的函數(shù)級片上空間復(fù)用、Device側(cè)動態(tài)鏈接機(jī)制、編譯器靜態(tài)推導(dǎo)訪存指令地址空間、任務(wù)內(nèi)并行指令流自動同步算法、優(yōu)化內(nèi)存依賴分析、指令級并行的局部指令調(diào)度、全局指令調(diào)度以及符合MLU架構(gòu)的高性能指令布局優(yōu)化。通過這一系列技術(shù),最大限度的發(fā)揮芯片的全部潛力,如矩陣乘法等算子可達(dá)業(yè)界領(lǐng)先的效率。

持續(xù)快速迭代Triton算子開發(fā)語言,支持Triton 3.4所有特性,包括FP8/FP4的數(shù)據(jù)類型。 引入fast libentry,優(yōu)化Triton Kernel的主機(jī)端開銷,在小Workload場景性能提升顯著。Triton編譯器后端實(shí)現(xiàn)多種優(yōu)化:

優(yōu)化軟件流水的片上ram占用,優(yōu)化軟件流水的并發(fā)度,實(shí)現(xiàn)平衡軟件流水性能和單指令性能的自動軟件流水方案;

實(shí)現(xiàn)指令并行、片上ram占用、指令延遲掩蓋等多目標(biāo)的指令調(diào)度優(yōu)化;

實(shí)現(xiàn)任務(wù)并行的自動調(diào)優(yōu)和自動調(diào)度;

實(shí)現(xiàn)自動循環(huán)合并;

實(shí)現(xiàn)基于算子語義的訪存和計(jì)算優(yōu)化,如transpose穿透和合并、slice、broadcast穿透等;

優(yōu)化指令融合和指令選擇的性能建模。

通過上述優(yōu)化,提升了TritonKernel性能泛化性,其中Matmul、FlashAttention類和HSTU類算子性能提升明顯,部分熱點(diǎn)算子已經(jīng)與手寫算子性能相當(dāng)。

進(jìn)一步完善系統(tǒng)和算子的調(diào)試調(diào)優(yōu)工具:支持算子core dump,實(shí)現(xiàn)異?,F(xiàn)場的核心轉(zhuǎn)存,提供精準(zhǔn)現(xiàn)場和調(diào)試信息對應(yīng)關(guān)系,提供core dump文件解析工具,可快速分析定位算子出現(xiàn)異常的根因。

在主機(jī)側(cè)與設(shè)備側(cè)并行度調(diào)優(yōu)方面,CNPerf可在極低跟蹤開銷的情況下實(shí)現(xiàn)全維度性能數(shù)據(jù)采集,可精準(zhǔn)捕獲主機(jī)側(cè)與設(shè)備側(cè)執(zhí)行流、PMU性能指標(biāo)、函數(shù)調(diào)用棧等關(guān)鍵信息,支持Kernel計(jì)算、內(nèi)存拷貝、通信任務(wù)等多類型任務(wù)追蹤,覆蓋從底層硬件到上層應(yīng)用的全棧性能數(shù)據(jù)。CNPerf-GUI智能調(diào)優(yōu)能力突出,內(nèi)置專家建議系統(tǒng)可自動檢測設(shè)備空泡、利用率不足、集合通信等待等問題,精準(zhǔn)定位熱點(diǎn)算子與性能瓶頸。此外CNPerf-GUI針對多機(jī)多卡場景,額外提供多日志自動對時(shí)與集群迭代分析等功能,進(jìn)一步簡化用戶在復(fù)雜場景下的調(diào)優(yōu)復(fù)雜度。

在單算子調(diào)優(yōu)方面,CNPerf可支持GHz采樣頻率的硬件工作狀態(tài)采樣,精準(zhǔn)記錄MLU前后端工作狀態(tài)。用戶可基于該功能分析流間/核間同步、算子軟件流水排布等問題,最大化利用硬件后端資源。

CNPerf-GUI適配Linux、macOS、Windows多平臺,支持CNPerf、PyTorch Profiler、Tensorflow Profiler、CNTrainKit等日志格式,且支持超大日志文件(上億函數(shù)記錄)的快速加載及流暢操作。

新增程序正確性分析工具CNSantizer,使用運(yùn)行時(shí)插樁技術(shù)自動完成多核間競爭訪問檢測、單核內(nèi)多指令流競爭訪問檢測、Device側(cè)內(nèi)存越界訪問檢測、未定義程序行為檢測、使用未初始化內(nèi)存檢測等。

新增程序性能分析和調(diào)優(yōu)建議工具CNAdvisor,使用運(yùn)行時(shí)插樁采集以及硬件性能計(jì)數(shù)器采集方式獲取程序運(yùn)行時(shí)狀態(tài),并根據(jù)性能調(diào)優(yōu)經(jīng)驗(yàn)庫,自動分析程序性能問題并標(biāo)記出對應(yīng)源代碼位置,進(jìn)一步給出優(yōu)化建議。

算子庫

寒武紀(jì)計(jì)算庫積極擁抱開源社區(qū)的技術(shù)演進(jìn),持續(xù)迭代打磨核心基礎(chǔ)算子的功能、性能和穩(wěn)定性,更快更好地支持在寒武紀(jì)智能芯片上高效、穩(wěn)定地運(yùn)行開源和私有模型。計(jì)算庫針對搜廣推、大語言模型、文生圖和文生視頻等熱點(diǎn)場景做了深入的功能擴(kuò)展和性能優(yōu)化:

大規(guī)模Embedding Table稀疏訪存和計(jì)算極致優(yōu)化,性能與GPU競品相當(dāng);

GEMM/BatchGEMM/GroupGEMM等矩陣乘類算子性能泛化得到顯著增強(qiáng),大規(guī)模矩陣乘HFU達(dá)到行業(yè)領(lǐng)先水平;

矩陣乘類算子支持多種社區(qū)公開/私有定制的低精度量化功能;

支持類CUTLASS GEMM模板庫的擴(kuò)展開發(fā)和AutoTuning;

Attention類算子在低精度加速等方向的探索和研發(fā)成果已成功完成驗(yàn)證,獲得良好的加速效果;

支持大語言模型使用的MTP技術(shù),開發(fā)了用于優(yōu)化MTP性能的Top-k和Top-p采樣、隨機(jī)采樣等融合算子。

為支持計(jì)算庫的持續(xù)快速迭代,保障計(jì)算庫軟件質(zhì)量的同時(shí)做到精度性能不回退,寒武紀(jì)計(jì)算庫團(tuán)隊(duì)還打造了可靠的維測平臺,提供了豐富的維測工具,開發(fā)了高覆蓋度的功能性能測例,并制定了科學(xué)的驗(yàn)收標(biāo)準(zhǔn)。

分布式通信庫

通信庫針對大規(guī)模場景進(jìn)行專項(xiàng)優(yōu)化:新增HDR/DBT等Allreduce通信算法,優(yōu)先提升大規(guī)模條件下的通信帶寬,對Alltoall操作進(jìn)行深度優(yōu)化,使其大規(guī)模擴(kuò)展性達(dá)到與國際主流競品相當(dāng)?shù)乃健Mㄐ艓焱郊訌?qiáng)可維可測相關(guān)的功能,支持在線打點(diǎn)、模塊化日志、高可靠服務(wù)模塊等,幫助用戶能夠快速分析通信下發(fā)錯(cuò)誤,異常卡死等問題,提高集群通信可用性。通信庫通過在Kernel支持RoCE網(wǎng)卡的RDMA操作(類IBGDA)顯著優(yōu)化大規(guī)模專家并行場景下的ALL2ALL通信延遲,提升了MoE類模型推理任務(wù)的端到端吞吐。

集群工具

CntrainKit-Accu(大規(guī)模集群精度定位工具):為萬卡分布式訓(xùn)練場景提供端到端精度定位,提供精度指標(biāo)在線監(jiān)控,并針對精度問題進(jìn)行自動化分級、采集信息、智能分析并提供對應(yīng)解決方案。CntrainKit-Accu工具還全面支持NaN/Inf異常檢測與快速定位,實(shí)現(xiàn)異常點(diǎn)級別的秒級溯源,大大提升大模型和搜廣推等場景的大規(guī)模訓(xùn)練精度問題排查效率,讓每一次精度問題都能被精準(zhǔn)捕獲。

CntrainKit-Monitor(大規(guī)模集群監(jiān)控調(diào)優(yōu)工具):實(shí)現(xiàn)對萬卡級集群訓(xùn)練任務(wù)的實(shí)時(shí)通信與算子性能畫像,具備毫秒級任務(wù)健康可視化能力,支持算子粒度的性能剖析,識別AI作業(yè)中的性能瓶頸。具備萬卡規(guī)模訓(xùn)練任務(wù)的“可觀、可查、可優(yōu)”能力,真正實(shí)現(xiàn)大規(guī)模集群的“問題自感知”。

CNCE(集群監(jiān)管平臺):構(gòu)建覆蓋計(jì)算、網(wǎng)絡(luò)、存儲的數(shù)據(jù)中心全景監(jiān)控體系,實(shí)現(xiàn)對十萬卡級算力集群的秒級狀態(tài)采集與拓?fù)淇梢暬F脚_具備自動發(fā)現(xiàn)、智能診斷、自動處理的閉環(huán)故障管理能力,支持萬卡級任務(wù)的多維異常診斷與根因定位,讓用戶專注于算法創(chuàng)新與模型訓(xùn)練,無需再為底層硬件波動分心。CNCE的上線使集群運(yùn)維從“人工巡檢”邁向“智能自治”,顯著提升大規(guī)模AI訓(xùn)練的可用性與穩(wěn)定性。

CNAnalyzeInsight(故障分析工具):CNAnalyzeInsight是智能日志分析與根因診斷引擎,支持對GB級日志的秒級檢索與多維聚合分析。具備在線實(shí)時(shí)診斷告警與離線快速分析雙模式,能夠?qū)崿F(xiàn)“異常發(fā)現(xiàn)、問題定位、原因歸納、修復(fù)建議生成”的故障診斷閉環(huán),顯著提升訓(xùn)練任務(wù)的穩(wěn)定性與問題處理效率。

開源與框架

寒武紀(jì)快速跟進(jìn)社區(qū)PyTorch的進(jìn)展,支持PyTorch 2.1到PyTorch 2.8的全部社區(qū)版本。適配了包括DDP、FSDP、FSDP2、HSDP、Tensor Parallelism、Context Parallel、Pipeline Parallelism、SDPA、Inductor、MLU Graph、AOTInductor以及Inductor cppwrapper等一系列關(guān)鍵功能。Torch compile性能整體上追平GPUcompile加速比,高效支撐了產(chǎn)品在多個(gè)訓(xùn)練和推理場景下的成功驗(yàn)證。

寒武紀(jì)還提供GPU Migration一鍵遷移工具,幫助用戶近乎零成本將模型從GPU遷移到MLU。同時(shí)配備TorchDump精度調(diào)試工具和Torch Profiler性能調(diào)試工具,助力用戶高效定位和解決精度和性能問題。

此外,寒武紀(jì)還支持PyTorch Lightning、TorchTitan、TorchRec等社區(qū)生態(tài),并建立快速跟進(jìn)社區(qū)版本的長效機(jī)制,可在社區(qū)版本發(fā)布后2周內(nèi)實(shí)現(xiàn)MLU適配版本的發(fā)布。

通過近十年的持續(xù)打磨迭代,寒武紀(jì)已構(gòu)建出一套高效、易用、穩(wěn)定、成熟且具備高可擴(kuò)展性的軟硬一體化產(chǎn)品體系。憑借領(lǐng)先的芯片技術(shù)與完善的基礎(chǔ)軟件平臺,寒武紀(jì)產(chǎn)品已經(jīng)在大模型、搜廣推、圖片與視頻生成和各類多模態(tài)的訓(xùn)練與推理場景中成功完成驗(yàn)證,贏得廣泛認(rèn)可。

在此過程中,寒武紀(jì)產(chǎn)品不斷接受更多大規(guī)模場景高強(qiáng)度檢驗(yàn),推動軟件平臺與芯片體系持續(xù)進(jìn)化,形成了“應(yīng)用促進(jìn)優(yōu)化、優(yōu)化推動更強(qiáng)應(yīng)用”的良性循環(huán)。

通過為用戶提供更高效、更穩(wěn)定、更廣覆蓋的支持,寒武紀(jì)加速賦能產(chǎn)業(yè)智能化轉(zhuǎn)型,推動AI能力真正走進(jìn)千行百業(yè)。 “讓機(jī)器更好地理解和服務(wù)人類”,寒武紀(jì)的愿景正在一步一步成為現(xiàn)實(shí)。

*寒武紀(jì)基礎(chǔ)軟件平臺Cambricon NeuWare圖中標(biāo)注的縮寫詞全稱:

1. Cambricon HLO:機(jī)器學(xué)習(xí)模型高級操作集(HLO)的寒武紀(jì)后端;

2. CNNL:Cambricon Network Library,寒武紀(jì)人工智能計(jì)算庫;

3. CNNL-Extra:Cambricon CNNL Extra,寒武紀(jì)人工智能計(jì)算庫的擴(kuò)展庫;

4. CNCV: Cambricon Computer Vision Library,寒武紀(jì)計(jì)算機(jī)視覺庫;

5. CNCL:Cambricon Communications Library,寒武紀(jì)高性能通信庫;

6. CNFFmpeg:Cambricon FFmpeg,基于開源FFmpeg開發(fā)的硬件加速庫;

7. CNCC:Cambricon Compiler Collection,寒武紀(jì)BANG C語言編譯器;

8. CNAS:Cambricon Assembler,寒武紀(jì)匯編器組件;

9. CNGDB:Cambricon GNU Debugger,寒武紀(jì)BANG C語言調(diào)試工具;

10. CNSanitizer:Cambricon Sanitizer,寒武紀(jì)代碼檢測工具;

11. CNPAPI:Cambricon Profiling API,寒武紀(jì)性能分析接口庫;

12. CNPerf:Cambricon Performance,寒武紀(jì)性能分析工具;

13. CNPerf-GUI:Cambricon Performance Graphical User Interface,寒武紀(jì)性能剖析圖形化工具;

14. CNMon:Cambricon Monitor,寒武紀(jì)設(shè)備監(jiān)控與管理命令行工具;

15. CNVS:Cambricon Validation Suite,寒武紀(jì)設(shè)備驗(yàn)證工具集;

16. CNFieldiag:Cambricon Field Diagnostic,寒武紀(jì)現(xiàn)場診斷工具;

17. CNAnalyzeInsight:寒武紀(jì)故障分析工具;

18. CNCL-benchmark:Cambricon Communications Library Benchmark,寒武紀(jì)通信庫性能基準(zhǔn)測試工具;

19. Cambricon Device Plugin:寒武紀(jì)設(shè)備插件;

20. CCOMP:Cambricon Cluster Operation Management Platform,寒武紀(jì)智算運(yùn)管平臺。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 寒武紀(jì)
    +關(guān)注

    關(guān)注

    13

    文章

    211

    瀏覽量

    74763
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2043

    瀏覽量

    36487
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3396

    瀏覽量

    4874

原文標(biāo)題:易用好用,寒武紀(jì)引領(lǐng)AI芯片軟件新生態(tài)

文章出處:【微信號:Cambricon_Developer,微信公眾號:寒武紀(jì)開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里放大招:自研AI芯片100%國產(chǎn),不用臺積電代工

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)8 月 31 日晚間,有消息稱阿里云通義千問大模型面臨算力缺口,阿里緊急追加寒武紀(jì)思元 370 芯片訂單至 15 萬片。然而,該消息隨后不久便被阿里云相關(guān)人士辟謠
    的頭像 發(fā)表于 09-03 09:17 ?9893次閱讀

    寒武紀(jì)“炸裂”財(cái)報(bào)!一季度營收增長40倍,積極備貨應(yīng)對“爆單”?

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)寒武紀(jì),交出一份炸裂財(cái)報(bào)!在4月18日,寒武紀(jì)公布了2024年年報(bào)和2025年一季度報(bào)告,其中2024年全年?duì)I收11.74億元,同比增長65.56%;虧損4.52億元
    的頭像 發(fā)表于 04-22 09:07 ?2412次閱讀
    <b class='flag-5'>寒武紀(jì)</b>“炸裂”財(cái)報(bào)!一季度營收增長40倍,積極備貨應(yīng)對“爆單”?

    寒武紀(jì)3000億市值與GPU廠商密集IPO,AI芯片正是當(dāng)打之年

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)就在最近,寒武紀(jì)市值沖上3000億元,創(chuàng)造了半導(dǎo)體企業(yè)的市值奇跡。2024年1月10日收盤當(dāng)天寒武紀(jì)股價(jià)報(bào)729.97元,上漲2.48%,市值3047億元。盤中最
    的頭像 發(fā)表于 01-20 08:16 ?4379次閱讀
    <b class='flag-5'>寒武紀(jì)</b>3000億市值與GPU廠商密集IPO,<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>正是當(dāng)打之年

    商湯科技與寒武紀(jì)達(dá)成戰(zhàn)略合作

    近日,商湯科技與中科寒武紀(jì)科技股份有限公司(以下簡稱“寒武紀(jì)”)簽署面向新發(fā)展階段的戰(zhàn)略合作協(xié)議,重點(diǎn)推進(jìn)軟硬件的聯(lián)合優(yōu)化,并共同構(gòu)建開放共贏的產(chǎn)業(yè)生態(tài)
    的頭像 發(fā)表于 10-15 17:54 ?450次閱讀

    寒武紀(jì)成功適配DeepSeek-V3.2-Exp模型

    2025年9月29日,寒武紀(jì)已同步實(shí)現(xiàn)對深度求索公司最新模型DeepSeek-V3.2-Exp的適配,并開源大模型推理引擎vLLM-MLU源代碼。代碼地址和測試步驟見文末,開發(fā)者可以在寒武紀(jì)軟硬件平臺上第一時(shí)間體驗(yàn)DeepSeek-V3.2-Exp的亮點(diǎn)。
    的頭像 發(fā)表于 10-11 17:14 ?1023次閱讀
    <b class='flag-5'>寒武紀(jì)</b>成功適配DeepSeek-V3.2-Exp模型

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    : 介紹了7家ASIC的新創(chuàng)公司: Tachyum、Cerebras、SambaNova、Graphcore、Esperanto、Groq、Etched AI 還介紹了中國的AI芯片公司:中科
    發(fā)表于 09-12 16:07

    寒武紀(jì)股價(jià)破1200大關(guān)創(chuàng)歷史新高 DeepSeek適配國產(chǎn)芯片成直接原因

    今日,寒武紀(jì)股價(jià)突破1200元!8月單月漲幅100%、市值站上5200億,成為繼貴州茅臺之后的A股史上第二只千元股。 01 半導(dǎo)體芯片股集體爆發(fā) 寒武紀(jì)是中國AI
    的頭像 發(fā)表于 08-26 13:54 ?622次閱讀
    <b class='flag-5'>寒武紀(jì)</b>股價(jià)破1200大關(guān)創(chuàng)歷史新高 DeepSeek適配國產(chǎn)<b class='flag-5'>芯片</b>成直接原因

    寒武紀(jì)85后創(chuàng)始人陳天石身價(jià)超1500億

    芯片生產(chǎn)和DeepSeek適配國產(chǎn)芯片的利好刺激下,加之還有國外投行高盛宣布將寒武紀(jì)-U目標(biāo)價(jià)上調(diào)50%至1835元,AI芯片龍頭
    的頭像 發(fā)表于 08-26 10:37 ?5931次閱讀

    寒武紀(jì)聯(lián)手階躍星辰成立模芯生態(tài)創(chuàng)新聯(lián)盟

    近日,階躍星辰發(fā)布了新一代基礎(chǔ)大模型Step 3。Step 3兼顧智能與效率,通過模型和系統(tǒng)聯(lián)合創(chuàng)新,實(shí)現(xiàn)了行業(yè)前列的推理解碼效率,將于7月31日面向全球企業(yè)和開發(fā)者開源。目前,寒武紀(jì)已初步實(shí)現(xiàn)對Step 3的支持。
    的頭像 發(fā)表于 07-31 11:26 ?881次閱讀

    寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊詳解

    MLU370-X8智能加速卡是全面升級的數(shù)據(jù)中心訓(xùn)推一體AI加速卡,基于寒武紀(jì)全新一代思元370芯片,接口為PCIe 4.0 X16,是全高全長雙寬(FHFL-Dual-Slot)的標(biāo)準(zhǔn)PCIe加速卡,適用于業(yè)內(nèi)最新的CPU平臺
    的頭像 發(fā)表于 04-24 17:57 ?3604次閱讀
    <b class='flag-5'>寒武紀(jì)</b>基于思元370<b class='flag-5'>芯片</b>的MLU370-X8 智能加速卡產(chǎn)品手冊詳解

    寒武紀(jì)思元370芯片參數(shù)特性詳解

    寒武紀(jì)首次采用chiplet技術(shù)將2顆AI計(jì)算芯粒封裝為一顆AI芯片,通過不同芯粒組合規(guī)格多樣化的產(chǎn)品,為用戶提供適用不同場景的高性價(jià)比AI
    的頭像 發(fā)表于 04-24 17:49 ?3936次閱讀
    <b class='flag-5'>寒武紀(jì)</b>思元370<b class='flag-5'>芯片</b>參數(shù)特性詳解

    寒武紀(jì)一季度營收大漲4230% 凈利潤3.55億 扭虧為盈

    4月18日晚間,國產(chǎn)AI芯片龍頭寒武紀(jì)發(fā)布了財(cái)務(wù)報(bào)告,包括有2025年第一季度財(cái)務(wù)報(bào)告和2024年年度財(cái)務(wù)報(bào)告。 在2025年第一季度,寒武紀(jì)營收達(dá)到11.11億,同比增長高達(dá)4230
    的頭像 發(fā)表于 04-19 14:15 ?1494次閱讀

    美國業(yè)務(wù)收入占比低,寒武紀(jì)等回應(yīng)加征關(guān)稅

    4月9日,寒武紀(jì)公告稱,公司收入主要來自境內(nèi)客戶,境外收入占比較低,2023年及2024年公司境外客戶收入占比均未超過1%。2022年12月美國商務(wù)部工業(yè)和安全局將公司列入實(shí)體清單,對公司采購美系
    發(fā)表于 04-12 00:59 ?884次閱讀
    美國業(yè)務(wù)收入占比低,<b class='flag-5'>寒武紀(jì)</b>等回應(yīng)加征關(guān)稅

    寒武紀(jì)增資全資子公司上海寒武紀(jì)

    ,對上海寒武紀(jì)進(jìn)行增資。 此次增資是基于募投項(xiàng)目的實(shí)施進(jìn)展而做出的決策。寒武紀(jì)作為一家在人工智能芯片領(lǐng)域具有領(lǐng)先地位的企業(yè),一直致力于推動相關(guān)技術(shù)的研發(fā)和應(yīng)用。為了進(jìn)一步提升公司的競爭力和市場份額,
    的頭像 發(fā)表于 02-05 13:44 ?1411次閱讀

    寒武紀(jì)發(fā)布2024年度業(yè)績預(yù)告

    昨日晚間,國內(nèi)領(lǐng)先的智能芯片設(shè)計(jì)企業(yè)寒武紀(jì)發(fā)布了其2024年度的業(yè)績預(yù)告。據(jù)公告顯示,公司預(yù)計(jì)全年?duì)I業(yè)收入將在10.7億元至12億元之間,與去年同期相比,實(shí)現(xiàn)了50.83%至69.16%的顯著增長
    的頭像 發(fā)表于 01-15 10:30 ?1162次閱讀