完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > gpu
圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)上圖像運(yùn)算工作的微處理器。
文章:4812個(gè) 瀏覽:134148次 帖子:301個(gè)
在Roofline模型可以直觀展示一張曲線圖,其中x軸表示AI(Arithmetic Intensity),即每個(gè)內(nèi)存操作對應(yīng)的浮點(diǎn)運(yùn)算次數(shù);y軸表示性...
同一主機(jī)內(nèi)GPU之間的通信:通過NVLink技術(shù),雙向帶寬達(dá)到600GB/s,單向帶寬達(dá)到300GB/s。
2024-04-07 標(biāo)簽:數(shù)據(jù)傳輸NVIDIAgpu 3.2k 0
大模型訓(xùn)練如何應(yīng)對GPU萬卡互聯(lián)難題
為了增強(qiáng)對訓(xùn)練穩(wěn)定性和性能的監(jiān)控,開發(fā)了一個(gè)精度達(dá)到毫秒級(jí)的監(jiān)控系統(tǒng)。采用不同級(jí)別的監(jiān)控來跟蹤各種指標(biāo)。
2024-04-07 標(biāo)簽:gpu數(shù)據(jù)中心人工智能 1.2k 0
機(jī)器學(xué)習(xí)(ML)推理主要計(jì)算之存內(nèi)計(jì)算芯片
機(jī)器學(xué)習(xí)(ML)應(yīng)用已經(jīng)在汽車、醫(yī)療保健、金融和技術(shù)等各個(gè)領(lǐng)域變得無處不在。這導(dǎo)致對高性能、高能效 ML 硬件解決方案的需求不斷增加。
2024-04-07 標(biāo)簽:存儲(chǔ)器神經(jīng)網(wǎng)絡(luò)gpu 2.2k 2
RISC-V芯片新突破:CPU與GPU一體化核心設(shè)計(jì)
X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計(jì)將 CPU 和 GPU 的功能結(jié)合到單核架構(gòu)中。這與 Intel 和 AMD 的典型設(shè)計(jì)不同,后者有獨(dú)立...
鴻蒙OS元服務(wù)開發(fā):【W(wǎng)ebGL網(wǎng)頁圖形庫開發(fā)概述】
WebGL的全稱為Web Graphic Library(網(wǎng)頁圖形庫),主要用于交互式渲染2D圖形和3D圖形。目前HarmonyOS中使用的WebGL是...
人工智能成為所有人類事業(yè)的數(shù)字助手,擁有著巨大的機(jī)遇。ChatGPT是人工智能如何使高性能計(jì)算的使用民主化、為社會(huì)中的每個(gè)人帶來好處的一個(gè)很好的例子。
B100將采用雙Die架構(gòu)。如果采用異構(gòu)Die合封方式,封裝基板面積將小于當(dāng)前先進(jìn)封裝4倍Reticle面積的約束。而如果采用計(jì)算Die和IO Die分...
2024-04-02 標(biāo)簽:gpu芯片設(shè)計(jì)AI 2.1k 0
字節(jié)跳動(dòng)攻克GPU萬卡互聯(lián)技術(shù)突破與解決方案
在分布式訓(xùn)練中大規(guī)模使用默認(rèn)的DCQCN協(xié)議時(shí),all-to-all通信可能會(huì)導(dǎo)致?lián)砣蚉FC級(jí)別的提高。過度使用PFC可能會(huì)導(dǎo)致頭部阻塞(HoL),從...
2024-04-01 標(biāo)簽:gpu人工智能網(wǎng)絡(luò)拓?fù)?/a> 1.5k 0
以傳統(tǒng)三層架構(gòu)到葉脊架構(gòu)的轉(zhuǎn)變?yōu)槔~脊網(wǎng)絡(luò)架構(gòu)下,光模塊數(shù)量提升最高可達(dá)到數(shù)十倍。
傳統(tǒng)計(jì)算機(jī)視覺對比深度學(xué)習(xí)
深度學(xué)習(xí)是一種技術(shù),它使用一種稱為梯度反向傳播的優(yōu)化技術(shù)來生成“程序”(也稱為“神經(jīng)網(wǎng)絡(luò)”),就像上面故事中學(xué)者學(xué)生編寫的那些程序一樣。
2024-03-31 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)gpu人工智能 732 0
深度學(xué)習(xí)生成對抗網(wǎng)絡(luò)(GAN)全解析
GANs真正的能力來源于它們遵循的對抗訓(xùn)練模式。生成器的權(quán)重是基于判別器的損失所學(xué)習(xí)到的。因此,生成器被它生成的圖像所推動(dòng)著進(jìn)行訓(xùn)練,很難知道生成的圖像...
AIGC大模型對網(wǎng)絡(luò)的五大核心需求解析
AI 應(yīng)用計(jì)算量呈幾何級(jí)數(shù)增長,算法模型向巨量化發(fā)展,人工智能模型參數(shù)在過去十年增長了十萬倍,當(dāng)前AI超大模型的參數(shù)目前已經(jīng)達(dá)到了千億~萬億的級(jí)別。
GPU和顯卡的關(guān)系,就像是CPU和主板的關(guān)系。前者是顯卡的心臟,后者是主板的心臟。有些小伙伴會(huì)把GPU和顯卡當(dāng)成一個(gè)東西,其實(shí)還有些差別的,顯卡不僅包括...
FPGA(現(xiàn)場可編程門陣列)和GPU(圖形處理器)在多個(gè)方面存在顯著的區(qū)別。
在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉(zhuǎn)換會(huì)產(chǎn)生較大延時(shí),...
2024-03-27 標(biāo)簽:cpu數(shù)據(jù)傳輸NVIDIA 6.9k 0
英偉達(dá) DGX 服務(wù)器內(nèi)部細(xì)節(jié)詳解
在機(jī)架的最頂部,我們發(fā)現(xiàn)了幾個(gè) 52 端口 Spectrum 交換機(jī) — 48 個(gè)千兆位 RJ45 和四個(gè) QSFP28 100Gbps 聚合端口。
超算網(wǎng)絡(luò)中的主流拓?fù)浼軜?gòu)
傳統(tǒng)的樹形網(wǎng)絡(luò)拓?fù)渲?,帶寬是逐層收斂的,樹根處的網(wǎng)絡(luò)帶寬要遠(yuǎn)小于各個(gè)葉子處所有帶寬的總和。而Fat-Tree則更像是真實(shí)的樹,越到樹根,枝干越粗,即:從...
在計(jì)算機(jī)科學(xué)中,浮點(diǎn)數(shù)(floating points,簡稱浮點(diǎn))是表示非整數(shù)值的數(shù)據(jù)類型,例如6.2815或0.0044。
2024-03-25 標(biāo)簽:gpu超級(jí)計(jì)算機(jī)人工智能 1.1k 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
| 電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
| 伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |