完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>
標簽 > cuda
文章:100個 瀏覽:14371次 帖子:19個
單精度矩陣乘法(SGEMM)幾乎是每一位學習 CUDA 的同學繞不開的案例,這個經(jīng)典的計算密集型案例可以很好地展示 GPU 編程中常用的優(yōu)化技巧。本文將...
無需實例或類級別3D模型的對新穎物體的6D姿態(tài)追蹤
跟蹤RGBD視頻中物體的6D姿態(tài)對機器人操作很重要。然而,大多數(shù)先前的工作通常假設目標對象的CAD 模型,至少類別級別,可用于離線訓練或在線測試階段模板匹配。
總結FasterTransformer Encoder優(yōu)化技巧
FasterTransformer BERT 包含優(yōu)化的 BERT 模型、高效的 FasterTransformer 和 INT8 量化推理。
GPU和CPU之間的功能差異之所以存在,是因為它們的設計目標不同。雖然CPU被設計為盡可能快地執(zhí)行一系列操作(稱為線程),并且可以并行執(zhí)行幾十個線程,但...
神經(jīng)網(wǎng)絡能加速的有很多,當然使用硬件加速是最可觀的了,而目前除了專用的NPU(神經(jīng)網(wǎng)絡加速單元),就屬于GPU對神經(jīng)網(wǎng)絡加速效果最好了
2024-03-05 標簽:神經(jīng)網(wǎng)絡gpusram 1.5k 0
編程模型中介紹了核心語言擴展。它們允許程序員將內核定義為c++函數(shù),并在每次調用函數(shù)時使用一些新的語法來指定網(wǎng)格和塊維度。
NVIDIA DOCA GPUNetIO庫如何克服以前DPDK解決方案中的一些限制
網(wǎng)絡數(shù)據(jù)包的實時 GPU 處理是一種適用于幾個不同應用領域的技術,包括信號處理、網(wǎng)絡安全、信息收集和輸入重建。
近年來隨著大屏幕顯示技術在各領域應用的逐步深入,市場已經(jīng)不滿足單一的影片展示,更多的轉向了對互動性更強的計算機桌面環(huán)境的融合顯示上來。而目前市場上主流的...
換一批
編輯推薦廠商產(chǎn)品技術軟件/工具OS/語言教程專題
| 電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
| 伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術 | Microchip |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |