Paddle Lite飛槳多平臺(tái)高性能深度學(xué)習(xí)預(yù)測(cè)引擎
資料介紹
軟件簡(jiǎn)介
Paddle Lite為Paddle-Mobile的升級(jí)版,定位支持包括手機(jī)移動(dòng)端在內(nèi)更多場(chǎng)景的輕量化高效預(yù)測(cè),支持更廣泛的硬件和平臺(tái),是一個(gè)高性能、輕量級(jí)的深度學(xué)習(xí)預(yù)測(cè)引擎。在保持和PaddlePaddle無(wú)縫對(duì)接外,也兼容支持其他訓(xùn)練框架產(chǎn)出的模型。
## CPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle
## GPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
特性
輕量級(jí)
執(zhí)行階段和計(jì)算優(yōu)化階段實(shí)現(xiàn)良好解耦拆分,移動(dòng)端可以直接部署執(zhí)行階段,無(wú)任何第三方依賴(lài)。 包含完整的80個(gè) Op+85個(gè) Kernel 的動(dòng)態(tài)庫(kù),對(duì)于ARMV7只有800K,ARMV8下為1.3M,并可以裁剪到更低。 在應(yīng)用部署時(shí),載入模型即可直接預(yù)測(cè),無(wú)需額外分析優(yōu)化。
高性能
極致的 ARM CPU 性能優(yōu)化,針對(duì)不同微架構(gòu)特點(diǎn)實(shí)現(xiàn)kernel的定制,最大發(fā)揮計(jì)算性能,在主流模型上展現(xiàn)出領(lǐng)先的速度優(yōu)勢(shì)。 支持INT8量化計(jì)算,結(jié)合?PaddleSlim 模型壓縮工具?中 INT8量化訓(xùn)練功能,可以提供高精度高性能的預(yù)測(cè)能力。 在Huawei NPU, FPGA上也具有有很好的性能表現(xiàn)。
通用性
硬件方面,Paddle Lite 的架構(gòu)設(shè)計(jì)為多硬件兼容支持做了良好設(shè)計(jì)。除了支持ARM CPU、Mali GPU、Adreno GPU,還特別支持了華為 NPU,以及 FPGA 等邊緣設(shè)備廣泛使用的硬件。即將支持支持包括寒武紀(jì)、比特大陸等AI芯片,未來(lái)會(huì)增加對(duì)更多硬件的支持。
模型支持方面,Paddle Lite和PaddlePaddle訓(xùn)練框架的Op對(duì)齊,提供更廣泛的模型支持能力。目前已嚴(yán)格驗(yàn)證18個(gè)模型85個(gè)OP的精度和性能,對(duì)視覺(jué)類(lèi)模型做到了較為充分的支持,覆蓋分類(lèi)、檢測(cè)和定位,包含了特色的OCR模型的支持。未來(lái)會(huì)持續(xù)增加更多模型的支持驗(yàn)證。
框架兼容方面:除了PaddlePaddle外,對(duì)其他訓(xùn)練框架也提供兼容支持。當(dāng)前,支持Caffe 和 TensorFlow 訓(xùn)練出來(lái)的模型,通過(guò)X2Paddle?轉(zhuǎn)換工具實(shí)現(xiàn)。接下來(lái)將會(huì)對(duì)ONNX等格式模型提供兼容支持。
架構(gòu)
PaddleLite 的架構(gòu)設(shè)計(jì)著重考慮了對(duì)多硬件和平臺(tái)的支持,并且強(qiáng)化了多個(gè)硬件在一個(gè)模型中混合執(zhí)行的能力,多個(gè)層面的性能優(yōu)化處理,以及對(duì)端側(cè)應(yīng)用的輕量化設(shè)計(jì)。
其中,Analysis Phase 包括了 MIR(Machine IR) 相關(guān)模塊,能夠?qū)υ械哪P偷挠?jì)算圖針對(duì)具體的硬件列表進(jìn)行算子融合、計(jì)算裁剪 在內(nèi)的多種優(yōu)化。Execution Phase 只涉及到Kernel 的執(zhí)行,且可以單獨(dú)部署,以支持極致的輕量級(jí)部署。
Paddle-Mobile升級(jí)為Paddle Lite的說(shuō)明
原Paddle-Mobile作為一個(gè)致力于嵌入式平臺(tái)的PaddlePaddle預(yù)測(cè)引擎,已支持多種硬件平臺(tái),包括ARM CPU、 Mali GPU、Adreno GPU,以及支持蘋(píng)果設(shè)備的GPU Metal實(shí)現(xiàn)、ZU5、ZU9等FPGA開(kāi)發(fā)板、樹(shù)莓派等arm-linux開(kāi)發(fā)板。在百度內(nèi)已經(jīng)過(guò)廣泛業(yè)務(wù)場(chǎng)景應(yīng)用驗(yàn)證。對(duì)應(yīng)設(shè)計(jì)文檔可參考:?mobile/README
Paddle-Mobile 整體升級(jí)重構(gòu)并更名為Paddle Lite后,原paddle-mobile 的底層能力大部分已集成到新架構(gòu)?下。作為過(guò)渡,暫時(shí)保留原Paddle-mobile代碼。 主體代碼位于?mobile/?目錄中,后續(xù)一段時(shí)間會(huì)繼續(xù)維護(hù),并完成全部遷移。新功能會(huì)統(tǒng)一到新架構(gòu)?下開(kāi)發(fā)。
metal, web的模塊相對(duì)獨(dú)立,會(huì)繼續(xù)在?./metal?和?./web?目錄下開(kāi)發(fā)和維護(hù)。對(duì)蘋(píng)果設(shè)備的GPU Metal實(shí)現(xiàn)的需求及web前端預(yù)測(cè)需求,可以直接進(jìn)入這兩個(gè)目錄。
- 癲癇發(fā)作預(yù)測(cè)可穿戴設(shè)備的深度學(xué)習(xí)
- 華為智慧終端背后的黑科技--超輕量AI引擎MindSpore Lite,性能評(píng)測(cè)結(jié)果領(lǐng)先
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 基于深度學(xué)習(xí)的光學(xué)成像算法綜述 10次下載
- 基于深度學(xué)習(xí)的信息級(jí)聯(lián)預(yù)測(cè)方法研究綜述 9次下載
- 基于預(yù)訓(xùn)練模型和長(zhǎng)短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型 19次下載
- 3小時(shí)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)課件下載 0次下載
- 深度模型中的優(yōu)化與學(xué)習(xí)課件下載 3次下載
- 一種多通道自編碼器深度學(xué)習(xí)的入侵檢測(cè)方法 7次下載
- 一種屏幕內(nèi)容編碼幀內(nèi)CTU深度范圍預(yù)測(cè)快速算法 22次下載
- MXNet深度學(xué)習(xí)計(jì)算平臺(tái)中文學(xué)習(xí)筆記免費(fèi)下載 3次下載
- 如何使用情感分析和深度學(xué)習(xí)實(shí)現(xiàn)宏觀經(jīng)濟(jì)預(yù)測(cè)方法 15次下載
- 深度學(xué)習(xí)是什么?了解深度學(xué)習(xí)難嗎?讓你快速了解深度學(xué)習(xí)的視頻講解 16次下載
- 深度學(xué)習(xí)的機(jī)會(huì)網(wǎng)絡(luò)鏈路預(yù)測(cè) 0次下載
- 基于集成多標(biāo)記學(xué)習(xí)的蛋白質(zhì)多亞細(xì)胞定位預(yù)測(cè)方法 0次下載
- 澎峰科技高性能大模型推理引擎PerfXLM解析 522次閱讀
- 深度學(xué)習(xí)中的時(shí)間序列分類(lèi)方法 1080次閱讀
- 為OpenVINO添加對(duì)Paddle 2.5的支持 661次閱讀
- 如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)工件切割點(diǎn)位置預(yù)測(cè) 843次閱讀
- 如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)圓檢測(cè)與圓心位置預(yù)測(cè) 2109次閱讀
- 深度學(xué)習(xí)中的圖像分割 1288次閱讀
- 基于深度學(xué)習(xí)的兩相流氣泡末速度預(yù)測(cè) 990次閱讀
- 基于NGC飛槳容器PP-ShituV2 輕量級(jí)圖像識(shí)別系統(tǒng) 1791次閱讀
- 做時(shí)間序列預(yù)測(cè)是否有必要用深度學(xué)習(xí) 1815次閱讀
- 淺論學(xué)習(xí)深度學(xué)習(xí)的四個(gè)步驟 1.2w次閱讀
- 深度學(xué)習(xí)和機(jī)器學(xué)習(xí)深度的不同之處 淺談深度學(xué)習(xí)的訓(xùn)練和調(diào)參 4342次閱讀
- 深度探究機(jī)器學(xué)習(xí)與圖像融合的技術(shù)基于TOF硬件平臺(tái)的技術(shù)應(yīng)用 4866次閱讀
- 對(duì)比深度學(xué)習(xí)和經(jīng)典機(jī)器學(xué)習(xí),分別介紹這兩種技術(shù)的優(yōu)缺點(diǎn) 2.6w次閱讀
- 如何區(qū)分深度學(xué)習(xí)與機(jī)器學(xué)習(xí) 1965次閱讀
- 深度學(xué)習(xí)開(kāi)源框架,AI從業(yè)者的選擇之路 2414次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來(lái)的未來(lái)-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開(kāi)發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊(cè)
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書(shū))
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問(wèn)
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論