【博主簡介】本人“愛在七夕時(shí)”,系一名半導(dǎo)體行業(yè)質(zhì)量管理從業(yè)者,旨在業(yè)余時(shí)間不定期的分享半導(dǎo)體行業(yè)中的:產(chǎn)品質(zhì)量、失效分析、可靠性分析和產(chǎn)品基礎(chǔ)應(yīng)用等相關(guān)知識。常言:真知不問出處,所分享的內(nèi)容如有雷同或是不當(dāng)之處,還請大家海涵。當(dāng)前在各網(wǎng)絡(luò)平臺上均以此昵稱為ID跟大家一起交流學(xué)習(xí)!

相信一聊到HBM DRAM(高帶寬內(nèi)存)和3D Stacked Memory(3D堆疊內(nèi)存),大家都會(huì)有同樣一個(gè)疑問:它們之間有什么關(guān)系?為什么很多的時(shí)候這兩者會(huì)同時(shí)出現(xiàn)?......其實(shí),具體來講:HBM是3D Stacked的核心技術(shù)分支與典型代表,二者是“具體技術(shù)實(shí)例”與“廣義技術(shù)類別”的關(guān)系——HBM是3D Stacked技術(shù)在高性能計(jì)算場景下的核心落地形態(tài),而3D Stacked是HBM實(shí)現(xiàn)性能突破的關(guān)鍵技術(shù)基礎(chǔ)。
簡言之:3D Stacked Memory是“技術(shù)方法”,而HBM是“用這種方法解決特定問題的產(chǎn)品”。
同時(shí),HBM也是3D Stacked Memory在高性能計(jì)算場景下的具體實(shí)現(xiàn),其3D堆疊架構(gòu)解決了傳統(tǒng)內(nèi)存的“帶寬瓶頸”與“功耗問題”,是AI、HPC等前沿領(lǐng)域的核心支撐技術(shù)。未來隨著HBM3D、定制化HBM的發(fā)展,其在存儲產(chǎn)業(yè)的地位將進(jìn)一步提升。
關(guān)于HBM的部分,我曾在之前的章節(jié)中有詳細(xì)介紹過,這里就不過多贅述了,有興趣的朋友可以一起探討。所以,本章節(jié)想要跟大家分享的還是HBM DRAM(高帶寬內(nèi)存)和3D Stacked Memory(3D堆疊內(nèi)存)技術(shù)相關(guān)的內(nèi)容。

一、HBM DRAM和3D Stacked Memory技術(shù)的簡介
1、HBM DRAM(高帶寬內(nèi)存)
以下是關(guān)于HBM技術(shù)詳解介紹:
半導(dǎo)體“高帶寬內(nèi)存(HBM)”芯片技術(shù)的詳解;
2、3D Stacked Memory(3D堆疊內(nèi)存)
3D堆疊內(nèi)存,英文全稱:3D Stacked Memory,3D堆疊內(nèi)存芯片則是通過3D封裝技術(shù),將多層DRAM堆疊而成的新型內(nèi)存。3D堆疊內(nèi)存芯片能提供很大的內(nèi)存容量和內(nèi)存帶寬,其中混合內(nèi)存立方體(Hybrid Memory Cube)和高帶寬內(nèi)存(High Bandwidth Memory)是兩種新型的3D堆疊內(nèi)存技術(shù)。利用3D堆疊內(nèi)存,可以進(jìn)行許多PIM設(shè)計(jì),比如改變整個(gè)系統(tǒng),或者實(shí)現(xiàn)簡單的功能卸載,主要思想是將某種形式的處理邏輯(通常是加速器、簡單內(nèi)核或可重構(gòu)邏輯)放在3D堆疊內(nèi)存的邏輯層中。取決于體系結(jié)構(gòu)的設(shè)計(jì),這個(gè)PM處理邏輯(PIM核心或PIM引擎)可以執(zhí)行應(yīng)用程序的一部分(從單個(gè)指令到函數(shù))或整個(gè)線程和應(yīng)用程序。本節(jié)將討論利用3D堆疊內(nèi)存的PM在圖處理、移動(dòng)設(shè)備、圖形處理單元上的使用。
說白了,3D DRAM就是一種通過堆疊多個(gè)存儲層和使用垂直互聯(lián)技術(shù)來增加存儲密度和性能的先進(jìn)DRAM的技術(shù)。3D DRAM能夠提供更高的存儲密度、更低的功耗和更高的帶寬,適用于高性能計(jì)算、數(shù)據(jù)中心和AI等應(yīng)用場景。
(1)3D DRAM的結(jié)構(gòu)
3D DRAM與傳統(tǒng)的2D DRAM相比,采用了垂直堆疊的結(jié)構(gòu)。傳統(tǒng)的2D DRAM將存儲單元橫向排布在單個(gè)硅基晶圓平面上,而3D DRAM通過將多個(gè)存儲層垂直堆疊在一起,以形成更高的存儲密度。
a.堆疊結(jié)構(gòu)
3D DRAM的結(jié)構(gòu)由多個(gè)DRAM層組成,每一層都包含大量的存儲單元。每一層中的存儲單元按照行和列的方式排列,類似于傳統(tǒng)DRAM的平面排列方式。
b.垂直互聯(lián)(Through-Silicon Via, TSV)
垂直互聯(lián)技術(shù)在3D DRAM中至關(guān)重要,它通過在晶圓中穿孔并填充導(dǎo)電材料來連接不同的存儲層。TSV技術(shù)可以顯著減少信號傳輸路徑,降低延遲并提高數(shù)據(jù)傳輸速率。
(2)3D DRAM的制程技術(shù)
3D DRAM的制程技術(shù)比2D DRAM更復(fù)雜,涉及到多層堆疊、熱處理、垂直互聯(lián)的形成和各層之間的電氣隔離。
a.晶圓級堆疊
3D DRAM制造過程中,首先在多個(gè)晶圓上分別制造出DRAM存儲單元,然后通過晶圓粘合技術(shù)將這些晶圓堆疊在一起。
b.TSV制造和填充
通過刻蝕和化學(xué)機(jī)械拋光(CMP)工藝,形成垂直穿孔,隨后在這些孔中填充銅或鎢等導(dǎo)電材料以形成垂直互連。
c.熱處理和電氣隔離
由于多個(gè)晶圓堆疊在一起,熱處理工藝和電氣隔離至關(guān)重要。需要確保各層之間的熱應(yīng)力和電荷干擾被最小化。
(3)3D DRAM的優(yōu)勢
3D DRAM相較于傳統(tǒng)的2D DRAM,具有許多顯著的技術(shù)優(yōu)勢:
a.更高的存儲密度
由于采用垂直堆疊結(jié)構(gòu),3D DRAM可以在相同的平面面積上容納更多的存儲單元,從而顯著提高存儲密度。
b.更低的功耗
3D DRAM通過縮短信號傳輸路徑,降低了數(shù)據(jù)訪問的延遲和能量損耗,能夠在較低的工作電壓下實(shí)現(xiàn)更高的性能。
c.更高的帶寬和更快的速度
由于TSV技術(shù)的應(yīng)用,層與層之間的數(shù)據(jù)傳輸速度更快,帶寬也更高,從而可以更好地支持高性能計(jì)算和數(shù)據(jù)中心應(yīng)用。
所以,未來,隨著制程技術(shù)的進(jìn)一步提升和對更高性能的需求增加,3D DRAM將繼續(xù)朝著更高層數(shù)堆疊、更小的制程節(jié)點(diǎn)和更低功耗的方向發(fā)展??赡軙?huì)引入新的材料和結(jié)構(gòu),如垂直晶體管技術(shù)(如Gate-All-Around FETs)以及更先進(jìn)的封裝方式(如Chiplet封裝),以進(jìn)一步提升3D DRAM的性能和應(yīng)用廣度。

二、HBM DRAM和3D Stacked Memory技術(shù)之間的關(guān)系
因?yàn)镠BM與3D Stacked Memory是“具體技術(shù)實(shí)例”與“廣義技術(shù)類別”的關(guān)系,所以想要講清楚這兩者之間的具體關(guān)系,得從以下三個(gè)方面說起:
1、HBM是3D Stacked Memory的核心技術(shù)與典型應(yīng)用
3D堆疊內(nèi)存是通過垂直堆疊多層存儲芯片實(shí)現(xiàn)高帶寬、大容量的廣義內(nèi)存技術(shù)類別;而HBM是其中專為AI、高性能計(jì)算(HPC)等超高性能場景優(yōu)化的技術(shù)實(shí)例。
根據(jù)搜索結(jié)果,HBM的定義明確指向“3D堆疊DRAM”:它是將多個(gè)DRAM芯片(Core Die)通過**硅通孔(TSV)與微凸點(diǎn)(Microbump)**垂直堆疊,并與底層邏輯芯片(Base Die)封裝在一起,形成“處理器-內(nèi)存”緊耦合架構(gòu)的新型內(nèi)存。例如,HBM3E單封裝容量可達(dá)24GB,帶寬高達(dá)8Gbps/Pin,正是依托3D堆疊技術(shù)突破了傳統(tǒng)內(nèi)存的帶寬瓶頸。
2、3D Stacked是HBM突破性能瓶頸的關(guān)鍵技術(shù)基礎(chǔ)
HBM的核心優(yōu)勢(超高帶寬、低功耗、小尺寸)完全依賴3D堆疊技術(shù)實(shí)現(xiàn):
a.縮短數(shù)據(jù)傳輸距離
通過垂直堆疊DRAM芯片,數(shù)據(jù)無需在平面上長距離傳輸,而是“抄近道”在層間傳遞,大幅降低延遲;
b.提升位寬與帶寬
HBM采用超寬I/O總線(如1024位、2048位),遠(yuǎn)高于傳統(tǒng)GDDR5的32位,結(jié)合多層堆疊,帶寬可達(dá)傳統(tǒng)內(nèi)存的5-10倍;
c.降低功耗
短距離傳輸與高帶寬特性,使HBM每瓦帶寬比GDDR5高3倍以上,解決了高性能計(jì)算的“功耗墻”問題。
3、HBM與其他3D Stacked Memory的差異與定位
3D Stacked Memory是一個(gè)廣義范疇,HBM與其他3D Stacked技術(shù)(如NAND、3D DRAM)的核心區(qū)別在于技術(shù)路徑與應(yīng)用場景:
a.與偽3D堆疊(如NAND)的區(qū)別
NAND是“多顆Die獨(dú)立連接基板”的偽3D堆疊,層數(shù)受限(≤8層)、成本較低,用于SSD等長期存儲;而HBM是“多層Die通過TSV互連邏輯Die”的真3D堆疊,專注高性能緩存;
b.與3D DRAM的區(qū)別
3D DRAM側(cè)重“存儲單元的垂直化”(如三星的VS-CAT DRAM),是單元結(jié)構(gòu)層面的創(chuàng)新;而HBM是“封裝級的DRAM堆疊”,強(qiáng)調(diào)與處理器的緊耦合,兩者形成互補(bǔ)。

三、HBM DRAM和3D Stacked Memory技術(shù)詳解
以下內(nèi)容就是本章節(jié)要跟大家分享的重點(diǎn),希望有興趣的朋友可以一起交流學(xué)習(xí),具體分享內(nèi)容如下:
























































因?yàn)楸綪PT章節(jié)太多,剩下部分如有朋友有需要,可私信我邀請您加入我“知識星球”免費(fèi)下載PDF版本。注意:此資料只可供自己學(xué)習(xí),不可傳閱,平臺有下載記錄,切記!歡迎加入后一起交流學(xué)習(xí)。

四、HBM DRAM和3D Stacked Memory技術(shù)的應(yīng)用
高帶寬內(nèi)存(HBM)作為3D堆疊內(nèi)存的核心落地形態(tài),與廣義的3D堆疊內(nèi)存(如3D DRAM、3D數(shù)字內(nèi)存內(nèi)計(jì)算(3DIMC))的應(yīng)用場景高度重疊,均聚焦于高帶寬、低功耗、高算力需求的領(lǐng)域。所以結(jié)合具體技術(shù)與產(chǎn)品,分場景說明兩者的應(yīng)用情況如下:
1、人工智能(AI)與機(jī)器學(xué)習(xí):當(dāng)前與未來的核心戰(zhàn)場
AI模型(尤其是大型語言模型LLM、深度神經(jīng)網(wǎng)絡(luò))對內(nèi)存帶寬與容量的需求呈指數(shù)級增長,HBM與3D堆疊內(nèi)存成為突破“內(nèi)存墻”的關(guān)鍵:
a.HBM的當(dāng)前主流應(yīng)用
HBM已成為AI GPU/TPU的“標(biāo)配”,用于解決模型訓(xùn)練與推理中的數(shù)據(jù)搬運(yùn)瓶頸。例如:
英偉達(dá)H100 GPU搭載HBM,帶寬高達(dá)3TB/s,支撐大模型訓(xùn)練的高吞吐量需求;
AMD MI300 GPU集成HBM,用于生成式AI與高性能計(jì)算,性能較上一代提升數(shù)倍;
超級計(jì)算機(jī)如富士通A64FX,通過HBM實(shí)現(xiàn)高速數(shù)據(jù)交互,支撐氣候模擬等復(fù)雜計(jì)算。
b.3D堆疊內(nèi)存的未來潛力
針對LLM的大容量、低延遲需求,單片3D堆疊DRAM與3DIMC成為下一代解決方案:
單片3D堆疊DRAM:通過垂直位線(VBL)/字線(VWL)設(shè)計(jì)與異質(zhì)集成,其加速器推理吞吐量可達(dá)NVIDIA H100的15倍,能效高55倍;
d-Matrix的3DIMC技術(shù):將內(nèi)存與計(jì)算深度集成,宣稱AI推理速度比HBM快10倍、能耗降低90%,直接挑戰(zhàn)HBM在AI推理中的地位。
2、高性能計(jì)算(HPC):提升系統(tǒng)算力密度
HPC場景(如科學(xué)計(jì)算、數(shù)據(jù)分析)需要處理海量數(shù)據(jù),HBM與3D堆疊內(nèi)存通過縮短數(shù)據(jù)傳輸路徑提升系統(tǒng)效率:
a.HBM的應(yīng)用
HBM常與高性能CPU/GPU結(jié)合,用于超級計(jì)算機(jī)的互連與存儲。例如,日本理化學(xué)研究所(RIKEN)的Fugaku超級計(jì)算機(jī),通過HBM實(shí)現(xiàn)節(jié)點(diǎn)間的高速數(shù)據(jù)傳輸,峰值性能達(dá)442 PFlops。
b.3D堆疊內(nèi)存的補(bǔ)充
3D堆疊技術(shù)可提升存儲密度,減少HPC系統(tǒng)的占地面積。例如,3D NAND閃存的堆疊架構(gòu)已被用于HPC的輔助存儲,未來或擴(kuò)展至主存領(lǐng)域。
3、圖形處理與消費(fèi)電子:提升視覺體驗(yàn)
HBM的高帶寬特性使其成為高端圖形處理的理想選擇,支撐高幀率游戲、4K/8K渲染等場景:
a.HBM的應(yīng)用
高端顯卡(如英偉達(dá)RTX 40系列、AMD Radeon 7000系列)搭載HBM2e/HBM,提升圖形數(shù)據(jù)的傳輸速度,使游戲最低幀數(shù)較前一代提升25%以上。
b.3D堆疊內(nèi)存的延伸
3D堆疊技術(shù)可用于消費(fèi)級設(shè)備的存儲與計(jì)算集成,例如將3D DRAM與圖像處理器(ISP)結(jié)合,提升手機(jī)的圖像處理速度與AI運(yùn)算能力。
4、細(xì)分領(lǐng)域:傳感器與專用芯片
3D堆疊內(nèi)存的非易失性、高集成度特性,還被用于專用傳感器芯片:
SPAD(單光子雪崩二極管)芯片:通過3D堆疊技術(shù)(如晶圓級混合鍵合),將像素陣列與邏輯電路垂直集成,提升光子探測效率(PDE)并降低暗計(jì)數(shù)率(DCR),用于自動(dòng)駕駛的激光雷達(dá)、醫(yī)療成像等領(lǐng)域。

五、總結(jié)一下
說實(shí)話,要做HBM DRAM和3D Stacked Memory技術(shù)的總結(jié)還是挺難的,因?yàn)閮烧叩年P(guān)系比較特殊,在其終端的應(yīng)用場景里,既有共性,也有差異,所以只能簡單地分開總結(jié)吧:
1、共性方面
兩者均聚焦于高帶寬、低功耗需求,核心是解決“數(shù)據(jù)搬運(yùn)慢、能耗高”的問題;
2、差異方面
HBM是當(dāng)前AI/HPC的主流解決方案,強(qiáng)調(diào)“成熟量產(chǎn)”;3D堆疊內(nèi)存(如3D DRAM、3DIMC)是未來方向,側(cè)重“更高密度、更低延遲”,尤其在LLM與AI推理中潛力巨大。
隨著AI模型的持續(xù)增大與算力需求的爆發(fā),HBM與3D堆疊內(nèi)存的應(yīng)用將向更廣泛的消費(fèi)電子、邊緣計(jì)算等領(lǐng)域滲透,成為未來計(jì)算系統(tǒng)的“內(nèi)存基石”。
簡而言之:HBM是3D堆疊內(nèi)存的“現(xiàn)在時(shí)”,其他3D堆疊技術(shù)是“未來時(shí)”——兩者協(xié)同推動(dòng)內(nèi)存性能邊界,最終服務(wù)于不同場景的計(jì)算需求。

免責(zé)聲明
【我們尊重原創(chuàng),也注重分享。文中的文字、圖片版權(quán)歸原作者所有,轉(zhuǎn)載目的在于分享更多信息,不代表本號立場,如有侵犯您的權(quán)益請及時(shí)私信聯(lián)系,我們將第一時(shí)間跟蹤核實(shí)并作處理,謝謝!】
-
半導(dǎo)體
+關(guān)注
關(guān)注
336文章
29749瀏覽量
255255 -
3D
+關(guān)注
關(guān)注
9文章
2983瀏覽量
113486 -
HBM
+關(guān)注
關(guān)注
2文章
426瀏覽量
15671
發(fā)布評論請先 登錄
半導(dǎo)體產(chǎn)業(yè)的未來:3D堆疊封裝技術(shù)
AR0237IR圖像傳感器推動(dòng)3D成像技術(shù)的發(fā)展
采用艾邁斯半導(dǎo)體的ASV技術(shù)有什么特點(diǎn)?
半導(dǎo)體制程邁入3D 2013年為量產(chǎn)元年
3D工藝成為半導(dǎo)體微細(xì)加工技術(shù)必然趨勢
多視角裸眼3D顯示器技術(shù)發(fā)展和市場動(dòng)態(tài)
半導(dǎo)體制冷的巧克力3D打印成型
3D SiC技術(shù)閃耀全場,基本半導(dǎo)體參展PCIM Asia引關(guān)注
新型2.5D和3D封裝技術(shù)的挑戰(zhàn)
半導(dǎo)體2.5D/3D封裝技術(shù):趨勢和創(chuàng)新
SuperView W3光學(xué)3D表面輪廓儀助力半導(dǎo)體智能制造

半導(dǎo)體“HBM和3D Stacked Memory”技術(shù)的詳解
評論