本文翻譯自tomshardware
用于dram的pam4
在上周的一次發布會上,美光分享了nvidia的geforce rtx30系列顯卡使用的最新gddr 6x sgdram的一些額外細節。公司透露,他們針對這種新型存儲器的技術進行了十多年的試驗,目前gddr6x sgram并沒有被jedec標準化,只有nvidia使用gddr6x內存,但美光希望這種情況會隨著時間的推移而改變。可以嗎?
pam4:自2006年開始的研發
美光位于德國慕尼黑的圖形dram設計中心,自從設計中心當年隸屬于奇蒙達(qimonda)以來,就有著圖形內存研發的歷史,這是英飛凌(infineon)長期以來的衍生產品。來自這些實驗室的工程師們帶來了業界第一個gddr5、gddr5x和現在的gddr6x芯片的批量生產。事實上,美光是gddr5x的唯一制造商,現在它是gddr6x的唯一生產商。
不同gddr之間對比(圖片來源:美光)
pam4信號是gddr6x存儲器的關鍵特性。這種技術使用四個信號電平每周期傳輸兩個數據位,因此與上一代sgram類型相比,任何工作頻率的有效帶寬都增加了一倍。此外,pam4為更高的數據傳輸速率打開了大門(盡管要付出代價)。因此,pam4提高了每時鐘的效率和速度。
不過,值得注意的是,gddr6的突發長度為16字節(bl16),這意味著它的兩個16位通道中的都可以在每次操作中傳送32個字節。gddr6x的突發長度為8字節(bl8),但由于pam4信令,其16位信道的每個操作也將傳送32字節。為此,在同一時鐘下,gddr6x并不比gddr6快。
(圖片來源:美光科技)
pam4信令已用于數據中心網絡標準,如infiniband,多年來,pam4本身并不是什么特別新鮮的事情。與傳統的pam2/nrz調制相比,pam4仍然用于大型數據中心和超級計算機的主要原因是其實現成本。
但高昂的成本并不妨礙在實驗室中對這項技術的探索,這也是美光美國分公司的科學家自2006年以來一直在做的事情。在此過程中,他們獲得了45項專利。
“在美光,我們的科學家從2006年就開始研究如何在內存中使用pam4,”美光公司圖形部門主管ralf ebert說。
經過多年對pam4的探索,美光認為是時候將這項技術應用到圖形內存中了。從2007年(gddr5)到2018年(gddr6),gddr的演變在架構上非常簡單(盡管回歸了bl8),因此引入一種新的信令方案需要美光將其來自美國的科學家和來自德國的工程師聚集在一起。
“科學家們必須與gddr的開發者們并肩工作,這些人開發了芯片,”ebert說:“此外,他們還與系統工程師和產品工程師密切合作,這些工程師從系統和大規模制造的角度了解這些挑戰。”
我們今天所知的gddr6x的工作始于不到三年前的2017年末。通常,將一種新型的dram推向市場需要更長的時間,但由于這主要是一個內部項目(至少在內存設備級別),美光已經采用的技術的實現非常迅速。不過,這是有原因的。
(圖片來源:美光科技)
與nvidia密切合作開發
新型存儲器的開發不僅考慮到某些應用,而且也考慮到某些客戶。nvidia是第一家使用gddr5x和gddr6的公司(早在21世紀初,還有gddr2和gddr3),因此它很早就與美光就gddr6x項目進行了接觸也就不足為奇了。事實上,根據美光的說法,nvidia要求美光提供比gddr6更高性能的內存解決方案。
“你必須與客戶合作,”ebert說你:“必須確定一個與之合作的客戶,并且最好依賴于多年來建立的密切的業務和技術合作關系。[我們必須確保]產品從一開始就可以在應用程序中正常工作。”
nvidia不得不為gddr6x開發一個全新的內存控制器和phy,因為pam4信令改變了內存子系統的工作方式。基于到目前為止還沒有ip設計公司宣布他們的gddr6x產品,看起來nvidia已經設計了所有的內部產品。
目前,nvidia在其geforce rtx 3080/3090顯卡上使用gddr6x,基于ga102 gpu,主要面向玩家。最終,該公司還將提供quadrortx專業圖形卡,具有相同的芯片和gddr6x內存。同時,美光表示,gddr6x也用于ai和hpc應用,這兩種應用都不屬于nvidia的geforce rtx(因為這些卡在用于ai的fp16和fp32張量性能以及用于hpc的fp64性能方面都有限制)和quadro rtx focus。也許美光意味著假想的用途,或者它意味著即將推出的nvidia titan系列卡,將為ai和hpc提供更高級的性能。
nvidia是美光唯一的gddr6x發布合作伙伴,但美光強調,它并不是專門為gpu開發者設計這種新型內存的。這家dram制造商也計劃向其他公司提供gddr6x。
“我們現在開始提供并向業界開放,gddr6x不是針對某些客戶的。”ebert說:“我們希望其他客戶有興趣向前發展,然后我們也會與他們接洽。”
帶pam4的gddr6x:較難構建,但比hbm2便宜
美光表示,pam4要求其重新設計其gddr6x存儲設備中的寫入數據捕獲電路(接收器),以精確地采樣和解析四種不同的信號電平。為此,每個gddr6x dram每個i/o和數據總線反轉(dq/dbi)管腳都包含三個輸入子接收器。主機可以在寫入訓練序列期間微調參考電壓電平。gddr6x的輸出驅動程序也必須重新設計。
pam4的更高傳輸效率(圖片來源:美光科技)
美光承認,與上一代gddr6設備相比,gddr6x芯片的生產成本更高。此外,他們需要一個非常干凈和穩定的信號,這就是為什么nvidia的ga102 gpu驅動geforce rtx 3080/3090卡的內存控制器現在需要獨立的電源軌上,以確保非常干凈和穩定的電源。
談到功率,有必要注意到,由于性能顯著提高,根據美光的數據,gddr6x在設備級別比gddr6(7.25pj/bit vs 7.5pj/bit)高出15%。
總體而言,gddr6x芯片及其實現比gddr6更昂貴,但它仍然比hbm2類內存便宜得多。gddr6x不需要堆疊,它是分立的芯片的形式,可以在工廠安裝。用分立dram的整個基礎設施已經存在了幾十年,而且所有的過程都是熟悉的并且便宜的。相比之下,hbm2-kgsds(已知良好的疊層模具)必須在半導體工廠封裝,然后放置在另一家潔凈室中的gpu旁邊。
“更高性能的dram通常也需要更高的成本,”ebert說:“gddr6x的最大優點是,我們可以將性能標準提高到更高的水平,同時仍然保持在一定的成本范圍內。這是因為gddr6x仍然是一個分立內存解決方案。gddr6x內存可以像其他任何內存一樣,由制造商在其標準環境中組裝。當你觀察不同速度等級的內存時,通常有不同的范圍;我們將gddr6x與典型范圍一致。對于客戶來說,這并不是一種成本極高的產品,這主要是因為它仍然是一種分立內存解決方案。”
美光沒有透露其8gb gddr6x的芯片尺寸,也沒有將其與8gb gddr6器件進行比較。該公司強調,這是第一種使用pam4信號的存儲器,后者是一種突破,為各種創新打開了大門。
“pam4是一個挑戰,我們相信,有了這一突破,可以一直向前推進。”美光圖形dram主管說:“我們相信,這將改變dram行業。我們是最早做到這一點的,我們已經為此努力了一段時間。”
gddr6x可縮放密度和數據速率
新的器件使用公司成熟的第四代10nm級工藝技術(也稱為1αnm)生產的。該公司已經制定了在容量和速度方面擴展gddr6x的路線圖。
明年,美光打算增加16gb的密度,并隨著時間的推移提供更快的芯片。目前,美光是gddr6x的唯一生產商,nvidia是唯一的客戶,因此gddr6x的發展取決于nvidia的需求和美光的量產能力。這里的關鍵信息是,gddr6x的性能可以擴展到21gbps以上。
gddr6x:不是jedec標準,但也不是專有的
為了盡快完成gddr6x,使其與nvidia的ampere gpu協同工作,兩家公司幾乎在保密模式下工作。這兩家公司從未將規范提交給jedec進行標準化,因此gddr6x是目前只能從美光獲得的一種專有內存。
ebert說:“目前為止,它還沒有提交給jedec進行標準化。
gddr5x主要由美光開發,幾乎沒有其他公司對此投入。在美光開始量產gddr5x之前,jedec正式發布了該標準,并將其提供給組織成員。然而,除了nvidia,沒有人使用gddr5x,除了美光之外,沒有人生產這種類型的內存。
gddr6x也許可以用在圖形之外
(圖片來源:美光科技)
傳統上,gddr類型的內存幾乎只用于顯卡和游戲機。有了gddr6,美光和業界同行開始為其他需要高帶寬的應用程序推廣圖形dram。在潛在的使用案例中,他們瞄準了汽車、網絡和fpga應用。美光希望gddr6x能夠解決非gpu市場。
如今,gpu廣泛應用于各種人工智能應用,因此,在美光的簡報會上,當公司談到gddr6x用于非圖形垂直領域時,自然會提到培訓和推理的ai。同時,由于nvidia將其泰坦系列顯卡瞄準了游戲玩家、人工智能、發燒友和各種產品消費者,如果nvidia推出泰坦——ampere系列,美光的gddr6x將從技術上解決這些市場的問題。
為了應對新興市場,美光不僅需要提供內存本身,還需要提供內存控制器ip、phy ip和驗證ip。這些類型的東西是由ip設計公司提供的,如avery、cadence、rambus和synopsys。由于gddr6x才剛剛開始,如果他們看到了行業對gddr6x的潛在需求,他們也將進入這一領域。當然這并不能完全保證,尤其是考慮到gddr6x不是jedec支持的行業標準。
cpu也可以使用gddr6x
ebert說:“從歷史上看,沒有什么能阻止這個行業使用cpu與gddr ram結合使用。”
圖形內存的未來:pam4將繼續存在,即使對于hbm也是如此
對于美光來說,gddr6x不僅是一個高度完善的產品,而且是其將pam4信號應用到dram上的偉大創舉。雖然這種編碼方式不會用于ddr5 sdram,但美光相信從長遠來看,這是內存的未來。
“gddr6x是我們首次利用了pam4,我們肯定可以看到這一點的繼續發展。”美光圖形內存總監說,“未來有可能,pam4可以用于其他內存標準。這類技術很可能會被cpu或其他處理器使用。”
內存演進流程(圖片來源:美光科技)
pam4確實會被工業界廣泛使用,遠遠超過今天的使用范圍。pcie6.0將于2021年面世,它使用pam4信令來獲取更高的效率和更高的數據速率。考慮到pcie的廣泛采用,cpu和asic公司最終將同時支持pcie6.0和pam4。一旦業界了解了如何使用pci6.0實現pam4調制,它肯定會將其應用到其他領域。
美光表示,他們首先將pam4實現到一個lpddr測試芯片中,對這項技術進行實驗。此外,在我們準備這篇報道時發現的一項專利表明,美光在三年前申請了pam4和pam8信令的hbm類內存的專利。
hbm類型的內存還必須采用離散dram設備(qdr、bl8/bl16等)所使用的負載,因此很難預測何時可以采用新的信令。目前可用的hbm2e 3.6gbps芯片如果采用pam4調制,則帶寬將翻倍,達到922gb/s,這意味著一個6模塊6144位dram子系統將提供高達5.5tb/s的帶寬。不過,在這一點上,這純粹是猜測。
總結
美光的gddr6x是業界第一款使用四電平脈沖幅度調制信號(pam4)的量產型存儲器。這種新的編碼方式使用四個信號電平每周期傳輸兩個數據位(而對于pam2則為一個數據位),這意味著可以實現更高頻率。從2006年開始,我們就把它看作是一個巨大的進化論者。雖然ddr5不使用pam4,但美光已經獲得了pam4專利,甚至支持pam8的hbm內存。
dram制造商承認,與gddr6相比,gddr6x更難構建和實現(可能更昂貴)。然而,即使是在它的嬰兒期,gddr6x也比成熟的hbm2e便宜,因為我們這里處理的是分立內存芯片。同時,由于gddr6x恢復到8字節的突發長度(從gddr6的16字節下降),在相同的每針數據速率下,它并不比其前身gddr6快。
在這一點上,gddr6x最大的特點是,它是由美光公司單獨開發的,有來自nvidia的一些要求。美光尚未將該標準提交給jedec,目前尚不清楚gddr6x是否會成為行業標準。美光希望gddr6x能用于非圖形應用,但如果沒有其他公司的支持,這種新型內存的推廣將很困難。
來源:eeworld
以上是網絡信息轉載,信息真實性自行斟酌。