2020年2月6日,美光科技宣布交付全球首款量產(chǎn)的低功耗DDR5 DRAM 芯片,隨后,三星S20系列和小米10系列手機(jī)先后發(fā)布,全新的LPDDR5內(nèi)存成為兩家的共同賣點(diǎn)之一,這也預(yù)示著DDR5的時(shí)代即將到來。今天我們就來聊一聊DDR5的發(fā)展過程,設(shè)計(jì)難題以及如何通過仿真來應(yīng)對(duì)DDR5設(shè)計(jì)挑戰(zhàn)。
01. DDR技術(shù)的發(fā)展歷程
02. DDR5的出現(xiàn),帶來了哪些設(shè)計(jì)挑戰(zhàn)?
03. 如何通過仿真及建模中的創(chuàng)新克服DDR5技術(shù)挑戰(zhàn)
04. DDR5仿真解決方案
05. DDR5仿真實(shí)例
01DDR技術(shù)的發(fā)展歷程
在計(jì)算機(jī)和移動(dòng)設(shè)備中,DDR是數(shù)據(jù)的緩沖區(qū),CPU所需訪問與處理的數(shù)據(jù)幾乎都會(huì)經(jīng)過這里。與此同時(shí),除了暫存CPU運(yùn)算數(shù)據(jù),DDR還需要承擔(dān)與外部?jī)?chǔ)存器交互數(shù)據(jù)的使命。隨著CPU處理能力的不斷提高,對(duì)DDR的速度和容量的要求也在不斷地提升。
從DDR的發(fā)展圖中可以看到,DDR的傳輸速率在成倍提升,而其迭代速度也在不斷加快。
如今,占據(jù)著主流市場(chǎng)的是從2014年底開始上市的DDR4。較低的工作電壓以及最高可達(dá)4266MT/s的傳輸速率,使其達(dá)到前代DDR3三倍速率的同時(shí),擁有更低的功耗。
但是,隨著CPU的核數(shù)不斷增多,內(nèi)存的性能又將成為新的瓶頸。因此JEDEC協(xié)會(huì)早在2017年就開始和各大SDRAM廠商協(xié)作,著手起草DDR5標(biāo)準(zhǔn),DDR5技術(shù)規(guī)范草案和LPDDR5的更新標(biāo)準(zhǔn)都已公布,不過至今還未推出正式版本。
目前而言,DDR5的最高速率預(yù)計(jì)可以達(dá)到8.4GT/s,是DDR4的兩倍。同時(shí),工作電壓也從1.2V降低到了1.1V,這也意味著DDR5在性能提高的同時(shí),進(jìn)一步降低了功耗。
02 DDR5的出現(xiàn),帶來了哪些設(shè)計(jì)挑戰(zhàn)?
DDR5的速率最高超過8.4GT/s,達(dá)到了前代DDR4最高速率的兩倍。更高的速率,帶來出色性能的同時(shí),不可避免的提升了設(shè)計(jì)的困難。
挑戰(zhàn)1:串?dāng)_(Crosstalk)
DDR信號(hào)較多,走線較為密集,隨著信號(hào)速率的增加,傳輸線之間的串?dāng)_也會(huì)隨之增加。此外,DDR顆粒的引腳布局,往往多個(gè)信號(hào)附近只有一個(gè)GND引腳,這就使得這些信號(hào)需要共用同一個(gè)返回路徑,更加增加了相互干擾的風(fēng)險(xiǎn)。

在圖中不難發(fā)現(xiàn),單一傳輸線之間的串?dāng)_都在-25dB以下,這個(gè)是相對(duì)不錯(cuò)的結(jié)果。然而,即使如此,在觀察眼圖時(shí)可以發(fā)現(xiàn),串?dāng)_較為嚴(yán)重地減小了眼圖地張開程度。這就意味著,單獨(dú)從單一傳輸線的串?dāng)_角度上,并不能確切的得到串?dāng)_真實(shí)造成的影響,這給設(shè)計(jì)過程中,帶來了困難。
挑戰(zhàn)2:抖動(dòng)(Jitter)
除了串?dāng)_外,抖動(dòng)也是不能被忽視的問題。
在上圖可以看到,僅僅考慮隨機(jī)抖動(dòng)后,眼圖的時(shí)間裕量就減小47%(27ps)。這意味著,如果忽視了抖動(dòng)的影響,很容易對(duì)設(shè)計(jì)的質(zhì)量的評(píng)估過優(yōu),最后造成實(shí)際產(chǎn)品的失敗。
挑戰(zhàn)3:碼間干擾(ISI)及均衡(Equation)
由于傳輸線的頻率選擇特性,頻率越高,傳輸線的插入損耗也會(huì)隨之增加,信號(hào)的衰減和碼間干擾的現(xiàn)象也會(huì)更加嚴(yán)重。
圖中傳輸線在1.2GHz時(shí)插損約在-10dB左右,而上升到3.2GHz后,插損達(dá)到了-30dB。對(duì)比眼圖可以發(fā)現(xiàn),6.4Gbps時(shí),由于ISI和衰減,眼圖已經(jīng)完全閉合。
為此,DDR5引入了可調(diào)增益以及判決反饋均衡器(DFE),減小ISI對(duì)相鄰bit的影響,用以改善眼圖閉合的情況。
與SERDES中使用的DFE不同的是,在SERDES中,DFE的時(shí)鐘信息可以由信號(hào)本身通過時(shí)鐘恢復(fù)獲得。而在DDR5中,由于DQ信號(hào)是通過DQS信號(hào)觸發(fā)的,所以需要將DQS作為時(shí)鐘信號(hào),加入到DFE中去。最后形成的是雙輸入,單輸出的DFE。
挑戰(zhàn)4:測(cè)試方法
低誤碼率:
在DDR5的協(xié)議草案中,要求在測(cè)試時(shí)系統(tǒng)的誤碼率要在10e-16以下,及最少需要5.3e9個(gè)UI,才能保證99.5%的置信水平。無論是在測(cè)試,還是仿真中,如此多的bit數(shù)都需要花費(fèi)大量的時(shí)間。
虛擬探針:
由于DDR5引入了均衡器,所以最終的接受信號(hào)是經(jīng)過均衡后的得到的結(jié)果。但是在測(cè)試時(shí),往往只能直接測(cè)量到芯片BGA封裝上的信號(hào)波形。所以,需要通過軟件仿真或推測(cè)模擬出封裝以及均衡器的影響,再通過一個(gè)虛擬探針,獲得最后的波形進(jìn)行分析。
Loop-back模式:
在DDR5芯片中,有一個(gè)RCD接口,可以將最后經(jīng)過均衡處理的數(shù)據(jù)輸出。測(cè)試時(shí)可以利用這個(gè)接口,將輸入的信號(hào)與最后RCD 接口輸出的信號(hào)進(jìn)行對(duì)比,獲得整個(gè)系統(tǒng)的誤碼率。
03如何通過仿真及建模中的創(chuàng)新克服DDR5技術(shù)挑戰(zhàn)?
相對(duì)于測(cè)試而言,仿真能在較前期對(duì)設(shè)計(jì)進(jìn)行評(píng)估,幫助工程師及時(shí)優(yōu)化設(shè)計(jì)。這對(duì)減少產(chǎn)品風(fēng)險(xiǎn)以及因迭代優(yōu)化產(chǎn)生的時(shí)間和成本有很大的幫助。同時(shí),由于仿真允許在電路的任意節(jié)點(diǎn)檢測(cè)信號(hào)質(zhì)量,也不存在DDR5測(cè)試過程中無法直接測(cè)量到均衡后信號(hào)的問題。
通道仿真
正如上文提到的,DDR5協(xié)議草案中,有低誤碼率的要求。如果使用傳統(tǒng)的瞬態(tài)算法,就需要將5.3e9個(gè)bit逐一卷積計(jì)算,這將花費(fèi)大量的時(shí)間,與仿真盡早,快速評(píng)估設(shè)計(jì)的初衷不符,也往往很難實(shí)現(xiàn)。 為此,在DDR5的仿真中,就必須使用類似于廣泛應(yīng)用于SERDES仿真當(dāng)中的通道仿真技術(shù)。傳統(tǒng)適用于SERDES的通道仿真分成兩種模式,其一是逐bit模式(bit-by-bit),這種方式會(huì)得到單個(gè)bit的階躍響應(yīng),在通過仿真器根據(jù)輸入的bit序列,將對(duì)應(yīng)的階躍響應(yīng)進(jìn)行疊加。而另一種則是統(tǒng)計(jì)模式(statistical),即整個(gè)系統(tǒng)的響應(yīng),包括抖動(dòng),串?dāng)_,均衡等,都是基于單個(gè)bit的階躍響應(yīng),根據(jù)概率密度分布結(jié)果,經(jīng)過數(shù)據(jù)后處理獲得。由于DDR信號(hào)多為單端信號(hào),與SERDES的差分信號(hào)不同。因此,應(yīng)用在DDR上的通道仿真技術(shù),還需要有一些改動(dòng)。首先是通道仿真技術(shù)所需要的階躍響應(yīng)。差分信號(hào)的上升沿與下降沿是對(duì)稱的,因此只需要獲得單一的階躍響應(yīng)進(jìn)行通道仿真。而對(duì)于單端信號(hào)而言,上升時(shí)間和下降時(shí)間不再相同,這就意味著需要同時(shí)獲得上升和下降兩個(gè)階躍響應(yīng),同時(shí),仿真器需要在信號(hào)上升和下降時(shí)使用對(duì)應(yīng)階躍響應(yīng)進(jìn)行計(jì)算。
其次是時(shí)鐘問題。SERDES信號(hào)往往是通過時(shí)鐘恢復(fù)電路(CDR),從信號(hào)本身恢復(fù)出時(shí)鐘信號(hào)。而DDR則不同,DQ信號(hào)由DQS信號(hào)觸發(fā)。這就需要仿真器具有時(shí)鐘觸發(fā)的功能。否則,如果依舊使用DQ信號(hào)本身進(jìn)行時(shí)鐘恢復(fù)的話,會(huì)造成時(shí)域的偏移。下圖中,紅色部分為DQ時(shí)鐘恢復(fù)后結(jié)果,藍(lán)色為DQ由DQS觸發(fā)后的結(jié)果??梢钥吹?,兩個(gè)結(jié)果在時(shí)間上存在一個(gè)偏移量。
最后是關(guān)于DDR的write-leveling功能。Write-leveling允許設(shè)備調(diào)整ClK信號(hào)與DQS信號(hào)之間的時(shí)間差。如果仿真器不能實(shí)現(xiàn)這個(gè)功能,會(huì)帶來不必要的調(diào)整。
在這里需要注意的是,如果需要使用Rx端DFE的自適應(yīng)模式,必須在bit-by-bit模式下進(jìn)行仿真。而statistical模式下,只支持固定抽頭系數(shù)的仿真。
在ADS2015中,基于通道仿真技術(shù)改進(jìn)而來的DDR BUS仿真器就已經(jīng)被應(yīng)用到DDR仿真中,并在更新中不斷完善,以應(yīng)對(duì)DDR5仿真帶來的挑戰(zhàn)。
IBIS-AMI模型
在前代的DDR仿真中,IBIS模型已經(jīng)得到了廣泛的應(yīng)用。而DDR5與之前協(xié)議的一個(gè)很大的差別,就是需要在Rx使用可調(diào)增益和DFE的均衡方式對(duì)接收到的數(shù)據(jù)進(jìn)行處理。這就給了IBIS-AMI模型發(fā)揮的舞臺(tái)。
IBIS-AMI模型不僅可以在保護(hù)IP的前提下滿足各種均衡的需要,而且作為一個(gè)通用模型,能在各種工具中進(jìn)行使用。
當(dāng)然,雖然IBIS-AMI模型已經(jīng)在SERDES信號(hào)中被廣泛使用。但是這畢竟是第一次應(yīng)用在單端信號(hào)中,有一些部分需要改進(jìn)。
首先是直流偏置的問題。差分信號(hào)不存在直流偏置,因此在使用單端的IBIS-AMI模型進(jìn)行均衡計(jì)算時(shí),直流偏置必須可以通過算法解決。
第二點(diǎn)便是DQS提供時(shí)鐘信號(hào)的問題了。在前文中介紹過,DDR5的DFE均衡需要DQS提供時(shí)鐘信號(hào)。這就意味著,DDR5的IBIS-AMI模型,不僅需要有DQ信號(hào)的輸入端,還需要DQS信號(hào)的輸入,才能恢復(fù)出符合要求的信號(hào)。
在ADS2020 Update1中,Memory Designer已經(jīng)支持IBIS-AMI模型在DDR5仿真中的應(yīng)用,可以使用IBIS-AMI模型對(duì)于DDR5的均衡效果進(jìn)行仿真。
針對(duì)之前提到的所有挑戰(zhàn)與創(chuàng)新,如上表所示,Keysight Pathwave平臺(tái)的SystemVue,ADS Memory Designer以及ADS SIPro提供了完整的解決方案。(以下案例中使用了Intel提供的IBIS-AMI模型)
SystemVue
SystemVue是一款被廣泛應(yīng)用于AMI建模的軟件。用戶可以使用SystemVue中包含的通用算法模塊,快速的構(gòu)建所需的均衡模型,同時(shí)完成AMI模型的編譯和仿真驗(yàn)證。將原來可能需要花費(fèi)一整年的AMI建模周期縮短到原有的四分之一。
首先,針對(duì)直流偏置,在BIRD197.7中,引入了一個(gè)新的參數(shù)DC_Offset來表示直流偏置。該參數(shù)作為一個(gè)固定值由EDA軟件定義。在處理波形時(shí),就將DQ信號(hào)的直流分量進(jìn)行抵消,從而保證進(jìn)入Rx均衡算法中的是中心電壓為0V的波形。
在另一方面,針對(duì)DQ信號(hào)的DFE需要以DQS作為時(shí)鐘的問題,Keysight與Intel協(xié)作,一同提出了一個(gè)新的雙輸入單輸出的時(shí)域波形處理(getwave)函數(shù)long AMI_GetWave2()。使用該函數(shù)處理時(shí)域波形時(shí),可以同時(shí)考慮DQ和DQS的輸入。保證在DFE均衡的時(shí)候,能夠從DQS中獲取時(shí)鐘信號(hào)進(jìn)行計(jì)算。
Keysight Pathwave SystemVue可以提供完整的DDR5 AMI 建模解決方案,同時(shí)也是唯一一個(gè)能夠提供long AMI_GetWave2() 以支持DQ和DQS雙輸入的建模工具。
ADS SIPro
ADS SIPro是一款專用于PCB仿真的EM仿真工具。針對(duì)引腳眾多的DDR信號(hào),SIPro中內(nèi)置了DDR設(shè)置向?qū)?,可以幫助用戶快速進(jìn)行DDR仿真設(shè)置。
用戶只需要選擇控制器及內(nèi)存模塊,相應(yīng)的網(wǎng)絡(luò)就會(huì)由軟件自動(dòng)篩選提取。用戶勾選需要仿真的網(wǎng)絡(luò)名后,對(duì)應(yīng)的仿真設(shè)置便會(huì)自動(dòng)生成。整個(gè)過程只需要一分鐘左右的時(shí)間。
此外,SIPro可以快速準(zhǔn)確的提取PCB信號(hào)的S參數(shù),可信頻率高達(dá)40GHz。對(duì)于DDR中常見的共用返回路徑的情況,SIPro通過算法識(shí)別過孔區(qū)域,使用三維電磁場(chǎng)算法FEM,精確提取由此產(chǎn)生的串?dāng)_,保證仿真精度。
Memory Designer
ADS Memory Designer是ADS中專門針對(duì)DDR仿真定制的組件。其目的就是減小DDR仿真的復(fù)雜度,同時(shí)保證DDR仿真的效率和精度。
在Memory Designer中,只需要一張?jiān)韴D便可以分別進(jìn)行通道和瞬態(tài)仿真。而由于總線形式的使用,則將傳統(tǒng)設(shè)置方法所需的數(shù)小時(shí),縮減至數(shù)分鐘,同時(shí)也減小了設(shè)置錯(cuò)誤的風(fēng)險(xiǎn)。
此外,Memory Designer中的DDR BUS仿真器,可以根據(jù)信號(hào)的上升與下降,使用對(duì)應(yīng)的階躍響應(yīng),獲得正確的波形。如下圖所示,DDR BUS仿真器在上升沿與下降沿不對(duì)稱的情況下,有很高的精確度。
另一方面,基于Keysight成熟的通道仿真算法,DDR BUS仿真器可以根據(jù)AMI模型中的均衡算法,對(duì)信號(hào)進(jìn)行均衡,同時(shí)可以準(zhǔn)確預(yù)測(cè)在低誤碼率情況下的抖動(dòng)對(duì)信號(hào)的影響。在下圖中也可以發(fā)現(xiàn),當(dāng)DQ與DQS存在時(shí)間差時(shí),會(huì)造成眼圖的偏移。
05 ADS DDR5仿真實(shí)例
圖中顯示了在ADS Memory Designer環(huán)境中DDR5基本的仿真結(jié)構(gòu),所有信號(hào)以總線形式連接,設(shè)置過程只需要短短幾分鐘。其中控制器和內(nèi)存模塊都使用了IBIS-AMI模型,并且允許對(duì)AMI模型中的參數(shù)進(jìn)行編輯。
圖中顯示了DDR5在ADS Memory Designer 中的仿真結(jié)果。可以發(fā)現(xiàn),經(jīng)過AMI模型中均衡算法處理的DQ信號(hào),眼圖張開程度明顯增加。
以上介紹了DDR5帶來的挑戰(zhàn),以及為了應(yīng)對(duì)這些挑戰(zhàn),Keysight Pathwave做出的創(chuàng)新與應(yīng)對(duì)。