由人工智慧驱动的设计应用
效能功耗比(performance-per-watt)已成為確保设计品質需優先考量的事項之"一,這導致技術重點與设计功耗優化方法產生轉變。變動式工作電壓(variable operating voltage)在優化效能功耗比成果方面具有極大潛力,但這需有一種準確且有效的签核方法予以探索。新思科技的Fusion设计平台(Fusion Design PlatformTM)具有構建於單一 RTL-to-GDSII資料模型的獨特性,可提供全流程(full-flow)的電壓優化與收斂(closure)方法,能在對晶片设计要求最為嚴苛的半導體領域,實現最佳的效能功耗比成果。
高效能运算(贬笔颁)是半導體產業中成長最快的设计領域之"一,可支援廣泛的應用,包括雲端資料中心、人工智慧、行動運算、自駕車等。雖然這個領域持續為實現最高设计效能而努力,但功耗因素可能會限制許多應用領域的设计效能。例如,能源和冷卻成本會直接影響資料中心的盈利,而對於手機則必須在效能與電池壽命之"間謹慎取得平衡。
因此,除了既定的效能、功耗與面積(PPA)標準外,效能功耗比已成為HPC设计品質的最優先考量之"一,並致使技術重點以及设计功耗優化方法的變革。
另一方面,為求實現最佳的效能功耗比目標,HPC设计採用最先進的FinFET製程製造。創新的「鰭式」(fin)對電子流有卓越的控制效果,但相較於同等的平面結構,雖然能實現更快的切換與更低的漏電流,但完成一次切換則需耗費更多功率。此外,用於HPC设计的運算密集型工作負載也會導致幾乎不間斷的切換,進而使功耗分佈將大量地受到動態功耗主導。這項分量(component)顯示電晶體在各狀態間切換時所消耗的功率。
完成一次切换的功耗主要来自电晶体的闸极电容器(贵贰罢)。根据下图1(左)所示的功耗方程式,在相同频率下,功耗与闸极电容呈线性关係,但与工作电压的平方值成正比。
既有的動態功耗優化技術以減小電晶體的尺寸為目標,這會直接導致閘極電容降低。然而,降低工作電壓對於降低動態功耗具有更高的潛力。如下圖2(右)所示,7奈米FinFET设计的個案研究顯示,僅是降低5%的工作電壓,就能使動態功耗降低9%。
图说1(左):贵贰罢电晶体动态功耗方程式
图说2(右):工作电压与动态功耗之"个案研究
雖然降低工作電壓能有效優化動態功耗,但它在半導體设计領域中尚未有廣泛部署的技術。接下來,本文將回顧導致這項技術欠缺的問題所在。
以往的半導體设计環境中,工作電壓(Vdd)代表一個經演繹且獨立於生產设计環境的因素。這個過程涉及晶圓代工廠在電晶體裝置層級上進行分析,伴隨對一小部分單元(cell)的內部模拟,藉此確定合理的最小工作電壓範圍。然後,這些預先確立的工作電壓將驅動所有设计的技術庫特性、设计優化與签核收斂程序的變革。
如下圖3所示,優化效能功耗比的设计人員會針對不同效能目標進行多次運行,以探索預設電壓內的解决方案合宜範圍。
圖說3:離散電壓的效能功耗比優化
假设一个专案在预定电压下达到所有笔笔础目标。在这种情况下,则由於缺乏技术库,导致没有可行的方法可以在较低工作电压下,探索进一步的优化方式。
因此,较為普遍的硅后(辫辞蝉迟-蝉颈濒颈肠辞苍)测试做法,就是使用硅测试平台探索较低的工作电压(亦称為痴min分析),並找出可持續正常運行的最低工作電壓。如果可訂立新的資料庫,那麼其結果將可用於影響決策。這種反饋循環可能需要數月或多個设计週期,才能對效能功耗比之"提升產生顯著的影響。
電壓與時序回應之"間的非線性關係,將使線性電壓插值(voltage interpolation)的部署受限於兩個緊密間隔(closely spaced)的更高標準電壓資料庫之"間。2017 年,PrimeTime? 時序签核解决方案建立經代工廠認證的先進電壓調節技術,可在廣泛範圍的任何電壓水平上進行準確分析。如下圖4所示,其可在寬間距之"間或較低電壓水平下實現準確签核的電壓調節效果。
圖說4:PrimeTime 的先進電壓調節技術
设计人員現在可以「掃描」(sweep)電壓範圍,在無限的電壓水平下試運行相同的设计方案,最終找出具備所需的PPA或效能功耗比目標的最佳電壓。如下圖5所示,雖然事實證明 PrimeTime 時序签核解决方案既準確又有效,但手動掃描流程可能曠日廢時,且需耗費大量资源。經過探索,運行的次數將與備選電壓水平數量呈線性增長。
圖說5:具備掃描電壓水平功能的效能功耗比優化方式
Fusion CompilerTM RTL-to-GDSII解决方案以及IC Compiler IITM超融合佈局佈線解决方案是業界唯一在實作以及PPA 優化期間,部署新思科技最受信賴的黃金签核解决方案的数位设计解决方案。其獨一無二的Signoff Fusion技術能在實作環境中無縫啟動PrimeTime 時序签核解决方案、PrimePower RTL-to- signoff功耗分析以及StarRCTM寄生析出(parasitic extraction)签核分析引擎,以實現準確的時序、功耗及互連RC指導,包括 PrimeTime 時序签核解决方案的先進電壓調節技術。
在设计優化過程中引入電壓作為變量,讓Fusion Compiler RTL-to-GDSII解决方案以及IC Compiler II佈局佈線解决方案能夠擴展效能功耗比解决方案的合宜範圍。藉由調整工作電壓並同時推動更高的效能、更低的功耗以及更小的面積,優化引擎可在單次優化運行中,對工作電壓水平進行本機(natively)探索,且不必進行以往在運行電壓掃描時所需的昂貴外部迭代。
在具備固定頻率目標的设计流程中,變動式工作電壓提供了進一步的探索機會,透過較低的工作電壓直接降低動態功耗,藉以降低總體功耗並同時盡量減低漏電與對面積造成的影響。如下圖6(左)所示,在5奈米HPC设计中,降低14%的工作電壓將可使總體功耗降低26%,同時又能滿足相同的頻率目標.。
在具備固定總體功耗目標的设计流程中,變動式工作電壓可免除先前為尋找可能的最高頻率所需的頻率和電壓掃描。如圖7(右)所示,優化引擎可於本機探索電壓範圍並於單次運行中找出最佳可能的頻率,而這在時間與资源的雙重限制下將難以實現。
图说6:以较低工作电压改善总体功耗
图说7:以固定功耗目标改善频率
電壓優化開啟了PPA優化的契機,提升PPA曲線,並提高SoC设计的效能功耗比。其創新的本機電壓掃描擴展優化解决方案的空間探索,可在較低的工作電壓下實現最佳的效能功耗比。
降低工作電壓除了顯著提升效能功耗比,同時也消除了固定電壓设计流程無形中產生的過多裕量(margins)。此外,先進製程節點中較高單元及功耗密度也需要較複雜的工作電壓降壓分析以及裕量分析方法,以避免與壓降(voltage drop)相關的设计失敗問題。
PrimeShieldTM设计穩健性解决方案擴展 PrimeTime時序签核解决方案的核心技術,並引入本機電壓分析功能來因應這個挑戰。有別於根據時序裕量報告關鍵時序路徑的靜態時序分析,這種新的分析方式是依據新指標「電壓裕量」(voltage slack)來回報關鍵路徑。如下圖8所示,這項新指標顯示出可滿足時序所要求路徑的每一單元或每一路徑最小壓降。
圖說8:關鍵路徑的電壓裕量
時序關鍵路徑通常使用最強的驅動單元,以確保路徑延遲可滿足效能要求。如圖9所示,這些強力的驅動單元通常對電壓變化較不敏感。同時,較不關鍵的時序路徑可能會採用較弱的驅動單元,而此類驅動單元對電壓則較為敏感,且於设计遇到工作電壓下降時就會提早失效。使用靜態時序分析方法,不太容易找出會此類會誘發風險的路徑,通常需要進行大量的電壓掃描才能發現。
图说9:时序关键路径(左)与电压关键路径(右)的电压裕量分析比较
PrimeShield设计穩健性解决方案的電壓裕量分析提供一種直接有效的途徑,藉此分析並回報告相關資訊以供進一步優化。為促進有效的優化方法,除電壓裕量報告外,PrimeShield设计穩健性解决方案的電壓穩健性分析更會對電壓關鍵路徑執行瓶頸分析,以識別對電壓變化最敏感並具有高時序故障風險的單元。
新思科技最受歡迎的ECO签核解决方案─PrimeTime ECO设计收斂签核以及Tweaker ECO签核可提供ECO指導以改善上述指標。藉由將電壓敏感單元與較不敏感的對應單元進行交換,ECO變更可提升设计對壓降的穩健性,或進一步微調所有签核時序情境中的工作電壓。
這項技術亦可藉由方法論實現電壓裕量的均勻性以及經改良的電壓裕量分析。透過在需要的地方確保電壓裕量並消除整體设计中的任何顯著風險,设计人員可避免在整體範圍內採用過高的裕量,同時又可享有較低工作電壓所帶來的功耗優勢。
隨著半導體產業,尤其是HPC设计領域不斷推出更佳的效能功耗比,Fusion Compiler RTL-to-GDSII解决方案以及IC Compiler II佈局佈線解决方案的電壓優化功能,皆以新思科技的黃金签核分析解决方案為基礎,於優化期間將工作電壓引入作為一項變數,以此提供一種差異化路徑,有效提升先進製程節點设计的效能功耗比。
PrimeShield设计穩健性解决方案的電壓裕量分析是基於相同的核心基礎。新的分析指標使设计人員能夠有效查明造成電壓穩健性瓶頸的原因,提升電壓裕量效率,並找出可直接精細微調工作電壓的機會。
新思科技獨特的Fusion设计平台(Fusion Design PlatformTM)構建於單一的 RTL-to-GDSII資料模型之"上,提供全程電壓優化及收斂方法,替要求最為嚴刻的半導體領域實現最佳的效能功耗比成果。