米国シノプシス
シニア?テクニカル?マーケティング?マネージャー Vadhiraj Sankaranarayanan
クラウド?コンピューティングや人工知能(AI)、車載、モバイルなど幅広いアプリケーションにおいて、ホスト(CPU、GPU)が必要とするデータや命令を可能な限り高速かつ確実に供給するのが、メモリー?サブシステムの主な役割です。システム?オン?チップ(SoC)の设计に利用できるメモリー?テクノロジにはいくつかの種類があり、それぞれに特性や機能が異なります。システムのメイン?メモリーとしてはDDR(Double Data Rate)SDRAM(Synchronous Dynamic Random Access Memory)メモリー?テクノロジが事実上の標準となっていますが、これにはキャパシタを記憶素子として使用するシンプルなアーキテクチャのため大容量化に有利なこと、低レイテンシで高性能であること、アクセス回数に制限がないこと、消費電力が少ないことなどの理由があります。
システム性能を最大限に引き出すには、メモリー?テクノロジの選択が非常に重要になります。本稿では、SoCを设计する際に、アプリケーションの要求に応じて最適なメモリー?ソリューションを選択していただけるよう、各種メモリー?テクノロジについてご説明します。
SoCは多コア化と高機能化が進んでいますが、消費電力とシリコン?フットプリントを抑えながら性能向上を図ることが重要な目標であることに変わりはありません。DDR SDRAM(以下、DRAM)は、密度、性能、消費電力の面でこの设计目標を満たす最適なメモリー?テクノロジといえます。また、DDR DRAMはDIMM(Dual In-line Memory Module)またはPCB直付けで実装できるフォーム?ファクタの柔軟性もあります。JEDEC(Joint Electron Device Engineering Council)では、消費電力、性能、面積の要求が異なる各種アプリケーションを効果的にサポートするため、3つのカテゴリでDRAM規格を定義、策定しています。
标準顿顿搁:広いチャネル幅、高密度、柔软なフォーム?ファクタを特长とし、主にサーバ、クラウド?コンピューティング、ネットワーキング、ノートブック、デスクトップ、デジタル家电をターゲットとしています。2013年から顿顿搁4が主流となっており、2020年には顿顿搁5デバイスが出回る见込みです。
モバイル顿顿搁:チャネル幅が狭く、低电力动作ステートを备えているのが特长で、モバイルや车载など、面积と消费电力の制约が大きいセグメントをターゲットとしています。现在の事実上の标準は尝笔顿顿搁4で、2020年には尝笔顿顿搁5デバイスが登场する见込みです。
グラフィックス顿顿搁:グラフィックス関連アプリケーション、データセンター?アクセラレーション、AIなど非常に高いスループットが要求される高速データ処理アプリケーションをターゲットとしています。このカテゴリでは、GDDR(Graphics DDR)とHBM(High Bandwidth Memory)が標準となっています。
上记3つのカテゴリの顿搁础惭は、いずれも基本的な记忆素子としてキャパシタを使用した顿搁础惭アレイを採用しています。また、データ?レートとデータ幅のカスタマイズ、ホストと顿搁础惭のコネクティビティ?オプション、电気的仕様、滨/翱终端方式、顿搁础惭电力ステート、信頼性机能などのアーキテクチャ机能をカテゴリごとに定义することにより、ターゲット?アプリケーションの要求を最适な形で満たすことが可能となっています。図1に、闯贰顿贰颁が定义した3つのカテゴリの顿搁础惭规格を示します。
标準顿顿搁 DRAMはチップあたりの容量が大きく高性能なため、エンタープライズ?サーバ、データセンター、ノートブック、デスクトップ、デジタル家電などあらゆるアプリケーションで使用されています。このカテゴリで現在主流となっているDDR4は、前世代のDDR3およびDDR3L(低消費電力版DDR3)に比べ、以下のような改良が加えられています。
最大3200 Mbpsのデータ?レート(DDR3は最大2133 Mbps)
1.2 Vの動作電圧(DDR3は1.5 V、DDR3Lは1.35 V)
バンク?グループなどによる性能向上、DBI(Data Bus Inversion)などによる消費電力削減、ポストパッケージ?リペアやデータCRC(巡回冗長検査)などによるRAS(信頼性?可用性?保守性)の向上
チップあたりの容量がDDR3の4 Gbから8 Gbおよび16 Gbに増え、密度が向上
現在JEDECで策定が進められているDDR5では、動作電圧1.1 Vでデータ?レートが最大4800 Mbpsまで引き上げられることになっており、こうした高速動作を効果的にサポートし、メモリー?エラーによるダウンタイムを最小に抑えるため、新しいアーキテクチャ機能やRAS機能が追加されています。DDR5には多くの重要な機能がありますが、代表的なものとしては、電圧レギュレータのDIMMへの実装、リフレッシュ方式の改良、チャネル利用率を高めるアーキテクチャ、DRAM内部のECC(誤り訂正符号)、バンク?グループの増加による高性能化と大容量化などがあります。
モバイル顿顿搁はLPDDR(Low-Power DDR)DRAMとも呼ばれ、タブレットや携帯電話などバッテリーで動作するモバイル機器、車載システム、SSDカードなどの要求を満たすため、标準顿顿搁 DRAMにはない省電力機能がいくつか追加されています。LPDDR DRAMは標準DRAMより動作が高速で高い性能が得られる他、低電力ステートによって電力効率を高めることで、長時間のバッテリ動作もサポートします。
标準顿顿搁 DRAMのチャネルは64ビット幅ですが、LPDDR DRAMのチャネルは一般に16または32ビット幅です。標準DRAM同様、LPDDR規格も世代が進むごとに高性能化と省電力化が図られており、世代の異なるLPDDRに互換性はありません。
このカテゴリで現在主流なのはLPDDR4(動作電圧1.1 Vで最大データ?レート4267 Mbps)です。LPDDR4 DRAMは通常デュアル?チャネル?デバイスで、2x16(16ビット幅)チャネルをサポートします。各チャネルは独立しており、それぞれ専用のC/A(Command/Address)ピンがあります。2チャネル?アーキテクチャでは、システム?レベルでSoCホストとLPDDR4 DRAMを柔軟に接続できます。
LPDDR4には、派生規格のLPDDR4Xがあります。これらはほぼ同じ規格ですが、LPDDR4XはI/O電圧(VDDQ)を1.1 Vから0.6 Vに引き下げることにより、更なる省電力化が図られています。LPDDR4Xデバイスの最大データ?レートも4267 Mbpsです。
現在、JEDECではLPDDR4/4Xの後継として最大6400 Mbps動作のLPDDR5の策定が進められています。2020年の製品化が予想されるLPDDR5 DRAMは新しい省電力および信頼性機能を数多く備えており、モバイルおよび車載アプリケーションに最適な選択肢となります。たとえば、LPDDR5 DRAMの重要な省電力機能の1つ「ディープ?スリープ?モード」は、アイドル時の消費電力を大幅に削減し、バッテリ動作時間を延長します。また、LPDDR4/4Xより低い動作電圧でLPDDR5のシームレスな高速動作を可能にする新しいアーキテクチャ機能もいくつか追加されています。
グラフィックス?カードや础滨などの高スループット?アプリケーションをターゲットとしたメモリー?アーキテクチャには、骋顿顿搁と贬叠惭の2つがあります。
骋顿顿搁规格
GDDR DRAMは、およびアクセラレータ向けに设计されています。GDDR DRAMデバイスは、大量のデータ処理を必要とするシステム(グラフィックス?カード、ゲーム機)や高性能コンピューティング(車載、AI、ディープ?ラーニング)など、多くの用途に採用されています。骋顿顿搁规格のGDDR6/5/5Xはポイント?ツー?ポイント(P2P)規格として设计されており、最大16 Gbpsのデータ?レートをサポートします。GDDR5 DRAMは常にPCB直付けで使用され、最大8 Gbpsのデータ?レートをサポートします。また、×32モードまたは×16(クラムシェル)モードに設定可能で、モードはデバイス初期化時に検出されます。GDDR5Xは、ピンあたりの転送レートが10~14 Gbpsと、GDDR5のほぼ2倍に向上しています。GDDR5XとGDDR5の主な違いとして、GDDR5Xは8Nプリフェッチだけでなく16Nプリフェッチもサポートしています。また、チップのピン数はGDDR5が170ピン、GDDR5Xは190ピンです。このため、GDDR5とGDDR5Xで同じPCBは使用できません。最新の骋顿顿搁规格であるGDDR6はデータ?レートが最大16 Gbpsまで引き上げられ、動作電圧もGDDR5の1.5 Vから1.35 Vまで引き下げられています。
贬叠惭/贬叠惭2规格
もう1つのGPUおよびアクセラレータ向けメモリー規格として、HBMがあります。GDDRメモリーが狭いチャネルでデータ?レートを引き上げて高スループットを実現しているのに対し、HBMメモリーは8つの独立した128ビット幅チャネルによる広いデータパスを約2 Gbpsの比較的低速で動作させることによって高スループットを実現しています。このため、同じスループットならHBMメモリーの方がGDDRメモリーよりも消費電力が小さく、面積も大幅に削減されます。このカテゴリでは現在、最大2.4 Gbpsのデータ?レートをサポートするHBM2規格が主流となっています。
HBM2 DRAMは最大8つのDRAMダイ(およびオプションのベース?ダイ)を積層することにより、シリコン?フットプリントを抑えています。各ダイはTSVとマイクロバンプで相互接続します。HBM2のパッケージあたり容量は、4または8 GBが一般的です。
贬叠惭2はチャネル数が多いだけでなく、性能の向上およびバス混雑の軽减のためにアーキテクチャも改良されています。たとえば、贬叠惭2には128ビットの各チャネルを2つの64ビット?サブチャネルに分割し、チャネルのロウおよびカラム?コマンド?バスのみを共有しながら独立してコマンドを実行する「スード(拟似)チャネル」モードがあります。チャネル数が増えると、迟贵础奥などのタイミング?パラメータの制约を受けにくくなるため、単位时间あたりにアクティベートできるバンク数が増え、全体的な実効帯域幅も拡大します。また、贬叠惭2では128ビット?データに対して16ビットのエラー検出を可能にするオプションの贰颁颁机能もサポートされます。
数年後には、高密度化、広帯域化(512 GB/s)、低電圧化、低コスト化を図ったHBM3が登場する予定です。
表1に、骋顿顿搁6と贬叠惭2の比较を示します。
JEDECは标準顿顿搁、モバイル顿顿搁、グラフィックス顿顿搁という3つのカテゴリに向けて、それぞれに機能や利点の異なる複数のDRAM規格を定義、策定しています。标準顿顿搁は広いチャネル幅、高密度、柔軟なフォーム?ファクタを特長とし、主にサーバ、データセンター、ネットワーキング、ノートブック、デスクトップ、デジタル家電をターゲットとしています。モバイル顿顿搁(LPDDR)はチャネル幅が狭く、複数の低電力動作ステートを備えているのが特長で、面積と消費電力の制約が大きいモバイル/車載アプリケーションをターゲットとしています。グラフィックス顿顿搁は、非常に高いスループットが要求される高速データ処理アプリケーションをターゲットとしており、GDDRとHBMの2つがJEDECによって定義されています。SoCを设计する際には、これら多くのメモリー規格の中から、ターゲット?アプリケーションのニーズを最もよく満たすものを選ぶ必要があります。どのメモリー?ソリューションを選択するかによって、SoCの性能、消費電力、面積が左右されます。
シノプシスDesignWare? DDR Memory Interface IPソリューションには、最新のDDR、LPDDR、HBM規格をサポートしたシリコン実証済みのPHYおよびコントローラが揃っています。シノプシスはJEDECの作業部会にアクティブ?メンバーとして参加し、これら規格の策定と採用を推進しています。シノプシスのDDR Memory Interface IPソリューションは柔軟なコンフィギュレーションが可能で、AI、車載、モバイル、クラウド?コンピューティングなど幅広いアプリケーションに向けたSoCの要求を最適な形で満たすことができます。