Ansysは次世代の技術者を支援します
学生は、世界クラスのシミュレーションソフトウェアに無料でアクセスできます。
未来をデザインする
Ansysに接続して、シミュレーションが次のブレークスルーにどのように貢献できるかを確認してください。
人工知能(AI)がもたらす可能性を活かしたいという世界のニーズに応えるデータセンターの建設が進んでおり、かつてない規模の電力需要が発生しています。2018年には、米国のデータセンターのエネルギー消費量が76TWhに達しました。これは米国の総エネルギー消費量の1.9%に相当します。さらに、米国のデータセンターのエネルギー消費量は2028年までに325~580TWhに達すると予測されています。これは、米国の総エネルギー消費量の約12%を占める計算になります。
こうしたエネルギー消費量は、チップやプリント基板(PCB)から、施設内の冷却システムまで、AIデータセンターのあらゆる要素において大きな課題を突きつけています。つまり、AIデータセンターのエネルギー需要をどのように満たすかという問題は、サーバーファーム自体に限定されるものではなく、データセンター内のあらゆるシステムに関わる課題なのです。そのため、この課題に効果的に対処するには、データセンターのあらゆる要素を視野に入れた包括的なアプローチが必要です。Ansys, part of Synopsysでは、チップレベルからデータセンターに至るまでのエネルギー需要に対応するために必要なツールを提供しています。
AIデータセンターは、複数のシステムが絡み合う技術的課題である。
データセンターは、その目的に関係なく、複数のサーバールームで構成される大規模な施設であり、これらのサーバールームには、個々のサーバーを収容するラックが並んでいます。データセンターの外観は、どの企業が建設したかに関わらず、ほとんどの場合、同じです。ラックを設置する前にサーバールームを可能な限り効率的に運用するために、いくつかの重要な要素を考慮する必要があります。その中で最も重要なのが電力です。
データセンターの運用には電力が必須です。データセンターにおける水の使用量、電力網の制限、熱放散はすでに社会的な懸念事項となっており、多くの企業が風力、太陽光、原子力などの持続可能な代替エネルギーを検討しています。流体シミュレーションソフトウェアであるAnsys Fluent、材料データ管理ソフトウェアであるAnsys Granta MI、3DシミュレーションソフトウェアであるAnsys Discoveryなどのシミュレーションソリューションを使用することで、選択したエネルギー源の環境フットプリントを設計の早い段階で評価することができます。こうした評価を行うことにより、データセンターの環境フットプリントに最も大きな影響を与える領域、コンポーネント、材料、プロセス、およびその他の要因を把握できるようになります。
次に、施設を効率的に運用するために、クリーンで信頼性の高い電力が十分に確保されることを確認する必要があります。サーバーの電力要件は、ワークロードやサーバー構成によって変わるため、データセンターの電力需要を算出するのは容易なことではありません。高度な電磁界ソルバーのAnsys Maxwellや寄生成分抽出に対応した電磁界シミュレーションソフトウェアであるAnsys Q3D Extractorなどのシミュレーションソリューションは、電力需要を評価し、負荷バランスと電力品質を最適化するのに役立ちます。
しかし、サーバールームにおいて最大の課題となるのは冷却システムです。コンピューターの隣に座ったことがある方なら、どれほどそれらが熱くなるかをご存知でしょう。サーバールームでは、それが10倍にもなるのです。サーバールームの温度と湿度を最適な範囲に維持することは、パフォーマンスとハードウェアの寿命を確保するために不可欠です。過熱はダウンタイムにつながる可能性があり、不安定な湿度レベルは腐食や静電気放電を引き起こすことがあります。エンジニアは、Fluent、電子機器冷却シミュレーションソフトウェアであるAnsys Icepak、熱解析に特化したモデリングソフトウェアであるAnsys Thermal Desktopなどのシミュレーションソリューションを使用することで、レイアウトや機器仕様を変更し、熱マネジメントを最適化することが可能となり、コストのかかる試行錯誤や追加の冷却設備への不要な投資を回避できるようになります。また、シミュレーションソリューションは、データセンターから発生する騒音にも対応できるため、データセンターが置かれるコミュニティへの影響を最小限に抑えることができます。
サーバールームにおけるエンジニアリング上の検討事項
サーバーラックがデータセンターの骨であるとするならば、チップはその頭脳です。現在、特殊な処理要素とメモリを高度なマルチダイパッケージに統合したチップが増えています。こうしたシステムを設計するには、包括的なマルチフィジックスシミュレーションによってのみ予測できる、電気・熱・機械領域にわたる複雑な相互作用を理解する必要があります。電源供給ネットワークと熱マネジメントシステムは総合的に解析する必要があります。なぜなら、電気的性能が温度プロファイルに影響を与え、同時に熱放散が電気的性能に影響するという連続的なフィードバックループが存在するからです。AIワークロードで使用され、各計算フェーズで大きな電力変動が発生する可能性のあるニューラルプロセッシングユニット(NPU)においては、この相互依存性が特に重要です。
同様に、ダイ間の高帯域幅・低消費電力のインターフェースでは、厳しさを増す電力制約の中でシグナルインテグリティを確保するために、詳細な電磁界解析を行う必要があります。この課題は、ダイ間通信速度の向上に伴い、一層複雑化します。この複雑さは、NPUやその他の専用プロセッサが通常、異なる電圧レベルおよび変動する電力要件で動作する複数のドメインにわたるパワーインテグリティにも及びます。
もう1つの課題として機械的応力があり、複雑な構造で組み立ておよび動作中に熱膨張や収縮が発生すると、応力によって誘発されるパラメータ変動によって、信頼性と電気的性能の両方に影響が及ぶ可能性があります。
システム設計の範囲がナノメートルスケールのトランジスタからセンチメートルスケールのパッケージ、さらにはそれ以上に広がり、マルチスケール解析の課題がますます重要になっています。このような幅広い物理的寸法に対応するためには、精度と計算効率を維持しつつ、異なるスケール間をシームレスに移行できるシミュレーションツールが必要です。具体的には、パワーインテグリティシミュレーションソフトウェアSynopsys RedHawk-SC、シリコン向けに最適化されたサインオフ用電磁界モデリングソフトウェアSynopsys Exalto、大規模IPおよび3D集積回路(3D-IC)向けの静電放電信頼性サインオフソフトウェアSynopsys PathFinder-SCのほか、Synopsysのハイパフォーマンスコンピューティング(HPC)およびデータセンターソリューションなどが挙げられます。
Synopsys RedHawk-SC、Synopsys Exalto、およびSynopsys PathFinder-SCを用いたシステムオンチップの検証
AIデータセンターと言えば、高性能チップが並ぶサーバールームにばかり注目が集まりがちですが、AIデータセンターで使用される電力の最大60%が、これらのチップを冷却するために構築されたシステムによって消費されています。サーバールーム内で発生する熱の量を低減できれば、サーバールームを適切な温度に保つために必要な冷却負荷を減らすことができます。
ラックの構成や、ラック内および室内の空気や水の流れは、エネルギー要件に大きな影響を与える可能性があります。シミュレーションソフトウェアを活用することで、さまざまなラックおよびサーバー構成をモデル化し、計算性能や熱性能などの最適な組み合わせを特定することができます。これらの選択肢に加えて、2相冷却や浸漬冷却などの冷却ソリューションのシミュレーションを個別または組み合わせて取り入れることで、データセンターの中核部分に最適な構成を特定し、計算性能、エネルギー消費量、発熱量、冷却システムの効率性、コストを最適化することができます。
しかし、データセンターのすべての要素が消費電力と熱放散を最小限に抑えるように設計および構築されていたとしても、データセンター内の活動によって熱は発生し続けます。冷却システムはその熱をサーバールームから排出しますが、適切に設計されたデータセンターでは、熱交換システムや廃熱回収システムを介してエネルギーとして再利用することができます。この電力は、本来なら発電システムから供給を受ける必要がある電力の代わりに、データセンター内で再利用することができます。構造シミュレーションソフトウェアAnsys Mechanical、Fluent、Thermal Desktopなどのシミュレーションソリューションを活用することで、AIデータセンター全体の電力消費を最適化する機会を特定することができます。
チップレベルでのさまざまな熱マネジメントシミュレーション(左)。液冷式および空冷式のサーバールームの熱マネジメントシミュレーション(右)。
最適化されたAIデータセンターに必要なすべてのコンポーネントをメーカー1社または設計者1人が設計することはありません。チップメーカーはチップを、サーバーベンダーやネットワークベンダーはそれらのGPUを使用するシステムを、そしてその他のベンダーは空調、換気(HVAC)システム、電力品質調整および変圧システム、セキュリティシステムなどを構築しています。
AIデータセンターの設計者は、シミュレーションベースのデジタルツインプラットフォームであるAnsys TwinBuilderを使用し、他のメーカーやベンダーが製造するコンポーネントや設備のシミュレーションを組み合わせることで、データセンターのデジタルツインを作成することができます。メーカーやベンダーは、自社のモデルを次数低減モデル(ROM)形式で保存できるため、AIデータセンターの設計者はそのデータセンターコンポーネントのシミュレーションを活用することが可能になります。設計者はAIデータセンターのデジタルツインを構築することで、計算性能からエネルギー消費に至るまで、データセンターのパフォーマンスのあらゆる側面を完全にモデル化し、調整することができます。また、設計のさまざまな要素を操作して変更をシミュレーションできるため、冷却インフラストラクチャの要素を変更した場合などの排出量や電力消費への影響を、実際のデータセンターの着工前に調査できるようになります。
そして、最適な設計がデジタルツインでモデル化されると、そのデジタルツインはデータセンター自体の展開とスケールアウトに向けた指針となります。データセンターが構築された後に、デジタルツインをデータセンターとデータ連携すれば、そのデジタルツインはパフォーマンス面の監視と管理に活用できるようになります。
AIが主導する未来のエネルギー需要は、目を見張るものがありますが、AIがもたらす変革の可能性もまた、計り知れないものがあります。設計者は、適切なツールを使用することで、AIを活用した未来を実現できるデータセンターを構築できるだけでなく、アップタイムとパフォーマンスを確実に維持しながら、電力要件、エネルギーの無駄、環境への悪影響を最小限に抑えることも可能になります。
Synopsysのソリューションがデータセンターの設計と生産性をどのように最適化するか、またAnsysのソフトウェアソリューションがお客様のエネルギーニーズにどのように対応するかをご覧ください。
Ansys Advantageブログでは、専門家が投稿した記事を公開しています。Ansysのシミュレーションが未来のテクノロジーにつながるイノベーションをどのように推進しているかについて最新の情報をご覧ください。