スーパーコンピューターをマウントする方法

Posted on
著者: John Stephens
作成日: 1 1月 2021
更新日: 2 J 2024
Anonim
【バケモノ】超巨大な「スーパーコンピュータ」を買ったぜw【ラックサーバー】
ビデオ: 【バケモノ】超巨大な「スーパーコンピュータ」を買ったぜw【ラックサーバー】

コンテンツ

はwikiです。つまり、多くの記事が複数の著者によって書かれています。この記事を作成するために、18人(一部は匿名)がこのエディションに参加し、時間の経過とともに改善されました。

毎秒数千億の浮動小数点計算を行わなければならないマシンが必要ですか?セラー内のスーパーコンピューターがどのようにブレーカーを爆破したのかを説明するストーリーが必要ですか?高性能コンピュータのクラスタ(またはクラスタ)を構築することは、週末に適切な予算で専門家が克服できる課題です。技術的な観点から見ると、最新のマルチプロセッサスーパーコンピューターは、問題を解決するために並行して動作するコンピューターのネットワークです。簡単な手順に従って機器をマウントし、必要なソフトウェアをインストールすることで、スーパーコンピューターを作成することもできます。


ステージ



  1. 必要な機器とリソースを決定します。 ヘッドノード、少なくとも12個の他の同一ノード、イーサネットスイッチ、電源ユニット、シェルフが必要です。電気、冷却、スペースのニーズを判断します。また、プライベートネットワークに使用するIPアドレス、ノードの名前、インストールするソフトウェア、およびコンピューティング機能に使用するテクノロジーを決定する必要があります(これについては後で説明します)。
    • ハードウェアに多大な費用がかかる場合でも、この記事で紹介するすべてのソフトウェアは無料であり、ほとんどのソフトウェアには権利がありません。
    • スーパーコンピューターの到達速度を把握したい場合は、このツールを使用できます:http://hpl-calculator.sourceforge.net/。


  2. ノードをインストールします。 ノードを組み立てるか、事前に組み立てられたサーバーを入手する必要があります。
    • 十分なスペース、適切な冷却システム、エネルギー最適化を備えたサーバーシャ​​ーシを選択してください。
    • また、1ダースの古いサーバーを使用することもできます。これらの合計は個々のユニットの能力を超え、多くのお金を節約できます。システム全体がスムーズに動作するには、すべてのプロセッサ、ネットワークアダプタ、およびマザーボードが同一である必要があります。もちろん、各ノードのRAMとストレージ、およびヘッド用の少なくとも1つのディスクドライブを忘れないでください。



  3. サーバーをシェルフにインストールします。 シェルフの上部に重みが付けられていない場合は、下部から始めます。また、あなたを助けるために友人が必要になります。サーバーは重くなる可能性があり、棚のレールでそれらを案内するのは困難です。


  4. シャーシの上にイーサネットスイッチを取り付けます。 少し時間をかけて設定してください。 9000バイトのジャンボフレームサイズを許可し、IPアドレスを最初の手順で選択した静的アドレスに設定し、SMTPスヌーピングなどの不要なプロトコルを無効にします。


  5. 現在のユニットをインストールします。 ノードに必要な電流量に応じて、おそらく220ボルトのユニットが必要になります。


  6. ハードウェアを構成します。 すべてをインストールしたら、ハードウェアの構成を開始できます。 Linuxは、科学計算に最適な環境であるだけでなく、数百または数千のノードに完全に無料でインストールできるため、HPCクラスターのデフォルトのオペレーティングシステムです。これらの各ノードにWindowsをインストールする必要がある場合に支払う価格を想像してください。
    • すべてのマザーボードで同じである必要がある最新のBIOSおよびマザーボードファームウェアをインストールすることから始めます。
    • お好みのLinuxディストリビューションを各ノードにインストールし、グラフィカルインターフェイスを備えたディストリビューションをヘッドノードにインストールします。 CentOS、OpenSuse、Scientific Linux、RedHat、またはSLESがよく使用されます。
    • この記事では、Rocks Clusterを強くお勧めします。クラスタが適切に動作するために必要なすべてのツールをインストールすることに加えて、ロックスは優れた方法を使用して、PXEブートとRed Tea Tree Oilクイック起動手順を使用して、自身の多くのインスタンスをノードにすばやく「分散」します



  7. ソフトウェアをインストールします。 伝送、リソース管理、およびその他の必要なライブラリ用のインターフェースをインストールします。前のステップでRocksをインストールしなかった場合は、必要なすべてのソフトウェアを手動で構成して、並列計算メカニズムをアクティブにする必要があります。
    • まず、Torque Resource Managerなどのbash管理システムが必要になります。これにより、異なるタスクを複数のマシンに分割して分散できます。
    • 設定を完了するには、Maui Cluster Schedulerを使用してTorque Torqueを実行します。
    • 次に、異なるマシン上のプロセスが同じデータを共有するために必要な送信側インターフェースをインストールする必要があります。 OpenMPをインストールすると、非常に使いやすいです。
    • 並列計算プログラムを作成するために、マルチスレッドライブラリとコンパイラを忘れないでください。繰り返しになりますが、Rocksは最適なソリューションです。


  8. ネットワーク内のノードを接続します。 ヘッドノードは、実行するタスクを他の計算ノードに送信します。他の計算ノードは、相互にメッセージを送信しながら結果を返します。速くなればなるほど良くなります。
    • プライベートイーサネットネットワークを使用して、これらすべてのノードをクラスターにリンクします。
    • ヘッドノードは、作成しているネットワーク上のNFS、PXE、DHCP、TFTP、およびNTPサーバーとしても機能できます。
    • サーバーが交換するパケットがネットワークの残りの部分で交換されるパケットに干渉しないように、このネットワークをパブリックネットワークから分離する必要があります。


  9. クラスターをテストします。 スーパーコンピューターの能力をすべて解放する前に行う必要がある最後のことは、そのパフォーマンスをテストすることです。 High Performance Lynpack(HPL)パフォーマンステストは、コンピュータークラスターの計算速度を測定するための一般的な選択肢です。選択したアーキテクチャに応じてコンパイラが提供するすべての最適化を使用して、ソースからコンパイルする必要があります。
    • 明らかに、プラットフォームを最適化するための最も多くのオプションを提供するソースからコンパイルする必要があります。たとえば、AMDプロセッサを使用している場合は、-0fast最適化レベルを選択してOpen64でコンパイルします。
    • TOP500.orgの結果を比較して、スーパーコンピューターが世界で最も強力な500台のスーパーコンピューターと競合できるかどうかを確認してください。
アドバイス
  • ネットワークで非常に速い速度に到達するには、InfiniBandインターフェースについて調べてください。ただし、貯金箱を壊す準備をしてください。
  • IPMIは、KVM-over-IP、個別の電源サイクルなどを提供することで、大規模な管理を容易にします。
  • Gangliaを使用して、ノードの計算負荷を追跡します。
警告
  • インフラストラクチャが負荷をサポートできることを確認してください。