今年もMark Russinovichセッションのお時間です。
最初はインフラ。伝統的なインフラからインフラをオフロードできるように。![]()
![]()
最新のAzure Boost的なやつ。(2年前にみたやつ1/2)ネットワークポートの2つは100Gbリンク。パフォーマンス周りは図の通り。2つのToRにつながってるのでルータの障害にも対応。すでにAzure Fleet(配備されてるホストコンピューター群でしょう)の20%で有効、GPUもHPCもサポートしてます。![]()
![]()
![]()
最大200Gbpsスループットで毎秒40万接続いける。ゲストRDMAも対応していくらしい。ゲストVM上のRDMAやGPUも対応できるように。分散AIトレーニングとかで活用できる。HPCでやってたようなメモリの一部をマップして別のVMのメモリバッファに直接ダンプしたりできるぽい。GPU DirectをサポートするGPUでもいける。![]()
![]()
![]()
![]()
![]()
ホストOSのpatch周り。Hot patchでいける部分は20ms未満に。ドライバーのHot Swapも対応できるようになって 1秒未満で対応。VM-PHU(Preserving Host Updates)はホストでアップデートが開始されるとゲストVMをサスペンドしてIOも止めてた。新しいやり方はパッチを充てる瞬間だけ仮想プロセッサ(VP)を止める方法みたい。![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
デモでは従来のやり方だとpingがつながらない時があるけど自動サスペンド方式だとそのようなことは無くアップデートが終わる。![]()
![]()
![]()
AIワークロードにおけるストレージに対する要求は割と高い。学習時は画像やイメージなど大量にあるしモデルのチェックポイントを保存できないといけない、推論時は巨大なモデル(100~1000GB)をロードして数千~数十万台にデプロイする必要もある。![]()
![]()
デモではトレーニングデータがある領域をBlobfuse2で複数Blob(320台)をまとめてる。14TB/sでBlobに書き出して23Tb/sで読み出せる。![]()
![]()
![]()
![]()
![]()
![]()
次はクラウドネイティブ関連。まずはAzure Linuxから。Linuxをより安全に堅牢にする。LinuxGuradでOSは不変にしてコンテナーすら署名されていない信頼されないのは動作させない。![]()
![]()
![]()
![]()
デモは実際に署名されてるところとか、動作が許可されないところとかを。![]()
![]()
![]()
![]()
![]()
マルチテナントのホスト向けサンドボックスについて。使いやすいコンテナーやVMからもう一段細かくしてHypervisorで分離されたマイクロVMをWebAssemblyで動かすのがHyperlight。Azure Front Door Edge ActionsでHyperlightなMicro VMを動かす予定。![]()
![]()
デモはクライアントからアクセスされて画像を返すところをMicroVMなWasmを1msで立ち上げて違う画像を返す感じ。![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
Azure Container Instanceについて。スタンバイプールが使えるようになった。2500コンテナx4台で1万コンテナーを2分ぐらいで起動。![]()
![]()
![]()
![]()
![]()
![]()
Azure Cincubationsの話。CNCFからKEDAは卒業、CopaはSandbox、Daprも卒業、RadiusはSandboxかな。Radiusはレシピを切り替えることで同じ構成のシステムを別の実行環境で動作させたりが簡単にできるやつかな。
DrasiはContinuous Query Patternな構成を作るためのフレームワーク的な。
Confidential Computing。今となってはだいぶ浸透したかもね。GPUやネットワークもConfidentialに。デモは実際にアクセスできない(読みだせない)ところを。![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
新しいコンピューティングの話。世界初アナログ光学コンピューター。![]()
![]()
![]()
![]()
![]()
![]()
デモはアナログ光学コンピューターで数字の識別をさせてる。ニューラルネットワークの操作を全部光学でやってる!というところが重要。![]()
![]()
![]()
最後はおなじみモンスターマシン、VCPU1792個、メモリ30TBのタスクマネージャーのCPUグラフでインベーダーゲームするやつ。![]()
![]()
![]()
という感じの2025年BuildのMarkセッションでした。