2024/05/22 からラスベガスで開催された Dell Technologies World 2024 にて、APEX AIOps が発表されました。AIOps とはいわゆる SaaS 型の運用管理基盤で一部無償で使える AIOps ツールとなります。以前は CloudIQ として利用できていたサービスですが、新たに 2 つのコンポーネントを追加し 3 つのコンポーネントからお客様が必要な情報を提供します。
概要
APEX Navigator と統合されており、そこから起動することができ、強化された Dell CloudIQ 製品に基づいたサービスとなっています。機械学習、時系列相関、季節性、アンサンブルモデル、予測、強化学習、自然言語処理、生成 AI、その他の AI 手法を使用して、システムに影響を与える問題を解決および回避するための洞察からシステムの正常性、サイバーセキュリティ、サステナビリティに関するヒントと手動および自動修復に関する推奨事項をお客様に提供(たとえば、季節性アルゴリズムは、容量消費とパフォーマンスの正常な動作を示します。このアルゴリズムは、さらに予測と異常の特定に活用されるため、容量が不足したり、使用率が100%に達してアプリケーションアウテージが発生したりする前に、システムに変更を加えることができます。 )し、Dell Technologies のコア、エッジ、マルチクラウド インフラストラクチャの正常性、サイバーセキュリティ、サステナビリティーを最大限に高めるのに役立つ SaaS アプリケーションです。
ダッシュボード
インフラストラクチャオブザーバビリティは、5 つのパラメーター(コンポーネント、構成、容量、パフォーマンス、データ保護) のステータスに従ってシステムの健全性を評価し、各パラメーターに関連する問題 (CPU またはファンの停止、ストレージのフル、ホストのパス喪失など)に値を割り当て、満点の 100 から最大の値(システムへの最も深刻な影響)を差し引きます。ユーザーに問題を通知し、修正するための推奨事項を提供します。問題が解決されると、満点の 100 から次に価値の高い問題が減算されます。この方法では、正常性スコアには影響の少ない多数の問題の合計ではなく、最も重大な問題のみが反映されるため、ユーザーは常に最も重大な問題に誘導されます。ただし、正常性スコアにまだ影響を与えていない場合でも、ユーザーは常にすべての問題を一目で確認できます。稼働状態スコアは特定の機能ですが、次のような広範囲のインフラストラクチャ分析をカバーするためにシステムの稼働状態も参照します。
パフォーマンス メトリック、異常、影響、最大限の予測
容量メトリック、異常、影響、容量フルの完全な予測
ストレージ エリア ネットワークの光学的な障害保護状況
仮想化リソースの追跡
ファームウェアをアップデートする必要性のガイダンス
再利用可能なストレージ
カスタム レポートとスケジュール設定されたレポート
「オブザーバビリティ」とは?
オブザーバビリティとはメトリクスを追跡するだけでなく、トラブルシューティングを簡素化し、根本原因分析を高速化し、インシデントを回避するためのプロアクティブなアクションを可能にする予測など、問題解決までの時間を短縮する推奨事項とインサイトを提供する AI アルゴリズムを使用したアーキテクチャです。
その可観測性、通知、推奨事項、予測は、リスクの軽減、事前の計画、生産性の向上に役立ちます。当社のお客様調査によると、インフラストラクチャの可観測性により、問題の解決にかかる時間が最大 10 倍短縮され、管理者は平均して週 1 日を節約できます。当社のラボテストでは、最大 1,000 台のシステムに対して、インフラストラクチャのセキュリティ設定をわずか 3 分でセットアップできることがわかっています。 これにより、時間のかかる手動のセキュリティ構成検査が不要になりコストを大幅に削減できます。
セキュリティ・ランサムウェア対策
また、APEX AIOps のサイバーセキュリティ機能は、セキュリティ設定の誤り、一般的な脆弱性、ランサムウェア攻撃によるシステムのリスクを通知し、これらの問題を解決する方法に関する推奨事項を提供します(たとえばインフラストラクチャオブザーバビリティツールを設定して、1,000 台のシステムのセキュリティ構成ミスを継続的にチェックするのに 3 分しかかかりません)。さらに、ストレージのデータ暗号化も監視します。これは、ランサムウェア攻撃が展開されていることを示す兆候です。人工知能ベースの異常検出アルゴリズムを削減可能性の異常状態に適用します。通常、このような異常が発生することはありますが、蓄積されると異常ログが特定のしきい値に達し、インフラストラクチャオブザーバビリティによりセキュリティインシデントが作成されます。
インシデントの詳細を含む通知は、インフラストラクチャオブザーバビリティのユーザーインターフェイスとオプトイン暗号化メールで利用でき、攻撃が進行中であることを早期に警告します。これらのツールを使用すると、インシデントを調査して、どのデータが影響を受けたか、いつ、どのサーバーとアプリケーションが関与したかを把握できます。インシデントの早期通知により、疑わしいサーバーを隔離するか、保護されていないストレージグループの安全なスナップショットを作成して被害を抑えることで、攻撃を軽減できます。
インフラストラクチャオブザーバビリティツールの Webhook アプリケーションプログラミングインターフェイスを使用して、ServiceNow、Slack、Teams などのチケット発行、セキュリティインシデントイベント管理、エスカレーションに使用される一般的なアプリケーションとセキュリティインシデントを統合できます。
このサイバーセキュリティの可観測性は現在では PowerEdge、PowerStore、PowerMax、PowerProtect DD が対象となり、今後追加される予定です。一般的な脆弱性識別子 (サイバーセキュリティ アドバイザリー) については、すべての Dell インフラストラクチャ製品で、ランサムウェア検出に関しては、現在は、PowerMax 製品のみで可能、将来的には、さらに対象製品を追加予定です。
また、各システムに実装するセキュリティ設定を行い、それらの設定を継続的に監視し、構成が間違っている場合やまったく存在しない場合に通知する仕組みを有します。1 つのシステムに、コンポーネントごとに 1 つずつ、合計で数十の設定を設定できます。たとえば、サーバーには 30 を超えるこのような設定があるため、自動化された継続的なチェックがリスクを監視する唯一の実用的な方法です。各構成ミスのリスク レベルがわかるので、最初に対処する必要があるシステムに優先順位を付けることができます。インフラストラクチャオブザーバビリティサイバーセキュリティリスクダッシュボードから、各システムのエレメントマネージャーを起動し、ツールの推奨事項に従って正しく構成されていない設定を修正することができます。
新しく発見された(一般的な) 脆弱性とエクスポージャーに対する電子メールによるセキュリティアドバイザリは役に立ちますが、アドバイザリを確認しシステムモデルとファームウェアのレベルをチェックして、電子メールアドバイザリで引用されているレベルと一致するかどうかを確認する必要があり手間がかかります。
インフラストラクチャ オブザーバビリティ ツールは、システムの正確なバージョンを把握し、取得した関連する Dell Technologies セキュリティアドバイザリーと照合することで、脆弱性に迅速に対処できるようになります。一致すると、ツールは脆弱性を排除するためのセキュリティ パッチの適用などのアクションを推奨します。これにより、管理者は手作業での単調な作業から解放され、露出が減り、解決が加速されます。このツールから、Dellサポート サイトを起動してセキュリティ パッチをダウンロードできます。
AIOps アシスタント
インフラストラクチャオブザーバビリティに含まれている AIOps アシスタントは、ユーザーが Dell Technologies インフラストラクチャについて質問し、明確で詳細な回答と推奨事項を得ることができます。この生成 AI ツールは、APEX AIOps SaaS のインフラストラクチャ オブザーバビリティモジュールで利用でき、133,000 件を超えるナレッジベース記事を含む Dell Engineering のアーカイブに基づいて対応します。こちらは 2024 年 9 月ごろに利用できるようになる予定です。
エネルギーとカーボンフットプリント
インフラストラクチャ オブザーバビリティは、Dell Technologies インフラストラクチャシステムのエネルギー消費量と使用フェーズのカーボン フットプリントの追跡と予測を提供します。使用フェーズとは、お客様の所在地でシステムが稼働する期間を意味します。正確には製品カーボンフットプリント(PCF)は、製品のライフサイクルの 4 つのフェーズで生成される炭素排出量を製造されてから EOL(廃棄)されるまでの期間で評価したものです。インフラストラクチャオブザーバビリティは、使用フェーズの排出量を計算します。
製造フェーズ:製品の組み立て、素材からの排出量、コンポーネントおよびパーツ(ドライブ、グラフィックス カード、メモリー、CPU、メインボードなど)の製造が含まれます。
物流または輸送フェーズ:サプライヤーおよびフルフィルメント センターからのパーツ、コンポーネント、製品を輸送し、最終的にはお客様へ
使用フェーズ:お客様の所在地における所定の期間内の製品の使用
EOLフェーズ:ライフサイクル終了の処理(製品のリサイクル、再製、廃棄など)
インフラストラクチャオブザーバビリティは、システムあたりの電力消費量を追跡し、関連するシステムあたりのエネルギー消費量(電力の経時変化)を計算し、インフラストラクチャが配置されているリージョン(コアおよび分散型データセンターなど)の排出係数に基づいて対応する使用フェーズのカーボンフットプリントを計算し、システムおよびワークロードレベルでのエネルギー消費と使用フェーズのカーボンフットプリントを予測します。
エネルギー = 一定期間および使用段階の電力消費量 カーボン フットプリント = エネルギー x 場所の排出係数(エネルギー源に基づく) x データ センターのPUE(電力使用効率:データセンター全体のエネルギー使用量と IT 機器単体のエネルギー使用量の比率を算出し、データセンターのエネルギー効率を測る指標です)。
技術的には、使用フェーズの排出量はシステムの耐用年数にわたって計算されますが APEX AIOps インフラストラクチャオブザーバビリティは、他のシステム レベルのメトリックと同様に、デフォルトで使用フェーズのカーボン フットプリントをシステム レベルで 2 年間保持します。
インフラストラクチャ オブザーバビリティは、機械学習と関連するアルゴリズムを使用して、エネルギーを予測し、フェーズのカーボンフットプリントを計算します。これで国際エネルギー機関(IEA)の CO2e 排出係数と場所ごとの業界標準の電力使用効率(PUE)をすぐに計算できるだけでなく、ユーザーが場所ごとに独自の排出係数と PUE を設定して、精度を最大限に高めることができるようになります。
インフラストラクチャ オブザーバビリティのワークロードレベルのエネルギーと使用フェーズのカーボン フットプリント予測は、データ ストレージやアプリケーションなどの特定のワークロードに関連付けます。ユーザーはこの情報をデータおよびアプリケーションのステークホルダーや他の基幹業務の所有者と簡単に共有できるため、一般的なコストやサービス レベル要因に加えて、これらの要因に基づいて意思決定(サイズ設定やワークロードの配置など)を行うことができます。
現在は Connectrix、PowerEdge、PowerScale、Unity、VxRail が対応しており、今後さらに多くの製品が提供される予定です。
サステナビリティ分析と正常性分析の両方を同じツールで行うことにメリット
サステナビリティー分析と当社の豊富なシステム分析を組み合わせることで、ユーザーはワークロードの統合、ITと二酸化炭素排出量の削減、テクノロジーの更新に関する最善の意思決定を行うために必要なインサイトを得て、サステナビリティーの目標を達成します。
たとえば、システム レベルとワークロード レベルでの排出量予測を、システム パフォーマンスと容量の分析とメタデータと組み合わせることで、お客様は、特定のタイプのワークロードを統合するのに最適な場所、ITフットプリントを削減するためにシステム停止や、完全に廃棄する機器、システムを最新の パフォーマンスとエネルギー効率に優れたシステム等の検討が可能となります。
電力使用効率における Open Manage Enterprise との違い
OME は補完的であり、世界各国の PowerEdge サーバーフリート全体にわたって問題を監視、報告、解決するためのシームレスなワークフローを提供するために統合されています。
インフラストラクチャ オブザーバビリティは、Dell Technologies のインフラストラクチャ システム ポートフォリオ全体を対象とした、健全性、サイバーセキュリティ、サステナビリティのモニタリングおよび分析を行うオールインワン アプリケーションです。OpenManage Enterprise の複数のインスタンスと統合され、サーバーのエンタープライズ全体の統合ビューと、異常検出や予測、システム正常性の問題やセキュリティの構成ミスの通知、修復に関する推奨事項などの高度な分析を提供します。
サステナビリティのために、インフラストラクチャ オブザーバビリティは、PowerEdge およびその他の Dell 製システムのシステムレベルとワークロード レベルでのエネルギー消費量と使用フェーズのカーボンフットプリントの追跡と予測を提供します。インフラストラクチャ オブザーバビリティやその他のシステム分析と組み合わせることで、ワークロードの統合、ITフットプリントの削減、エネルギー効率に優れたテクノロジーの更新について、持続可能性に関する最善の意思決定を行うために必要なすべてのインサイトが得られます。OpenManage Enterprise Power ManagerはOpenManage Enterpriseコンソールへのプラグインです。サーバーの電力消費量、二酸化炭素排出量、システムの異常、リソース使用率を詳細に可視化してレポート作成し、サーバーの電力制限などのアクションを1か所で確認できます。Power Managerを使用すると、OMEコンソールで管理および監視されるデバイスのユニットあたりのエネルギーおよび炭素排出量コストを計算できます。
Power Managerは、電力使用量を制限するためにサーバーの電力上限を設定し、個々のサーバーのオンボードiDRACコントローラーによって適用されます。
Power Managerは、インフラストラクチャ オブザーバビリティにサーバーのエネルギー消費量テレメトリーを提供します。これにより、インフラストラクチャ オブザーバビリティは、企業全体でOMEに接続されているすべてのサーバーにわたって持続可能性分析を実行し、レポートを作成できます。
対象機器
インフラストラクチャ オブザーバビリティは、Dell Technologies のオンプレミス製品(PowerEdge、PowerStore、PowerMax、PowerScale、PowerProtect DD、PowerProtect Data Manager、PowerVault、PowerFlex、Unity、VxRail、PowerSwitch、Connectrix)に加え、APEX マルチクラウド製品(APEX Block Storage for AWS、APEX Cloud Platforms for Microsoft Azure、for Red Hat OpenShift、APEX Hybrid Cloud)をサポートしています。
利用料金
インフラストラクチャオブザーバビリティは、Dell ProSupport (Plus) 契約があればに追加コストなし(無償)で利用可能です。
スケジュール
新しい URL https://aiops.apex.dell.com/observability は 2024 年 6 月の開始を予定しています。 古い CloudIQ の URL (https://cloudiq.dell.com) は、今後数年間有効にする予定です。
インフラストラクチャオブザーバビリティと IBM Instana アプリケーションオブザーバビリティ・ソフトウェアを統合したものです。Dell Technologies インフラストラクチャまたはハイブリッドクラウドやパブリック クラウド上で実行されている可観測性アプリケーションスタックを通じて、アプリケーションの信頼性を提供します。これにより、アプリケーションパフォーマンスの問題の根本原因を特定し、手動または自動修復に関する推奨事項を提供します。
アプリケーションオブザーバビリティは、対象となるホストエージェントの数で年間サブスクリプションのご契約となります。
Moogsoft (Dell Technologies が 2023 年に買収) に基づいています。AI 主導のインシデントライフサイクルワークフローを通じてサービスの可用性を自動化し、マルチベンダーデジタルインフラストラクチャ全体でアラートノイズ、インシデントを低減し、問題の解決にかかる時間を短縮できるように支援します。
APEX AIOps インシデント管理製品は、上記 2 つのオブザーバビリティとは別に独立したユーザーインターフェイスを備え、インフラストラクチャオブザーバビリティおよびアプリケーションオブザーバビリティと内部で連携されています。これらの情報を Dell Technologies 以外のインフラストラクチャに関する情報と関連付けて、アプリケーションレイテンシー問題の根本原因を迅速に特定して解決します。
インシデント管理は、取得データの月間平均ボリュームに基づく年間サブスクリプションでのご契約となります。
対象機器を CloudIQ で監視するためにはリモート保守接続が必要です。それ以外は必要ありません。もちろんエージェントソフトウェアなども不要です。リモート保守接続は、CloudIQ を使う前提となるため「CloudIQ は使うけどリモート保守接続はしない」ということはできません。(逆に「リモート保守接続はするけど、CloudIQ は使わない」という選択はできます)
下の図では、例として複数のデル・テクノロジーズ製品があるため Secure Connect Gateway (SCG) というアプリケーションでプロキシしています。SCG はデル・テクノロジーズから無償で OVA 形式で配布されています。お客様がリモート保守のほかに CloudIQ も使うチェックボックスを有効にすることで CloudIQ に必要な情報もアップロードされるようになります。
各機器から保守用のデータがデル・テクノロジーズの保守用サーバー群にアップロードされ、そのデータを使って CloudIQ が利用状況を可視化します。CloudIQ にアクセスするためには、ブラウザでアクセスするか、スマホのアプリケーションで接続し、お客様のメールアドレスとパスワード(サポートサイトと同じ)を入力することで情報にアクセスできます。