適応閾値の維持
このタスクには、サービスKPIに適用される適応閾値を維持して、それが適切かつ良好なサービス機能の状態を表すものであることを確認することが含まれます。
この記事は、Splunk ITSI オーナーズマニュアルの一部です。このマニュアルでは、ITSI 実装のオーナーが実装を正常に機能させるために必ず実施すべき継続的なメンテナンスタスクについて説明しています。その他のメンテナンスタスクについては、 マニュアル全文を見るにはここをクリックしてください。 。
なぜこれが重要なのか?
適応型閾値は、サービス重要業績評価指標 (KPI) のベースライン値を動的に設定する上で重要です。これらの閾値は、個々の KPI がいつ最適でない、あるいは機能不全状態に入ったかを示す通常の行動からの逸脱を検出するために不可欠です。
適応型しきい値はサービスの存続期間中ずっと固定されているため、定期的なチューニングの重要性が浮き彫りになります。時間の経過とともに、IT 環境の変化、システムのアップグレード、またはユーザー行動の変化によって、サービス KPI の特性が変化したり、変化したりする可能性があります。これらの変化は、監視対象コンポーネントのベースライン動作に影響を及ぼし、アラートで誤検出や陰性につながる可能性があります。
適応閾値を定期的に見直すことで、Splunk ITSI (ITSI) ユーザーは最新の洞察や観察結果に基づいてシステムを再トレーニングすることができます。この再トレーニングプロセスにより、適応型閾値が IT 環境の動的な性質に即した適切なものであり続けることが保証されます。ITSIは、最新のデータを組み込んで通常の行動を理解することで、正確で意味のあるアラートを引き続き提供し、ITチームが問題が深刻化する前に積極的に対処できるよう支援できます。
スケジュール
四半期ごと
前提条件
- このアクティビティを実行するには、基盤となる Splunk 環境への適切な検索アクセスが必要です。
- この手順では、ITSI と Splunk Core REST API を有効にし、Splunk 検索からアクセスできるようにする必要があります。
- この手順には、ITSI への管理者アクセスが必要です。
注意事項と警告
適応型しきい値を変更する場合、現在エラー状態になっていないサービスのみを確認することが重要です。あるサービスや KPI が長期間にわたって範囲外だった場合、適応閾値は完全に正確であるにもかかわらず正しくないように見えることがあります。
プロシージャ
ステップ 1: 適応型閾値 KPI の特定
- 画面の左上隅にある Splunk ロゴ 。
-
画面の左側で、
IT サービスインテリジェンス
。
-
ページ上部のメニューで、をクリックします。
検索
。
-
次の検索を検索バーにコピーして押します
と入力します。
検索を実行するには:
| rest splunk_server=local report_as=text /servicesNS/nobody/SA-ITOA/itoa_interface/service fields="title,_key,kpis" | spath input=value path={} output=service_object | fields - value splunk_server | mvexpand service_object | spath input=service_object path=kpis{}.title output=KPI | spath input=service_object path=title output=Service | spath input=service_object path=kpis{}.adaptive_thresholds_is_enabled output=adaptive_thresholding_enabled | fields - service_object | eval zip=mvzip(KPI, adaptive_thresholding_enabled,"&&&") | mvexpand zip | rex field=zip "(?<KPI>.*)&&&(?<adaptive_thresholding_enabled>.*)" | fields - zip | search adaptive_thresholding_enabled="true" | stats values(KPI) AS KPI BY Service
-
検索が完了したら、検索バーの下に返された結果を確認します。各結果は、適応型しきい値処理を使用するサービス KPI を表しています。このページを開いたまま、手順のステップ 2 に進んでください。
ステップ 2: KPI の確認と更新
- 検索結果ページの一番上までスクロールし、をクリックします。 [構成] ページ上部のメニューにあります。
-
次に表示されるドロップダウンメニューから、
[サービス]
新しいタブに。
-
ステップ 1 の検索結果で特定された KPI ごとに、次のアクティビティを実行します。この手順では、そのタブを開いたままにして参照できます。
-
検索結果からサービスをコピーし、ページ上部のフィルターテキストボックスに貼り付けます。下に表示されるリストでサービスを探し、サービスタイトルをクリックします。
-
ページの左側の KPI リストで、検索結果から現在のサービスに対応する KPI を見つけ、リスト内のその KPI をクリックします。次に、をクリックします。
しきい値処理
ページの中央に、その KPI のしきい値設定が表示されます。
-
ページを下にスクロールすると、「集計しきい値のプレビュー」のビジュアライゼーションが表示されます。これにより、現在のしきい値設定ポリシーの適合性がわかります。黒い線がビジュアライゼーションのさまざまなセクションとどのように相互作用するかを調べてください。黒い線が緑の部分と頻繁に交差する場合は、この KPI の閾値を再トレーニングする必要があるかもしれません。このサービスの名前と KPI を書き留め、ステップ 1 の検索結果の次の行についても同じ手順を繰り返します。
-
検索結果からサービスをコピーし、ページ上部のフィルターテキストボックスに貼り付けます。下に表示されるリストでサービスを探し、サービスタイトルをクリックします。
- これで、適応閾値を再トレーニングすることでメリットが得られる可能性のあるKPIのリストができました。適応型閾値処理を再適用する方法については、を参照してください。 シナリオ:適応閾値を KPI に適用して外れ値を検出する 。再トレーニングリストに記載されている各 KPI について、このリンクに記載されている指示に従ってください。