カイゼンのヒント

ITインフラの可視化とその効能

ビジネスの世界で最近良く耳にするトヨタ式「カイゼン」。その改善に欠かすことの出来ないキーワードが実は「見える化」です。可視化することで問題が顕在化され、よって何をどのように改善すべきかに挑戦する。この飽くなき改善スパイラルをITインフラ環境においてどのように実現するか?また実現することで得られる多くの効能。当サイトではITインフラ性能分析からサービスレベル測定に至るまで、具体的に分かりやすく役に立つ情報を提供して参ります。

(担当:株式会社ビーエスピー プロダクト推進部 菅原 潔明)
[2006年1月11日]

ITインフラ情報の収集

皆様あけましておめでとうございます。今年の冬は例年よりも寒いと感じているのは私だけでしょうか。 先日は全国的に記録的積雪もあり、本当に寒い日々が続いております。カゼも流行っております。皆様くれぐれもご健康にお気をつけください

さて、いよいよ今回からは、ITインフラの可視化の具体的な実現に関して様々な観点でまとめてみたいと思います。
その最初に取り上げる項目は、「可視化のためのデータ収集」です。ITインフラ上の様々なログを一元化することを目指すわけですから、様々な場所からデータ収集を検討する必要があります。収集するものとして大別すると下記の通りになります。

  1. ファシリティー
  2. ネットワーク
  3. サーバ
  4. ストレージ
  5. アプリケーション
  6. セキュリティー
  7. ヘルプデスク、サービスデスク

これらの構成要素からどのような内容のデータを、どのような目的で、どのように収集すればよいのかについて、以下にまとめました。

  1. ファシリティー
  2. サーバ機器を設置する上で重要な供給電力量や、温度、湿度等の情報を収集します。収集はSNMPベースにより収集します。
    特に最近SLAなどの項目として取り上げられることの多い内容です。BSPグループのお客様は、運用部門の方が多いのですが、障害の多くの原因がハードウエアとの報告がよせられており、ラックによっては機器が密集するものもありますのでラック内温度などは敏感に監視するケースも増えてきています。
  3. ネットワーク
  4. 監視対象としてはルータ、スイッチ等になり、主な情報収集としてはパケット流量、パケットロスなどがメインとなり、データ収集はSNMPがメインとなります。
    ネットワークの可視化は非常に重要な要素です。ネットワークが遅い、つながらないというのは良く効かれるユーザクレームです。大規模化、複雑化が進むことで比例するように複雑化するのがネットワーク構成です。監視のポイントとしてはPC←→ネットワーク機器←→ネットワーク機器←→サーバの順となり、特に中継点としてのネットワーク機器の各ポート内データ流量を把握しておくことは、ボトルネックポイントを調査する上でも大変重要です。

    ■MRTGによるネットワーク機器のパケット監視例

    図/MRTGによるネットワーク機器のパケット監視例

  5. サーバ
  6. サーバの可視化のポイントは大別して2つ。パフォーマンス系の情報とリソース系の情報となります。

    ■パフォーマンス系情報

    一見複雑に見えるパフォーマンスの可視化ですが、おさえるべきポイントはそれほど多くはありません。コンピュータのアーキテクチャはその大半が未だイノマン式ですから、CPU、メモリ、Diskの三大要素によって構成されていることはメインフレームであれ、クライアントPCであれ同じです。よって基本的には収集するべき項目もおのずと限られてきます。例えばCPUであれば使用率、メモリはページング状況、Diskは各物理ディスク単位のI/O状況ということになります。

    ■リソース系

    メモリ空き容量、ファイルシステム使用率など監視が一般的です。



    UNIX系:
    UNIX系OSには様々な性能状況を監視するコマンド群が用意されており、これを定期的に実行し結果をテキストファイルに保存します。

    ■sar 出力イメージ⇒CPUリソース状況

    図/sar 出力イメージ⇒CPUリソース状況

    ■vmstat 出力イメージ⇒メモリ、ページング状況

    図/vmstat 出力イメージ⇒メモリ、ページング状況

    ■iostat 出力イメージ⇒DiskI/O状況

    図/iostat 出力イメージ⇒DiskI/O状況

    ■sar 出力イメージ

    図/sar 出力イメージ



    WindowsNT系:
    WindowsNT系にはサーバの性能を分析するパフォーマンスモニタというのがあり、これが定期的にサーバ内部の各種性能情報を収集する機能を持っています。一般的にはリアルタイムで状態を監視する画面で状況を見るのですが、このグラフ描画の元となるデータをテキストファイルに保存させる仕組みもあり、これを利用してデータ収集します。

    ■パフォーマンスモニタ

    図/パフォーマンスモニタ

    ■パフォーマンスモニタ:項目設定

    図/パフォーマンスモニタ:項目設定

    ■パフォーマンス カウンタログ設定

    図/パフォーマンス カウンタログ設定

以下の情報収集については、次回に掲載いたします。

  1. ストレージ
  2. アプリケーション
  3. セキュリティー
  4. ヘルプデスク、サービスデスク
Copyright(C)BSP Solutions Inc. All Rights Reserved