カイゼンのヒント

システム運用を語る、ITILの活用

ITシステム運用のベストプラクティスとされ、今話題の「ITIL」について、お客様の現状や取り組み、事例などを踏まえ、その活用のための各種情報をご提供します。

(担当:株式会社ビーエスピーソリューションズ 運用コンサルテイングチーム 藤原達哉)
[2006年1月11日]

第5回  インシデント管理について その1

インシデント管理について、2回に渡り、ご紹介いたします。

インシデントとは何か?

ITILにおけるインシデント管理とは、ユーザがITを利用して業務(ビジネス)を遂行できない状態を、いかに早く解決し、業務を続けることを支援するプロセスです。

「インシデント」とは何でしょうか。
担当者によって、システムトラブル、問題点、不具合など、定義が異なることも多いのではないでしょうか。
ITILを活用することの本質のひとつとして、こういった「言葉の定義の共有」も重要な要素と考えるべきです。
システム運用の担当者が行う、ミーティングやコミュニケーションの中で、ひとつのキーワードが同じ意味として捉えられていないと、実際の活動を行っていく際に思わぬ問題をきたすことになります。

ITILにおけるインシデントの定義は以下に記述しましたが、これを具体的に言うと、ユーザがITサービスを使えるべき時間に使えない状態を「インシデント」と言うことになります。
これは、通常のシステム障害や問題の発生だけでなく、パフォーマンスの悪化、ユーザによるパスワード忘れや、バッチジョブの進捗状況の確認作業といった内容もインシデントとなります。

こういったインシデントに関する問い合わせは、ユーザからIT部門への一元的窓口として定義されているサービスデスク(今後紹介)を経由して届き、インシデント解決に向けての活動を行います。
システム運用の活動が、従来のシステム運用管理としての「コンピュータ・IT環境自体の維持、管理」を行うことから、「ITを利用するユーザに対するサービスの提供」に変わってきたといえます。

インシデントとは(ITILより)
サービスの標準の運用に属さないイベントであり、サービス品質を阻害、あるいは低下させる、もしくはさせるかもしれないあらゆるイベントを指す。

インシデント管理における活動のポイント

インシデントを管理することは、品質の高いITサービスを提供するためには必要不可欠の要素といえます。
ITILによる、インシデント管理のプロセスは以下の項目、フロー(図1を参照)で実施することが記述されています。

インシデント管理の目的は、ユーザにおけるIT利用の可用性を高めることです。
その活動は、ユーザからの問い合わせに対して迅速に、解決策、あるいはワークアラウンド(回避策)を提示し、IT利用によるビジネスの停滞を最小限に抑えることになります。

インシデント管理のプロセスと活動のポイントは、以下のとおりです。

作業項目 目的 活動のポイント
問い合わせのあった、あるいは発生した、すべてのインシデントを記録する。 インシデントはすべて記録し、後に分析することによって、ITサービスの品質向上に利用します。
  • サービスの評価指標
  • インシデントの傾向から重点化改善ポイント等の洗い出し
その他
ITILは発生したすべてのインシデントを記録することを求めています。
すべてのインシデントを記録するにあたっては、担当者のモラル・モチベーションなども重要な要素となります。
  • 収集方法の整備、できるだけ容易な登録方法
  • データベースの利用
  • インシデント管理担当者への協力依頼、トレーニング。作業の目的の理解
分類と初期サポート インシデントの分類・優先度などを決定します。
初期サポートとして、ワークアラウンド(回避策)の提供をします。
過去のデータなどの利用によって、回避策をエンドユーザに提供します。
記録するに当たっては分類項目を明確にしておくことと、担当者によって記録する、しないなどの差がないようにすることが重要です。
また、過去の事例等が容易に利用できることによって、迅速に解決策・回避策を提供することが可能になります。
過去事例の利用によって、ユーザに対して有効な解決策を提示できれば、ITサービスの可用性を高めることが可能になります。
サービス要求か? インシデントにおける、サービス要求とは、「対応手順のあるインシデント」と定義されています。
発生したインシデントがサービス要求であれば、手順書にしたがって対応することにより、エスカレーションすることなく、迅速なインシデントの解決が可能になります。
サービス要求の例として、「パスワード忘れ」といった問い合わせに対しては手順を作成しておき、誰でも迅速に対応できるようにしておくべきです。
その際、必ずインシデントとして記録し、パスワードに関する問い合わせの発生状況などを把握、対策を講じるなどの材料として使用することが重要です。  
調査と診断 インシデントの調査、診断を行います。
現在の情報だけでは解決あるいは回避できない場合は直ちに問題管理との連携を行う必要があります。  
発生したインシデントは過去の事例などに基づき、ワークアラウンドの検討を行い、すばやく活動を行う必要があります。インシデントデータはデータベースに記録し、リアルタイムに管理、利用することが望ましいといえます。 
解決と復旧 インシデント管理は問題管理が行う、問題の原因分析と再発防止に協力してあたります。  インシデント管理は問題管理プロセスによる、応急修正、緊急修正、恒久対応の作業を支援します。
問題管理プロセスによるエスカレーションや調査などを支援し、ユーザへの連絡や対応を行い、ITサービスの利用が速やかに回復できるよう、活動します。  
インシデントのクローズ インシデントの発生から収束までのトレースを行い、サービスのデータを取得します。
サービスレベル管理の基礎データとして活用します。  
インシデント管理では、発生からクローズまでを追跡します。重要なのは発生から解決までの時間や工数、を正確に把握し、インシデントの分類などと組み合わせて分析することにより、問題の発生傾向や、コスト、サービスレベルのデータを得ることができます。
データは過去事例として活用できるように、分類されており、かつ有効なデータを記録しておくことが重要になります。 このデータを活用し、現状より高い品質のサービスを提供するための、継続的な改善活動を行うこととなります。  


図1 インシデント管理プロセスと課題
(図をクリックすると拡大表示します)
図1/インシデント管理プロセスと課題

次回は、「インシデント管理」の問題点、メリットについてご紹介します。

Copyright(C)BSP Solutions Inc. All Rights Reserved