最短時間でサービス回復を可能とする障害復旧フローの提案と評価

書誌事項

タイトル別名
  • サイタン ジカン デ サービス カイフク オ カノウ ト スル ショウガイ フッキュウ フロー ノ テイアン ト ヒョウカ
  • Proposal and Evaluation How to Make the Recovery Flow for Failures within the Minimum Time

この論文をさがす

抄録

インフラに利用されるような高い信頼性が要求されるコンピュータシステムは,そのための機能を具備し,手厚い検証を行うが,加えて運用中に遭遇する不測の事態にも迅速に対応できる業務フローが必要で,特に,どのような障害復旧方法を施すかが重要である.本論文では,最短時間で障害を復旧させるフローの作成方法を提案する.提案する作成方法は,コンピュータアーキテクチャの知識と対象システムの運用方針をもとに,動的計画法を利用して,複数の障害復旧方法を選択し,実施順序を決める.用いる復旧方法は,予備系への切替えや再起動など原因究明を必要としない復旧方法からなるため,早期の障害復旧を可能とする.また,当該手法を商用システムの障害復旧フローの作成に適用し,その実用性を運用者と議論し,導入した経験を報告する.

The computer system required high reliability such as infrastructure, is equipped with the functions to do so and verified them deeply and carefully. In addition, it needs the action flow which makes rapidly to manage unexpected emergency situation. Especially, it is important which set of methods should be tried in the flow. We propose how to make the recovery flow for failures within the minimum time. Our proposed method has feature to select and place means for failures in a line, by using the dynamic programming under the knowledge of computer architecture and the operational policy of the target system. Candidates of recovery method such as switching to standby or restart, does not need to explore causes of failures and therefore our proposed recovery flow can recovery the service providing quickly. We also report our experience to be applied for the communication system and the discussion with operators for it.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ