プロセスの2重化によるOSの高信頼化手法

書誌事項

タイトル別名
  • プロセス ノ 2ジュウカ ニヨル OS ノ コウシンライカ シュホウ
  • Highly Available Operating System by Process Replication
  • オペレーティングシステム

この論文をさがす

抄録

従来オペレーティングシステム(OS)の高信頼化は,試験やレビューを網羅的に行い内在するソフトのバグ等の故障を排除することで追求されてきた.しかしOSはその規模や複雑さが膨大なため,故障を完全に取り除くことは現実には不可能であった.一方,誤りの発生を内部で検出し回復する耐故障技術が知られており,いくつかの特殊用途のOSが耐故障技術に基づいて設計実現されている.しかし,耐故障技術をオープンなOSに適用するためには,様々な問題を解決しなければならない.本論文では,既存のオープンなOSの代表であるUNIXに対し,耐故障技術の1つである“プロセスペア方式”を適用する方法を検討した.誤りの検出,隔離,回復を実現するための故障管理機構を考案するとともに,既存プログラムの修正軽減のため,耐故障性を備えた通信機構と内部状態の安定格納機能をライブラリとして用意した.そして,実際にファイルシステムに対し耐故障性を付与する修正を行い,ハードウェアやソフトウェアに誤りが発生しても,ユーザに知られることなく回復できることを確認した.

In order to make an operating system highly available,careful design reviews and exhaustive tests are used to eliminate internal software faults.However,its quantity and complexity prevent these fault avoidance methods from finding all faults.Fault tolerant methods can detect and recover internal errors as they occur.A few fault tolerant Operating Systems were designed and developed.But they are propriety and require expensive special hardware.Applying fault tolerant methods to existent open operating systems raise many difficult issues.This paper describes how to apply the"process pair method",one of the well-known fault tolerant methods,to an open operating system,UNIX.A fault management mechanism is developed to detect,isolate,and recover errors.In order to minimize modification in existent programs for fault tolerance,an enhanced communication library and an stable storage library are introduced.We have prototyped fault tolerant file system and demonstrated that it can mask hardware errors and software errors from users.

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (15)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ