Fault-Tolerance and Safety
向殿政男1.まえがき
フォールトトレランス(Fault-Tolerance:FT),又はフォールトトレラントコンピューティング(Fault-Tolerant Computing:FTC)という考え方は,人命にかかわるような(Safety Critical),あるいは重要な使命を帯びているような (Mission Critical )情報システム等を構成する上で,その信頼性や安全性を確保するための最も重要な概念の一つである。
初めから,信頼度の高い部品やバグの少ないソフトウエアを開発して信頼度の高いシステムを構築することを目指すいわゆるフォールトアボイダンス(Fault Avoidance)という考え方に対して,フォールトトレランスは,一つや二つの構成要素が故障しても,旨く構成することで,全体としての信頼度を上げることを目指している。信頼度の高くない要素を用いても,工夫により全体のシステムの信頼度を上げるように構成する技術である。ここでの旨い工夫とは,基本的には多重系技術,または冗長性技術である。
本報告では,フォールトトレランスと安全性の関係について考察する。特に,新しく提案されつつある安全学の中でフォールトトレランスの果たす役割について述べる。最後に,現在のフォールトトレランス技術の抱える問題点を述べて,ここ数十年のフォールトトレランスが向かうべき目標を筆者なりにまとめてみたい。
2.フォールトトレランスの狙い
情報システムにおけるフォールト(Fault)とは,自然災害の他には,当初は主としてハードウエアにおけるランダム故障であった。しかし,その後,ソフトウエアにおけるバグ,設計ミス,ヒューマンエラー,過負荷,輻輳,故意の妨害,セキュリティ,等々,対象とすべきフォールとは格段に多くなって来た。また,フォールトトレランス技術が対象とすべきものは,何もコンピュータを中心とした情報システムだけではない。あらゆる工学的な人工物を対象となり得る。いや,それだけではなく,安全性,信頼性を確保する立場から見ると,会社の組織や経済のシステムのような社会的なシステムにも必要な概念である。認証制度や保障制度などは,ある意味ではフォールトトレランス技術の範疇に入るものである。一方,生物を見ると,免疫とか自己修復等は,生物が長い間に生き残るために勝ち取ったフォールトトレランス技術と見ることができる。このように広く考えた時のフォールトトレラント技術の目的は,想定された内部及び外部からの各種フォールトの発生,または存在に対して,それに耐え,許して,排除して,システムの本来の機能を失うことなく,正常な機能を維持しつづけることにある。従って,フォールトトレランスは,基本的に信頼度の高いシステムの構築を第一の目的とすると言える。これに関連して,フォールトの発生及び存在に対して,安全だけは維持しようとするフェールセーフ(Fail- Safe)の概念がある。本稿では,フォールトトレランスと安全性との関係について簡単に検討をして行くことにする。
3.フォールトトレランスと安全性(1)
機械は故障し,人間は間違えるものであるという大前提に立って,安全を確保する考え方の代表が,フェールセーフとフォールトトレランスである.フェールセーフが直接,安全性を目標にしているのに対して,フォールトトレランスは,信頼性の向上を目標にしている。安全性と信頼性とはお互いに深い関係にあるが,実は異なった概念である.一般に,信頼性が上がれば安全性も上がる。明らかに信頼性は安全性に直接貢献している。しかし,信頼性を下げることで安全性を高めることがあり得るので,根本的に異なった概念である。信頼度の高いシステムは,めったに機能を失うことはなく効率は良いが,一端機能が失われると,どんな事故になるか保証がない。フェールセーフ実現のためには,例えば,止まれば安全(停止安全),人間がそばに居なければ安全(隔離安全)と言った無条件に安全が保障される安全側の存在が必要である。それでは,飛んでいる飛行機の機能が喪失した場合,安全側はあるのだろうか?残念ながら,現在までのところ,それは見出されていない。このような場合には,本来の機能を維持するようにするしか道はない。高信頼化しか手はないのである。多重系の考え方,すなわち,Aが壊れたらBでカバーする,もしBが壊れたらCでカバーするというフォールトトレランスの考え方が必須となる.多重系,すなわち冗長系によって信頼度を上げ,結果的に安全性を維持しようとするものである.このように,フェールセーフとフォールトトレランスとは,根本的に異なった概念である.時々,新聞報道などでは,多重系に基づく安全装置を誤ってフェールセーフと呼ぶことがあるが,これはフォールトトレランスであって,フェールセーフというのは間違いである。
フェールセーフの場合,最初から構造として安全性が組み込まれているところが重要なのである.一方,フォールトトレランスの場合には,冗長系という構造を導入しているので,各サブシステムの独立性が保障されて居れば,高い信頼度を得ることが出来る.安全の分野,すなわち人命を預かるような分野では,まずフェールセーフの立場でシステムを考えるべきである。それを信頼度高く構成するところにフォールトトレラント技術を使うことが出切るる。あくまでも安全側が見出せない場合や,またはフェールセーフが実現できない場合,更にはフェールセーフがコスト的に実現困難な場合に,初めて安全をフォールトトレラントで実現すると考えるべきであろう。
4.安全学とフォールトトレランスの役割
安全に関する学問を工学としてだけでなく,広く人文科学,社会科学を含めて,安全学として確立しようとする動きがある(2)〜(4)。安全は,人間や社会の価値観と共に,心理的な側面を重視し,安心感を醸成しなければならない側面がある。確率論やリスクのみに基づいた安全性や信頼性では説得力がないのではないだろうか。安全の実現には,構造を明確にし,このようなフォールトに対してこのような構造で防御しているという立証された安全が,納得のためには是非,必要である。この点から,フェールセーフやフォールトトレラントは,構造を伴った立証された安全性,信頼性であり,今後,安全学を確立して行く過程で,重要な役割を果たして行くと確信をしている。
5.あとがき
これまでのフォールトトレランス研究が対象としてきた考え方や対象は余りに狭く偏っていたのではないだろうか。例えば,現在,世界的にも,信頼性(reliability) の代わりにこれまでの信頼性と保全性を含んだ広い意味としてディペンダビリティ(dependability) という用語を使用するのがグローバルスタンダードになりつつある。これは,これまでの信頼性が対象としてきた概念が余りに狭すぎたことに対する一つの反応ではなかろうかと思う。電子情報通信学会のフォールトトレラントシステム研究会も,ディペンダブルコンピューティングを付したような研究会名に改称しようとしているのも,またこの表れの一つであろう。例えば,評価尺度に関しても,フォールトトレランスがこれまで主として用いてきた信頼度そのものが狭すぎることは明らかである。安全性はもちろんのこと,内部・外部からの各種フォールトに対する頑強性,余裕性,耐性,更にはユーザの満足度等々,広く各種の評価尺度を導入すべきである。一方,研究対象も,これまで,ハードウエアからソフトウエアへ,更にシステムやネットワ−クへと研究対象を広げてきたが,機器・設備的な人工物のみが対象では,範囲が狭すぎると思われる。社会的な組織や制度も,明らかにフォールトトレランス研究に対象になる。ここでの筆者の提案は,まず,フォールトトレランスの概念と研究分野を拡大せよということである。次に,今後,これらの各種システムで最もメインの問題となるであろうことは,各種フォールトの多様化,特に人間的側面の起因したフォールトであり,更には,複雑度の問題,即ち,益々大規模化,複雑化するシステムへの対応であり,そして,時代の変化に如何にシステムが適応して行くか等と予測される。ここ数十年のファールトトレランスの課題は,これらの問題に積極的に対処して行くことである。このためには,システムの設計段階からフォールトトレランスを考慮した設計を行なう以外にない。すなわち,フォールトトレランスの技術者が,大規模な社会的なシステムの設計の段階から参加する以外に道はない。筆者の次の提案は,フォールトトレランス技術者は積極的に情報発信をして社会的なシステムの構築に積極的に参加していくべきであるということである。安全で安心な社会の構築,これが21世紀の世界の願いであろう。安全,安心の中に社会が要求する内容は時代と共に変わり得るものであろうが,その中でフォールトトレランス技術の果たす役割は極めて大きいはずである。なぜならば,これまでの意味での信頼性はもちろんのこと,安全性,保全性,セキュリティ,リスク,品質,等々の概念やそれを実現するための理論や技術やマネージメントや人間的側面や各種制度,等々,その関連するところは驚くほど広いからである。これからの時代の要請に応えるべく,新しく発見,開発,洗練させなければならないフォールトトレランスに関する思想と技術は終りがないだろう。この時,人類がこれまでの社会を構築・維持してきた歴史に見る英知と経験の中からも,更には,地球上に永らえて来た生物がこれまで勝ち取ってきた生命維持機構の中からも,我々がフォールトトレランスという観点から学ぶべき考え方や技術がまだまだ,多く潜んでいるはずである。こう考えてくると,フォールトトレランスという研究分野は,魅力的なテーマに富んだものであり,当研究分野は,21世紀に最も望まれるもの一つになり得る可能性は高い。この時,フォールトトレランスは,安全学を最も重要な関連分野として位置付けて発展させていくべきであるというのが著者のもう一つの提案である。
参考文献
(1)向殿政男,フェールセーフとフォールトトレランス,働く人の安全と健康,Vol.1, No.4, 中央災害防止協会,2000-4
(2)村上陽一郎,安全学,青土社,1998-12
(3)日本学術会議,安全学の構築に向けて,安全に関する緊急特別委員会2000-2
(4)向殿政男,安全マップ--安全工学,安全科学,安全学の学問的体系化に向けて--,日本学術会議安全工学専門委員会WG,2000-4