システムの信頼性と稼働率

  • 稼働率:トラブルなく無事に使えていた期間を割合として示すもの

RASIS(ラシス)

システムの信頼性を評価する概念。次の頭文字を取ったもの。

Reiability 信頼性 システムが正常に稼働している状態にあること。指標としてMTBFを用いる
Availability 可用性 必要な時にいつでも利用できる状態にあること。指標値として稼働率を用いる
Serviceability 保守性 故障などの障害発生時にどれだけ早く発見、修復が行えるか。指標値としてMTTRを用いる。
Integrity 保全性 誤作動なくデータの完全性が保たれること
Security 安全性 不正利用にしたいしてシステムが保護されていること。

平均故障間隔

故障と故障の間隔を表すもの。どれぐらいの間隔でどこかしら故障するのかを表している

  • 平均故障時間=正常稼働時間1+正常稼働時間2+正常稼働時間3…/故障回数

平均修理時間

修理に必要な時間をあらわすもの。一度故障すると修理時間としてこれぐらいはシステムが稼働できないよという時間を示している

  • 平均修理時間=修理時間1+修理時間2+修理時間3…/修理回数

システムの稼働率

全運転時間の中で正常稼働できていた割合を示す数値

  • システム稼働率=稼働時間/全運転時間

直列につながるシステムの稼働率

システムが直列につながる全システムの場合、どこかがダウンするとシステム全体が使えなくなります。なので、全システムの稼働率は各システムが正常運転している稼働率の積で求めることができます。

  • 直列システムの稼働率=Aの稼働率×Bの稼働率

並列につながるシステムの稼働率

各システムが並列に繋がるシステムの場合、どこかが故障しても他が代用することができるので、全ダウンになるのはすべてのシステムがダウンした時に限られます。

だから、次のような計算式で求めることになります。

  • 並列システムの稼働率=1-全体の故障率
    • 全体の故障率=故障率A×故障率B
    • 故障率=1-稼働率

「故障しても耐える」という考え方

いつかは壊れるのが宿命なので、壊れても大丈夫なような対策が大切だという考え方があり、これをフォールトトレラントという。

そのフォールトトレラントを実現するには次のようなものがある。

フェールセーフ

故障の場合は、安全性が最優先という考え方。故障が発生した際には、安全性を確保する方向で壊れるように仕向けておく方法

フェールソフト

故障の場合は継続性が最優先と言う考え方。故障が発生した場合にはシステム全体を停止されるのではなく、一部機能を切り離すなどして動作の継続を図る。

フールプルーフ

意図しない使い方をしても故障しないようにするという考え方。

バスタブ曲線

故障と発生頻度と時間の関係をグラフにすると、バスタブのような形の曲線ができる。

  • 初期故障期間:導入初期は製造上の欠陥などによる故障率が高くなる。時間の経過とともに故障率が下がる
  • 偶発故障期間:故障率がほぼ一定で安定した状態。突発的な故障が発生する程度。
  • 摩耗故障期間:製品寿命が尽きた状態。装置の摩耗などにより故障率が時間と共に増大する。

システムに必要なコスト

システムを運営するためには次のようなコストが必要となります。

  • TOC(トータルコスト)=初期コスト+運用コスト
タイトルとURLをコピーしました