システムの信頼性や設備の保全管理において「MTBF」「MTTR」という用語が頻繁に登場しますが、これらが稼働率とどのように関係しているかを正確に理解している方は少ないかもしれません。
MTBFとMTTRは稼働率(可用性)を計算するための基本パラメータであり、これらを改善することがシステム信頼性向上の具体的なアクションにつながります。
本記事では稼働率とMTBF・MTTRの関係を計算式とともに解説し、可用性の向上に向けた実践的なアプローチまで詳しくお伝えします。
MTBFとMTTRとは?基本的な定義を解説
それではまず、MTBFとMTTRの基本的な定義について解説していきます。
MTBF(Mean Time Between Failures:平均故障間隔)とは、システム・設備が正常に稼働している時間の平均値であり、「どれくらいの頻度で故障するか」を示す信頼性の指標です。
一方、MTTR(Mean Time To Repair:平均修復時間)とは故障が発生してから正常な稼働状態に復旧するまでにかかる時間の平均値であり、「故障した場合にどれくらいの時間で直せるか」を示す保全性の指標です。
MTBFとMTTRの基本定義
MTBF(平均故障間隔):故障から次の故障までの平均稼働時間。値が大きいほど「壊れにくい」
MTTR(平均修復時間):故障発生から復旧完了までの平均時間。値が小さいほど「早く直せる」
稼働率向上にはMTBFを大きく・MTTRを小さくする両方の取り組みが必要です。
MTBFの計算方法と求め方
MTBFは以下の計算式で求められます。
MTBFの計算式
MTBF = 総稼働時間 ÷ 故障回数
具体例:ある設備が1ヶ月(720時間)の間に3回故障し、合計稼働時間が690時間だった場合
MTBF = 690 ÷ 3 = 230時間
この設備は平均230時間ごとに故障することを意味します。
MTTRの計算方法と求め方
MTTRは故障ごとの修復時間を合計して故障回数で割ることで求められます。
MTTRの計算式
MTTR = 総修復時間 ÷ 故障回数
具体例:3回の故障での修復時間がそれぞれ2時間・4時間・3時間だった場合
MTTR =(2 + 4 + 3)÷ 3 = 3時間
この設備は故障1回あたり平均3時間で復旧することを意味します。
MTBFとMTTRを組み合わせた稼働率の計算
MTBFとMTTRが求まれば、以下の式で稼働率(可用性)を計算できます。
MTBFとMTTRから稼働率を計算する式
稼働率(可用性)= MTBF ÷(MTBF + MTTR)
上記の例:MTBF=230時間・MTTR=3時間の場合
稼働率 = 230 ÷(230 + 3)= 230 ÷ 233 ≒ 0.9871 ≒ 98.71%
MTBFとMTTRを個別に改善してもその効果を稼働率として一元的に評価できるため、保全活動の成果をこの計算式で定量的に確認することが改善サイクルの推進に非常に有効です。
稼働率向上のためのMTBF・MTTR改善アプローチ
続いては、稼働率向上に向けたMTBFとMTTRの改善アプローチについて確認していきます。
稼働率を高めるには「故障を減らす(MTBF向上)」と「故障しても早く直す(MTTR短縮)」の両面からの取り組みが必要です。
MTBF向上(故障頻度の削減)のための施策
MTBFを向上させる、つまり故障を起きにくくするための主な施策として以下が挙げられます。
予防保全(PM:Preventive Maintenance)の計画的実施では消耗部品の定期交換・潤滑油の定期補充・定期点検などによって故障の予兆を早期に発見・対処します。
予知保全(PdM:Predictive Maintenance)は振動センサー・温度センサー・電流センサーなどのIoTデバイスで設備状態をリアルタイム監視し、故障の前兆を検知して事前に対処する最新のアプローチです。
設計段階での信頼性向上(デレーティング設計・フェールセーフ設計・高信頼性部品の採用)も長期的なMTBF向上に大きく貢献します。
MTTR短縮(修復時間の短縮)のための施策
MTTRを短縮するための主な施策として、保全手順の標準化・マニュアル整備・スペアパーツの適切な在庫管理・保全技術者のスキルアップ・リモートメンテナンス技術の導入などがあります。
MTTR短縮で見落とされがちなのが「故障検知からの初動時間」であり、警報システムの整備・担当者への迅速な通知・夜間休日の対応体制の確立など、修復作業開始までの時間を短縮することがMTTR全体の削減に大きく貢献します。
MTBFとMTTRの改善効果の定量評価例
MTBF向上とMTTR短縮のどちらに投資すべきかを判断する際に、計算による定量評価が役立ちます。
| シナリオ | MTBF | MTTR | 稼働率 |
|---|---|---|---|
| 現状 | 200時間 | 10時間 | 95.24% |
| MTBF向上(2倍) | 400時間 | 10時間 | 97.56% |
| MTTR短縮(半分) | 200時間 | 5時間 | 97.56% |
| 両方改善 | 400時間 | 5時間 | 98.77% |
この例ではMTBF向上とMTTR短縮のどちらも稼働率への効果が同等ですが、実際の改善コストと実現可能性を比較して最適な投資先を決定することが重要です。
ITシステムにおけるMTBF・MTTRと稼働率管理
続いては、ITシステムにおけるMTBF・MTTRと稼働率管理について確認していきます。
製造設備だけでなくITシステムの信頼性管理でもMTBFとMTTRは中心的な指標として活用されています。
ITシステムでのMTBFとMTTRの定義
ITシステムではMTBFはサーバー・ネットワーク機器・ソフトウェアなどが正常に稼働し続ける平均時間として定義されます。
クラウドサービスやSaaSではSLA(サービスレベル合意)に稼働率として表記されますが、この背景にはMTBFとMTTRの管理が存在します。
ITシステムのMTTRには故障検知・原因特定・修復作業・テスト確認・サービス再開という一連のプロセス全体の時間が含まれるため、単純な修理時間より長くなることが多いです。
SREとSLOにおけるMTBF・MTTRの活用
Google・Amazon・Microsoftなど大手IT企業が採用するSRE(Site Reliability Engineering)の実践では、MTBF・MTTRを含む信頼性指標の継続的な改善が中心的な活動です。
SLO(Service Level Objective:サービスレベル目標)として設定される稼働率目標を達成するために、インシデント発生時の対応プロセス改善・アラート精度の向上・ポストモーテム(障害振り返り)による再発防止活動が系統的に実施されます。
SREの考え方では稼働率99.9%を目指すためのMTBF・MTTR改善活動は「エラーバジェット(許容できる停止時間の予算)」の概念と組み合わせて管理され、過度な安定性追求がイノベーションの阻害にならないよう合理的な目標設定が行われます。
MTBF・MTTRデータの収集と管理方法
続いては、MTBF・MTTRデータの収集と管理方法について確認していきます。
MTBF・MTTRの計算と改善活動には正確なデータ収集が前提となります。
製造設備でのデータ収集方法
製造設備のMTBF・MTTRを正確に計算するには故障発生日時・復旧日時・故障原因・修復内容の記録が必要です。
IoTセンサーと設備管理システムを組み合わせることで故障発生と復旧を自動記録し、MTBF・MTTRをリアルタイムで計算・可視化できる環境が整います。
手動記録の場合は「設備故障記録シート」を標準化し、全ての故障事例を漏れなく記録することがデータ精度確保の基本です。
MTBFとMTTRの改善サイクル(PDCA)
MTBF・MTTRの継続的な改善にはPDCAサイクルの確立が重要です。
計画(Plan):目標MTBF・MTTRを設定し改善施策を立案する。実施(Do):予防保全・保全技術向上・スペアパーツ管理改善を実施する。確認(Check):実際のMTBF・MTTRを計算して目標達成度を評価する。改善(Act):達成できなかった場合の原因分析と対策の見直しを行います。
このサイクルを月次・四半期単位で回すことで、継続的な稼働率向上が実現します。
まとめ
MTBFは「平均故障間隔」として設備・システムの信頼性を、MTTRは「平均修復時間」として保全性を定量化する指標であり、両者を組み合わせた「MTBF÷(MTBF+MTTR)」の計算式で稼働率(可用性)が求められます。
稼働率向上にはMTBFを大きくする(故障を減らす)施策とMTTRを小さくする(早く直す)施策の両方が有効であり、定量的な効果比較によって最適な改善投資先を決定できます。
製造設備・ITシステムを問わず、MTBF・MTTRの正確な測定・記録・分析に基づく継続的な改善活動が、高い稼働率を維持し続けるための本質的なアプローチです。