Everything you ever wanted to know about MTTF

publicité
JJE – Bases de la Fiabilité – Feb. 2001
Pour ceux qui veulent aller plus loin
De fait, toutes les affirmations précédentes découlent directement du calcul des probabilités, complété de
quelques définitions formelles et d’hypothèses simplificatrices, comme celle du taux de pannes constant
(CFR en anglais). Des modèles plus sophistiqués que le CFR existent, mais sont d’utilisation plus complexe.
Le modèle CFR :
Ne lire cette colonne que si vous voulez les bases…
Partant d’une population suffisamment grande de
systèmes identiques, dont le nombre diminue
progressivement avec le temps au rythme des
défaillances, le modèle CFR suppose que :
Mathématiquement, si N(t) est le nombre de systèmes
opérationnels à l’instant t, la variation de ce nombre
pendant l’intervalle dt est: dN(t) = - N(t)dt, où le signe
moins signifie que l’on perd des systèmes (on n’en crée
pas !) et  est le taux de pannes, supposé constant dans
le modèle CFR..
le nombre de pannes qui se produisent pendant un
intervalle de temps donné est proportionnel à la
durée de cet intervalle et au nombre de systèmes
toujours en vie à ce moment.
Il en découle que, N0 étant le nombre initial de systèmes à
t=0, le nombre de survivants est une fonction
exponentielle décroissante: N(t) = N0 exp(-t)
Probabilité de survie
fonction Fiabilité (survie):
100%
Si l’on s’intéresse à un seul système, la
probabilité que ce système soit toujours
opérationnel à un instant donné est égale au
nombre espéré de survivants divisé par le nombre
initial de systèmes.
temps
1/(= MTTF, voir plus bas)
Avec le temps, la probabilité de survie du
système décroît exponentiellement de 1 à 0.
La probabilité qu’un système donné soit toujours
opérationnel à l’instant t est sa fonction fiabilité (F
comme « fonctionnel ») : F(t) = N(t)/N0 = exp(-t)
Tracer la courbe de fiabilité de votre système

La probabilité qu’un système soit tombé en panne avant
l’instant t est:
fonction de Répartition des Pannes:
La probabilité qu’un système soit tombé en panne
avant l’instant t est le complément à 1 de la
fonction fiabilité.
D(t) =1-F(t) = 1-exp(-t) (D comme « défaillant »).
En termes de probabilité, si T désigne la variable
aléatoire « instant de la panne », alors :
Le nombre cumulé de systèmes tombés en panne
avant l’instant t s’obtient simplement en
multipliant la valeur de la fonction répartition à
cet instant par le nombre initial de systèmes.
Prob[t<T] = F(t)  Prob[T t] = D(t)
Bien noter que N0 D(t) n’est pas le nombre de systèmes
qui tombent en panne à l’instant t, mais le nombre
cumulé de tous ceux qui sont tombés en pannes avant
l’instant t.
La fonction de répartition des pannes croît de 0 à
1 au rythme de la disparition des systèmes.
Tracer la courbe de répartition des pannes
Fonction Densité de pannes:
C’est la probabilité d’avoir une panne par unité de
temps à l’instant considéré.
La fonction densité de pannes est définie par:
Elle est maximale en début de vie, et décroît
progressivement dans le temps. Le risque de
panne est maximal pour les systèmes jeunes. Les
plus vieux ont davantage de chances de vivre plus
longtemps (comparer à l’espérance de vie à un âge
donné en démographie…).
Mathématiquement, d((t) est la dérivée de la fonction de
répartition D(t); soit., d(t) = dD(t)/dt =  exp(-t)
Prob[t<T t+dt]= d(t) dt
Le taux de pannes est la valeur prise à l’instant t par
la probabilité conditionnelle pour qu’un système bon
jusque là tombe en panne dans l’intervalle suivant dt :
Prob[t<T t+dt / t<T] =d(t)/D(t) = 
1/3
JJE – Bases de la Fiabilité – Feb. 2001
Temps Moyen Avant Panne (MTTF):
C’est tout simplement l’espérance de vie d’un
système neuf.
Le MTTF est simplement la valeur moyenne de la
variable aléatoire T:
MTTF = 0t d(t) dt = 0F(t) dt = 1/
La probabilité qu’un système survive jusqu’à son
MTTF n’est que de 37% (1/e); la probabilité qu’il
soit tombé en panne avant est de 63%.
L’intérêt du modèle CFR est que le MTTF n’est autre que
l’inverse du taux de pannes ! C’est aussi l’instant auquel
la tangente à l’origine de la courbe de fiabilité coupe
l’axe des abscisses (voir graphe plus haut…)
En moyenne, seulement environ 1/3 des systèmes
atteignent leur MTTF … environ 2/3 meurent
avant !
A propos, la variance est : 2 = 1 / 2… simplement !
Système à N composants:
Si les modes de panne des composants sont
indépendants, alors le taux de panne global du
système est la somme des taux de pannes des
composants.
Le système est considéré en panne dès qu’un seul de ses
composants l’est. Par conséquent, la fiabilité du système
est le produit des fiabilités des composants:
Si tous les systèmes sont identiques, alors le
MTTF du système est N fois plus petit que celui
du composant individuel.
Ou encore: FS(t) = exp[-(1+2…+N)t]
FS= F1F2…FN = exp(-1t) exp(-2t)…exp(-Nt)
Si les N taux de pannes sont identiques, alors S = N  ,
et MTTFS = 1 / N = MTTF / N
Attention: ceci n’est vrai que pour le modèle CFR.
Nombre de pannes au temps t:
Le nombre cumulé de pannes survenues avant
l’instant t est lui-même une variable aléatoire.
Les pannes enregistrées avant l’instant t résultent de la
répétition des épreuves d’un événement de probabilité
D(t). Par suite, la probabilité d’avoir exactement k
composants tombés en panne avant t est obtenue par la
loi binomiale (BL):
Sa valeur moyenne est simplement le produit du
nombre initial de composants par la valeur de la
fonction de fiabilité de ce composant à l’instant t.
Sa distribution, c’est-à-dire l’ensemble des
probabilités de tous les nombres possibles de
pannes, est régie par la loi binomiale (Bernoulli) .
Prob(k cpt HS et N-k cpts OK) = CN0k D(t)k F(t)N0-k
Plus le nombre de composants est élevé, plus la
dispersion est grande. Elle est maximale au 2/3
du MTTF.
La moyenne de la loi binomiale est N D(t) = N exp(-t),
et sa variance 2=ND(t)F(t)=N exp(-t)[1-exp(-t)]. Elle
est nulle pour t=0 (tous les composants marchent) et
pour t très grand (aucun survivant), mais est maximale
pour t=Ln2/ = 0,67 MTTF
Où:
CN0k = N0! / (N0-k)! k!
est le nombre de
combinaisons de k objets pris parmi N0.
Estimer la probabilité d’une situation
Système réparable :
L’analyse complète d’un système réparable repose sur la
théorie des chaînes de Markow à paramètre continu.
En cas de panne le système est immédiatement
réparé et son exploitation reprend.

C’est le cas d’une barre d’écriture qui est en
panne dès que défaille l’un quelconque des
modules qui la composent.


F


D

Dans le cas le plus simple de seulement 2 états (F et D),
si pF et pD sont respectivement les probabilités de se
trouver dans les états F et D :
Le module n’est pas réparable, mais la barre l’est !
L’imprimante décrit ainsi des cycles successifs
d’exploitation et d’arrêt pour réparation, passant
continuellement d’un état fonctionnel F à un état
défaillant D et vice versa. Les transitions de
l’état F vers l’état D interviennent au taux 
(c’est ici le taux de pannes de la barre, pas du
module !), et celles de D vers F au taux , appelé
taux de réparation.
dpF/dt = -pF +  pD
dpD/dt = pF -  pD
La résolution de ce système différentiel conduit aux
probabilités conditionnelles et temps moyens ci-dessous:
-Fiabilité:
Prob[Ft /F0] = F(t) = exp(-t)
- Temps moyen avant panne:
- Maintenabilité:
De même que  définit le MTTF,  définit le
MTTR (temps moyen de réparation).
Prob[Ft /D0] = M(t) = 1-exp(-t)
- Temps moyen de réparation:
2/3
MTTF = 1/
MTTR = 1/
JJE – Bases de la Fiabilité – Feb. 2001
Les temps passés par le système respectivement
dans ses états de fonctionnement et de
défaillance sont eux-mêmes des variables
aléatoires. Sur une très longue période, leurs
moyennes respectives, MUT (mean up time en
anglais) et MDT (mean down time) ne sont autres
que le MTTF et le MTTR (ceci dans le cas d’un
seul mode de panne, sinon c’est plus compliqué…).
La somme du MTTF et du MTTR donne alors le
MTBF (mean time between failures)
(F)
(D)
TBFi-1
(F)
(D)
TBFi
(F) (D)
(F)
TBFi+1
TBFi+2
temps
- Part du temps passé en F et D en régime stationnaire:

En général, le MTBF est donc différent du MTTF.
Mais dans le cas d’une barre d’écriture,  est
normalement grand devant  et par suite il est
acceptable de confondre les deux.
Etat F (fonctionnel)
/(+)
Etat D (défaillant)
/(+)
- Mean-up-time:
MUT = 1/ = MTTF
- Mean-down-time:
MDT = 1/ = MTTR
- Mean-time-between-failures:
- Disponibilité:
MTBF = 1/ +1/
A =MTTF/(MTTF+MTTR) = /(+)
Estimation pratique du MTTF :
Ce qui précède est à la base de l’estimation du
MTTF du module tête à partir de l’observation du
nombre de pannes d’une barre de 18 modules sur
un temps suffisamment long.
Si l’on observe un nombre de pannes Npanne sur une
période d’observation Tobs, alors le MTBF du système est
la limite :
1) Noter le nombre total cumulé Himp des heures
d’impression effectuées pendant la période
d’observation.
Connaissant leMTTR du composant, on en tire le MTTF
du système: MTTFS = MTBFS – MTTR (si le MTTR est
suffisament faible cette correction peut être négligée et
MTTFS = MTBFS)
2) Noter le nombre total cumulé Mrep des
modules têtes remplacés pendant la période
d’observation.
Finalement, si le système est composé de N composants
identiques, le MTTF du composant est:
3) Himp / Mrep est à ce stade l’estimation la plus
probable du MTBF de la barre
En réalité, comme le temps d’observation est forcément
fini, nous n’obtenons qu’un estimateur MTTFest de la
moyenne de la variable aléatoire TBF (time-betweenfailures). Il est possible de lui associer un intervalle de
confiance (de taux de confiance fixé a priori CL).
Habituellement, on estime qu’une statistique du chi-2
peut être utilisée, d’où les bornes de la fourchette:
MTBFS = lim (Tobs / Fpanne) si t
MTTF = MTTFS x N
4) 18 x Himp / Mrep est à ce stade l’estimation la
plus probable du MTTF du module tête
Les estimateurs ci-dessus sont bien entendu très
peu sûrs pour des temps d’observation courts
(plus précisément un nombre de pannes peu
élevé). Ils deviennent de plus en plus fiables à
mesure que la période d’observation, donc le
nombre de pannes, s’allonge.
Borne inf. = 2N Tobs / 2[(1+CL)/2,2Nfail+2]
Borne sup. = 2N Tobs / 2 [(1-CL)/2,2Nfail]
Où 2 (p,d) est la valeur de la variable donnant une
probabilité p pour une distribution du chi-2 à d degrés
de liberté.
Il est vivement recommandé d’associer à ces
estimateurs
une
fourchette
de
valeurs
correspondant au taux de confiance souhaité.
La formulation est légèrement différente pour un test
tronqué, c’est-à-dire si l’observation est arrêtée à la
dernière panne rencontrée.
Calculer un MTTF et son intervalle de confiance
Retour au MTTF mais c’est très simple
3/3
Téléchargement