JJE – Bases de la Fiabilité – Feb. 2001 Pour ceux qui veulent aller plus loin De fait, toutes les affirmations précédentes découlent directement du calcul des probabilités, complété de quelques définitions formelles et d’hypothèses simplificatrices, comme celle du taux de pannes constant (CFR en anglais). Des modèles plus sophistiqués que le CFR existent, mais sont d’utilisation plus complexe. Le modèle CFR : Ne lire cette colonne que si vous voulez les bases… Partant d’une population suffisamment grande de systèmes identiques, dont le nombre diminue progressivement avec le temps au rythme des défaillances, le modèle CFR suppose que : Mathématiquement, si N(t) est le nombre de systèmes opérationnels à l’instant t, la variation de ce nombre pendant l’intervalle dt est: dN(t) = - N(t)dt, où le signe moins signifie que l’on perd des systèmes (on n’en crée pas !) et est le taux de pannes, supposé constant dans le modèle CFR.. le nombre de pannes qui se produisent pendant un intervalle de temps donné est proportionnel à la durée de cet intervalle et au nombre de systèmes toujours en vie à ce moment. Il en découle que, N0 étant le nombre initial de systèmes à t=0, le nombre de survivants est une fonction exponentielle décroissante: N(t) = N0 exp(-t) Probabilité de survie fonction Fiabilité (survie): 100% Si l’on s’intéresse à un seul système, la probabilité que ce système soit toujours opérationnel à un instant donné est égale au nombre espéré de survivants divisé par le nombre initial de systèmes. temps 1/(= MTTF, voir plus bas) Avec le temps, la probabilité de survie du système décroît exponentiellement de 1 à 0. La probabilité qu’un système donné soit toujours opérationnel à l’instant t est sa fonction fiabilité (F comme « fonctionnel ») : F(t) = N(t)/N0 = exp(-t) Tracer la courbe de fiabilité de votre système La probabilité qu’un système soit tombé en panne avant l’instant t est: fonction de Répartition des Pannes: La probabilité qu’un système soit tombé en panne avant l’instant t est le complément à 1 de la fonction fiabilité. D(t) =1-F(t) = 1-exp(-t) (D comme « défaillant »). En termes de probabilité, si T désigne la variable aléatoire « instant de la panne », alors : Le nombre cumulé de systèmes tombés en panne avant l’instant t s’obtient simplement en multipliant la valeur de la fonction répartition à cet instant par le nombre initial de systèmes. Prob[t<T] = F(t) Prob[T t] = D(t) Bien noter que N0 D(t) n’est pas le nombre de systèmes qui tombent en panne à l’instant t, mais le nombre cumulé de tous ceux qui sont tombés en pannes avant l’instant t. La fonction de répartition des pannes croît de 0 à 1 au rythme de la disparition des systèmes. Tracer la courbe de répartition des pannes Fonction Densité de pannes: C’est la probabilité d’avoir une panne par unité de temps à l’instant considéré. La fonction densité de pannes est définie par: Elle est maximale en début de vie, et décroît progressivement dans le temps. Le risque de panne est maximal pour les systèmes jeunes. Les plus vieux ont davantage de chances de vivre plus longtemps (comparer à l’espérance de vie à un âge donné en démographie…). Mathématiquement, d((t) est la dérivée de la fonction de répartition D(t); soit., d(t) = dD(t)/dt = exp(-t) Prob[t<T t+dt]= d(t) dt Le taux de pannes est la valeur prise à l’instant t par la probabilité conditionnelle pour qu’un système bon jusque là tombe en panne dans l’intervalle suivant dt : Prob[t<T t+dt / t<T] =d(t)/D(t) = 1/3 JJE – Bases de la Fiabilité – Feb. 2001 Temps Moyen Avant Panne (MTTF): C’est tout simplement l’espérance de vie d’un système neuf. Le MTTF est simplement la valeur moyenne de la variable aléatoire T: MTTF = 0t d(t) dt = 0F(t) dt = 1/ La probabilité qu’un système survive jusqu’à son MTTF n’est que de 37% (1/e); la probabilité qu’il soit tombé en panne avant est de 63%. L’intérêt du modèle CFR est que le MTTF n’est autre que l’inverse du taux de pannes ! C’est aussi l’instant auquel la tangente à l’origine de la courbe de fiabilité coupe l’axe des abscisses (voir graphe plus haut…) En moyenne, seulement environ 1/3 des systèmes atteignent leur MTTF … environ 2/3 meurent avant ! A propos, la variance est : 2 = 1 / 2… simplement ! Système à N composants: Si les modes de panne des composants sont indépendants, alors le taux de panne global du système est la somme des taux de pannes des composants. Le système est considéré en panne dès qu’un seul de ses composants l’est. Par conséquent, la fiabilité du système est le produit des fiabilités des composants: Si tous les systèmes sont identiques, alors le MTTF du système est N fois plus petit que celui du composant individuel. Ou encore: FS(t) = exp[-(1+2…+N)t] FS= F1F2…FN = exp(-1t) exp(-2t)…exp(-Nt) Si les N taux de pannes sont identiques, alors S = N , et MTTFS = 1 / N = MTTF / N Attention: ceci n’est vrai que pour le modèle CFR. Nombre de pannes au temps t: Le nombre cumulé de pannes survenues avant l’instant t est lui-même une variable aléatoire. Les pannes enregistrées avant l’instant t résultent de la répétition des épreuves d’un événement de probabilité D(t). Par suite, la probabilité d’avoir exactement k composants tombés en panne avant t est obtenue par la loi binomiale (BL): Sa valeur moyenne est simplement le produit du nombre initial de composants par la valeur de la fonction de fiabilité de ce composant à l’instant t. Sa distribution, c’est-à-dire l’ensemble des probabilités de tous les nombres possibles de pannes, est régie par la loi binomiale (Bernoulli) . Prob(k cpt HS et N-k cpts OK) = CN0k D(t)k F(t)N0-k Plus le nombre de composants est élevé, plus la dispersion est grande. Elle est maximale au 2/3 du MTTF. La moyenne de la loi binomiale est N D(t) = N exp(-t), et sa variance 2=ND(t)F(t)=N exp(-t)[1-exp(-t)]. Elle est nulle pour t=0 (tous les composants marchent) et pour t très grand (aucun survivant), mais est maximale pour t=Ln2/ = 0,67 MTTF Où: CN0k = N0! / (N0-k)! k! est le nombre de combinaisons de k objets pris parmi N0. Estimer la probabilité d’une situation Système réparable : L’analyse complète d’un système réparable repose sur la théorie des chaînes de Markow à paramètre continu. En cas de panne le système est immédiatement réparé et son exploitation reprend. C’est le cas d’une barre d’écriture qui est en panne dès que défaille l’un quelconque des modules qui la composent. F D Dans le cas le plus simple de seulement 2 états (F et D), si pF et pD sont respectivement les probabilités de se trouver dans les états F et D : Le module n’est pas réparable, mais la barre l’est ! L’imprimante décrit ainsi des cycles successifs d’exploitation et d’arrêt pour réparation, passant continuellement d’un état fonctionnel F à un état défaillant D et vice versa. Les transitions de l’état F vers l’état D interviennent au taux (c’est ici le taux de pannes de la barre, pas du module !), et celles de D vers F au taux , appelé taux de réparation. dpF/dt = -pF + pD dpD/dt = pF - pD La résolution de ce système différentiel conduit aux probabilités conditionnelles et temps moyens ci-dessous: -Fiabilité: Prob[Ft /F0] = F(t) = exp(-t) - Temps moyen avant panne: - Maintenabilité: De même que définit le MTTF, définit le MTTR (temps moyen de réparation). Prob[Ft /D0] = M(t) = 1-exp(-t) - Temps moyen de réparation: 2/3 MTTF = 1/ MTTR = 1/ JJE – Bases de la Fiabilité – Feb. 2001 Les temps passés par le système respectivement dans ses états de fonctionnement et de défaillance sont eux-mêmes des variables aléatoires. Sur une très longue période, leurs moyennes respectives, MUT (mean up time en anglais) et MDT (mean down time) ne sont autres que le MTTF et le MTTR (ceci dans le cas d’un seul mode de panne, sinon c’est plus compliqué…). La somme du MTTF et du MTTR donne alors le MTBF (mean time between failures) (F) (D) TBFi-1 (F) (D) TBFi (F) (D) (F) TBFi+1 TBFi+2 temps - Part du temps passé en F et D en régime stationnaire: En général, le MTBF est donc différent du MTTF. Mais dans le cas d’une barre d’écriture, est normalement grand devant et par suite il est acceptable de confondre les deux. Etat F (fonctionnel) /(+) Etat D (défaillant) /(+) - Mean-up-time: MUT = 1/ = MTTF - Mean-down-time: MDT = 1/ = MTTR - Mean-time-between-failures: - Disponibilité: MTBF = 1/ +1/ A =MTTF/(MTTF+MTTR) = /(+) Estimation pratique du MTTF : Ce qui précède est à la base de l’estimation du MTTF du module tête à partir de l’observation du nombre de pannes d’une barre de 18 modules sur un temps suffisamment long. Si l’on observe un nombre de pannes Npanne sur une période d’observation Tobs, alors le MTBF du système est la limite : 1) Noter le nombre total cumulé Himp des heures d’impression effectuées pendant la période d’observation. Connaissant leMTTR du composant, on en tire le MTTF du système: MTTFS = MTBFS – MTTR (si le MTTR est suffisament faible cette correction peut être négligée et MTTFS = MTBFS) 2) Noter le nombre total cumulé Mrep des modules têtes remplacés pendant la période d’observation. Finalement, si le système est composé de N composants identiques, le MTTF du composant est: 3) Himp / Mrep est à ce stade l’estimation la plus probable du MTBF de la barre En réalité, comme le temps d’observation est forcément fini, nous n’obtenons qu’un estimateur MTTFest de la moyenne de la variable aléatoire TBF (time-betweenfailures). Il est possible de lui associer un intervalle de confiance (de taux de confiance fixé a priori CL). Habituellement, on estime qu’une statistique du chi-2 peut être utilisée, d’où les bornes de la fourchette: MTBFS = lim (Tobs / Fpanne) si t MTTF = MTTFS x N 4) 18 x Himp / Mrep est à ce stade l’estimation la plus probable du MTTF du module tête Les estimateurs ci-dessus sont bien entendu très peu sûrs pour des temps d’observation courts (plus précisément un nombre de pannes peu élevé). Ils deviennent de plus en plus fiables à mesure que la période d’observation, donc le nombre de pannes, s’allonge. Borne inf. = 2N Tobs / 2[(1+CL)/2,2Nfail+2] Borne sup. = 2N Tobs / 2 [(1-CL)/2,2Nfail] Où 2 (p,d) est la valeur de la variable donnant une probabilité p pour une distribution du chi-2 à d degrés de liberté. Il est vivement recommandé d’associer à ces estimateurs une fourchette de valeurs correspondant au taux de confiance souhaité. La formulation est légèrement différente pour un test tronqué, c’est-à-dire si l’observation est arrêtée à la dernière panne rencontrée. Calculer un MTTF et son intervalle de confiance Retour au MTTF mais c’est très simple 3/3