LETTRES D ~ INFORMATION DU CENTRE DE RECHERCHES ARCHÉOLO G IQUES 30 ... ARCHEOLOGIE DU MIDI MÉDITERRANÉEN 12 Centre d e Recherchee Archeologiques S o phia Antipo l is 0 6565 VAL B ON N E CE O EX LETTRE D'INFORMATION Archéologie du Midi Méditerranéen Responsable de la rédaction Suzanne ROSCJAN La lettre d'mformation Archéologie du Midi \Jéditerranéen est envoyée sur demande, en échange d'informations et de publications. Toute corr espondance est a adresser à: Suzanne ROSCIAN C. \.R.S. C .R.A. Sophia Antipolis F-06565 VALBO'I\'E CEDEX 4 •4 ©Centre National de la Recherche Scientifique - PARIS - 1986 Tous droits réservés ISSN 077 50-6279 Desson et maquette dl' la couverture : Jean CH(VALI(R ~ ~ ~ \. j_.,v.w\i~.. 'r .1 ( •J\,, ~... \ · ~~~.o(•-1\.-.Y.;:\r'::--, 'L-.!' ''' '~,,\ •}' ••,.;.,, \~ ·-" rl-\ tc,~:;. -"i?,_ r( • 31 ~J{;t, PROBABILITES ET DETERMINATION D'ORIGINE Maurice PICON" Déterminer l'or igine d'une céramique par des méthodes géochimiques est une démarche essentiellement probabiliste. Mais une difficulté ex iste ici, dans la mesure où les probabilités en question sont impossibles à calculer, ce qui impose de raisonner sur des critères de substitution qui sont à l 'origine de bien des confus ions. Aussi est-il indispensab le, pour qui s'intéresse aux méthodes géochimiques, de ·s'arrêter un moment sur ces problèmes. C ' est donc à des ré fl e xions prél iminai res indispensables que cet exposé voudr ai t introduire. 1. RESSEMBLANCES ET PROBABILITES DE LOCALISATION Nous partirons d'un e xempl e th éorique, auquel nous donnerons une apparence concrète en faisant intervenir des lieux réels e t des r é férences cér am iques existantes. L'exemple théorique sera un groupe de cér amiques ayant une origine commune, mais inconnue. Nous désignerons ce groupe par A . Les élément s réels intervenant dans le raisonnemen t seront les productions de l'atelier de la Butte des Carmes à Marseille. Nous connaissons les compositions, r ée Iles, des céramiques de l a Butte des Carmes, e t notamment l es val eurs moyennes des divers constituants chimiques é tudiés. Nous supposons par ai lleurs que nous connaissons aussi les compositions moyennes des céramiques du groupe A, et que celles-ci ne sont pas très différentes des composi t ions moyennes de la Butte des Carmes. Nous avons donc 2 groupes de cér amiques dont l es compositions se ressembl ent, et nous nous demandons que lle signification accorder à un e t elle ressemblan ce. Ind iquerait-e l le, si le groupe A était un groupe réel, que les céramiques du groupe A sont originaires de la Bu tt e des Carmes, ou qu'elles ont une origine voisi ne? Pour tenter d'y voir plus clair, nous allons essayer de calculer la probabilité qu'aurait un a tel ier, s'installant en Provence, de présen ter par Je seul fait du hasard une composition moyenne qu i ne soit pas pl us é loignée de cel le de la Butte des Carmes que ne l'est ce lle du groupe A. 1. 1. Probabi 1i tés simples Considérons à titre d'exemple le pourcentage moyen en oxyde de titan e, Ti0 2, des product ions de l a Butte des Carmes, qui est de 0,67. Nous supposons que l e groupe A présent e pour ce même constituant une composition moyenne égal e à 0,7 1 %. Dans ces conditions, quelle probabilité y aurait-il pour qu'un atelier s'installant en Provence présente par le seul fait du hasard une composition, pour l'oxyde de titane, qui ne s'écar te pas de plus de 0,04 de l a moyenne des productions de la Butte des Carmes? Autre ment dit, quell e probabilité y aura it-i l pour qu e ce t atel ier t ombe par l 'effet du hasard sur des argil es dont le pource ntage moyen en oxyde de tit ane soit compris entre 0,63 et 0,7 1 ? • Labornluorl" dt' Céramologie. URA J du C.R.A., Maison de l' Orient méditerranéen, 1 rut> Haulin, 6936~ Lyon Cedex 2. 32 La réponse à cette question suppose évidemment que J'on connaisse quelles sont les différentes argiles que les potiers pouvaient rencontrer en Provence, et que l'on dispose à leur propos de données statistiques détaillées. Supposons que nous possédions ces données et que celles-ci seient exprimées sous forme d'histogrammes qui rassemblent, pour chacun des constituants chimiques, les compositions moyennes des différents gisements d'argile provençaux. C'est J'histogramme correspondant à l'oxyde de titane, Ti02, que J'on suppose reproduit sur la figure 1. La probabilité pour qu'un atelier installé en Provence utilise une argile dont le pourcentage moyen d'oxyde de ti ta ne soit compris entre 0,63 et 0,71 est égale à (sfi/S), où sri est la surface de J'histogramme comprise entre les limites 0,63% et 0,71 %, tandis que S est la surface totale de l'histogramme. On voit en effet, sur la portion agrandie de l'histogramme représentée sur la figure 2, que J'on a Sfi = (nfi x s), où nTi est le nombre de gisements provençaux dont les pourcentages moyens en oxyde de titane sont compris entre 0,63 et 0,71, s étant la surface de chacun des carrés représentant les différents gisements provençaux. De la même façon, si N est le nombre total des gisements provençaux étudiés, on a S =Ns, d'où (Sfi/S) =(nfi/N). Or ceci représente bien la probabilité cherchée, puisqu'il y aurait en Provence, nTi gisements d'ar~ile qui satisfont aux condi tions imposées pour Je titane, sur un total de N gisements etudiés. En choisissant au hasard un gisement d'argile en Provence, on aurait donc nfj/N chances pour que son pourcentage moyen en oxyde de titane soit compris entre 0,63 et 0,71. Dans Je cas théorique représenté sur la figur e 1 cette probabilité serait d'environ 0, J 0, ce qui signifie qu'il y aurait J chance sur 10 pour qu'un potier s'installant en Provence utilise une argile dont les pourcentages en oxyde de titane soient compris entre 0,63 et 0,71. 1.2. Probabilités composées Considérons à présent un second constituant c himique, par exemple le magnésium. Le pourcentage moyen en oxyde de magnésium, MgO, ou magnésie, des productions de la Butte des Carmes est de 3,6. Nous supposerons que celui du groupe A est de 3,4. Un calcul identique au précédent, effectué s ur l'histogra mme des compositions moyennes en magnésie des différents g isements d'argile provençaux, nous permettrait d'écrire que la probabilité pour qu'un pot ier qui s'installerai t e n Provence ai t affaire à des ar~iles dont le pourcentage moyen de magnésie soit compris entre 3,4 et 3,8 est égale a (sMg/S). Dans cette expression Sf\lg est la surface de l'histogramme comprise entre les limites 3,4 % et 3,8 %, S étant la surface totale de l'histogramme. Nous supposerons que cette probab ilité est égale à 0,05, soit 1 c hance s ur 20. Or si l'on a 1 c hance sur JO de rencontrer en Provence des gisements d'argile don t les pourcentages d'oxyde de titane soient compris e ntre 0,63 et 0,7 J, et si l'on a 1 chance sur 20 d'y rencontrer des gisements d'argile don t les po urcentages de magnésie soient compris entre 3,4 et 3,8, la probabilité d' y rencontrer des g isements pour lesquels ces deux conditions se trou verai e nt s imultanément vér ifiées es t beaucoup plus faible, théoriquement. Cela résulte du fait que parmi tous les gisements provençaux dont les pourc entages mo yens en oxyde de t itane sont compns ent re 0,63 et 0,71, une parti e possède des pource ntages moye ns de magnésie mfé rieu rs à 3,4, une au t re part1e des 33 pourcentages supérieurs à 3,8, et une partie seulement des pourcentages compris entre 3,4 et 3,8. Pour évaluer cette dernière partie, on se contentera en prem1ere approximation d'appliquer la règle dite des probabilités composées. Celle-ci indique que la probabilité pour que les deux conditions précédentes: 0,63 < % Tio2 < 0,71 et 3,4 < % MgO < 3,8 se trouvent simultanément vérifiées2 est égale au produit des deux probabilités simples correspondantes, soit (sri x SMg) /S • Pour le cas théorique considéré, cette probabilité serait donc égale à 0,1 x 0,05, soit 0,005. Il n'y aurait donc que 5 chances sur 1000 pour qu'un atelier s'implantant en Provence ait affaire à des argiles qui ne s'écartent pas plus des moyennes de la Butte des Carmes - pour le titane et Je magnésium - que ne le font les céramiques du groupe A. Pour les n constituants chimiques mesurés, la probabilité précédente serait alors égale à (sJx s2x••. x SMgX STiX •.. xsn)/sn. 1.3. Interprétation et discussion. Si de tels calculs sont fréquemment évoqués - malgré les erreurs qu'ils comportent, erreurs qu'on examinera plus loin - c'est à cause de l'interprétation faussement séduisante qu'ils suggèrent. En effet, si l'on prend en compte un nombre suffisant de constituants chimiques et si les ressemblances qui existent entre les compositions moyennes des productions de la Butte des Carmes et celles du groupe A sont fortement marquées pour tous ces constituants, la probabilité précédente sera très voisine de zéro. Or une probabilité nulle signifierait, si le groupe A était un groupe réel, qu'il n'y aurait aucune chance pour qu'un atelier s'implantant en Provence trouve des argiles dont les compositions soient aussi proches de celles de la Butte de Carmes que le sont celles du groupe A. Une telle ressemblance ne peut donc résulter du hasard, mais nécessairement d'une relation de voisinage liant les céramiques du groupe A et l'atelier de la Butte des Carmes. En réalité les faits sont autres, et les calculs précédents grossièrement inexacts. Outre l'ignorance où l'on se trouve Je plus souvent des caractéristiques de l'histogramme qui réunit les compositions moyennes des différentes argiles régionales, ce sont les probabilités composées dont l'expression théorique est irrecevable. Si l'on se réfère au cas pris en exemple, nous avons admis cjue les céramiques dont les pourcentages moyens en oxyde de titane se trouvent compris entre 0,63 et 0,71 avaient des pourcentages de magnésie absolument quelconques, régis par le seul hasard à l'intérieur de l'histogramme régional correspondant. Or il n'en est rien. Si les céramiques de la Butte des Carmes ont des pourcentages en oxyde de titane et en magnésie respectivement égaux à 0,67 et 3,6, cela ne résulte pas du ·hasard, mais d'un ensemble de causes où les données géologiques, minéralogiques et cristallographiques ont un rôle essentiel. Or les mêmes causes feront que les différentes argiles provençales dont les compositions moyennes pour l'oxyde de titane se situent entre 0,63 et 0,71 % auront des pourcentages de magnésie qui ne s'écarteront guère , dans la très grande majorité des cas, du pourcentage moyen de la Butte des Carmes: 3,6. Aussi, parmi tous les gisements provençaux d'argile dont les pourcentages moyens en oxyde de titane sont compris entre 0,63 et 0,71, la fraction dont les pourcentages moyens en magnésie sont compris entre 3,4 et 3,8 a-t-elle toutes les chances d'être la plus importante. Il en résulte que la probabilité de satisfaire simultanément aux 34 conditions: 0,63 < 96 Ti02 < 0,71 et 3,4 < % MgO < 3,8 est en réalité très supérieure aux 5/1000 donnés par le calcul, et qu'elle est sans doute assez peu différente des probabilités simples correspondantes. On ne peut en tout cas considérer comme étant nulle la probabilité pour que les ressemblances qui existent entre les composi tions moyennes relatives aux différents cons tituants chimiques des céramiques du groupe A et des céramiques de la Butte des Carmes, soient dues au hasard. Comme le tissu des relat ions qui existent entre les compositions moyennes des différents gisements d'argile d'une region donnée est extrêmement serré et complexe, il est hors de question de pouvoir calcul er la probabilité qu'a telle ressemblance existant entre les compositions moyennes de deux groupes, de ne résulter que du seul hasard. 1.4. C ri tères de substitution Face à l'impossibilité précédente on substituera au calcul de la probabilité une évaluation sommaire - et qui l e demeure, même si son expression peut et doit êtr e calculée avec préc ision. Il s'agit de la distance qui sépare les productions de la Butte des Car mes et les céramiques du groupe A. Cette distance est d'autant plus petite que les deux groupes ont des compositions qui se ressemblent plus. Pour des raisons de commodité, on considérera la distance de chacune des céramiques du groupe A au groupe formé par les productions de l a Butte des Car mes, plutôt que la distance entre l es deux groupes. Deux expressions différentes sont utilisées pour le calcul des distances. Ce sont l a distance généralisée ou distance de Mahalanobis qui tient compte des relations qui existent entre les divers constituants chimiques du &roupe par rapport auquel les distances sont calculées, et la distance euclidienne ou toutes les compositions sont considérées comme autant de variables indépendantes. Il est c l air que la première expression est toujours préférable. Le calcul de la distance peut être considéré comme un substitut de la probabi l i t é précédente, dans la mesure où l'on peut être assuré, si la distance entre une céramique donnée et le groupe des productions de la Butte des Carmes est faible, que la probabilité est grande pour que la ressemblance observée ne soit pas due au hasard mais résulte d'une relation de voisinage entre les lieux de production correspondants. De même, si cette distance est grande, la probabilité précédente sera nécessairement fa i ble. La difficulté, c'est qu'i l est impossi bl e de faire correspondr e une probabilité chiffr ée à une distance donnée. Or i l est vrai que dans l es problèmes de détermination d'origine on pourrait sans inconvénient majeur décider qu'en deçà d'une val eur limite fixée pour la probabilité, les ressemblances observées impliquent des relations de voisinage entre les lieux de production concernés. On pourrait décider par exemple que lorsqu'une ressemblance n'a qu'une chance sur 1000 d'être due au hasard, on est en droit d'admettre que les céramiques considérées ont une même origine (ou qu'elles sont originaires de rég ions voisines). Malheureusement rien de semblable ne peut exister pour les distances, puisqu'on ignore quelle probabilité correspond à telle distance particulière. Aussi est-il arbitraire et très risqué de fixer un seuil pour les distances, seuil en deçà duquel on admettrait que les céramiques étudiées ont même origine. 35 Toute la stratégie sur laquelle se fondent les déterminations d'origine effectuées en laboratoire par des méthodes géochimiques découle de l'impossibilité où l 'on se trouve de calculer (ou simplement d'éval uer) les probabilités précéd·e ntes, et de la nécessi té d'utiliser des critères de substitu tion approximatifs. Cette stratégie fait certe s appel à une connaissance générale, statistique, de l a signification à accorder aux distances, et plus encore à une connaissance particulière de la signification de ces distances dans le contexte géologique régional. Mais elle intègre également des critères de validation et des probabilités a priori dont l'exposé sortirait du cadre de cet art icle. 2. RESSEMBLANCE ET PROBABILITES D'EXTRACTION Dans un atelier de céramiques, les compositions des pâtes présentent pour chacun des cons tituants chimiques une dispersion, autour d'une composition moyenne, qui se traduit par un histogramme. Celui-ci peut être l e plus souvent assimilé à unè distribution gaussienne, l ' avantage d'une tel le assimi l ation étant de pouvoir effectuer des calculs de probabilités pl us commodément que sur les histogrammes réels. On sait par exemple que dans une distribution gaussienne on n'a qu'une probabilité égale à 0,045 d'avoir affaire à un exemplaire qui s'écarterait de plus de 2 écarts-types de la moyenne de la distribution, si l'on est amené à extraire un exemplaire au hasard, parmi tous ceu x qui font partie de la distribution considérée. Mais on voit facilement que ce calcul qui définit, pour une compositi on donnée, la probabilité qu'on a d'extraire un exemplaire de la distribution, qui soit plus éloigné (ou plus proche) de la moyenne du groupe, n'a pas grand chose à voir avec le problème qui nous occupait jusqu'alors. Tout au pl us peut-on considérer qu'il s'agit là d'un autre substitut possible pour la seule probabilité qui importe dans l es problèmes de détermination d' origi ne, la probabilité qu'une ressemb l ance a de résulter du seul hasard. Mais c'est un substitut peu commo de, bien moins explicite qu'un simple calcul de distance (généralisée ou euclidienne). De pl us on ne saurait imaginer Je nombre d'erreurs qui proviennent du fait que l'on a confondu une probabilité avec l'autre. Autant de raisons pour n'utiliser que les distances comme critères de substitution! 36 0.67 % Ti02 1.5 0 Fig. 1 - Histogramme - théorique - des compositions moyennes en oxyde de titane, Ti02, des différents gisements d'argi le provençaux . - ..1- ,. j...-- 0.63 0.71 Fig. 2 - Portion agrandie de 1'histogramme de la figure 1.