archeologie du midi méditerranéen 12

publicité
LETTRES D ~ INFORMATION
DU
CENTRE DE RECHERCHES ARCHÉOLO G IQUES
30
...
ARCHEOLOGIE DU MIDI
MÉDITERRANÉEN
12
Centre d e Recherchee Archeologiques
S o phia Antipo l is
0 6565 VAL B ON N E CE O EX
LETTRE D'INFORMATION Archéologie du Midi Méditerranéen
Responsable de la rédaction
Suzanne ROSCJAN
La lettre d'mformation Archéologie du Midi \Jéditerranéen est envoyée sur
demande, en échange d'informations et de publications.
Toute corr espondance est a adresser à:
Suzanne ROSCIAN
C. \.R.S. C .R.A.
Sophia Antipolis
F-06565 VALBO'I\'E CEDEX
4
•4
©Centre National de la Recherche Scientifique - PARIS - 1986
Tous droits réservés
ISSN 077 50-6279
Desson et maquette dl' la couverture : Jean CH(VALI(R
~ ~ ~ \. j_.,v.w\i~..
'r
.1 (
•J\,, ~... \ ·
~~~.o(•-1\.-.Y.;:\r'::--, 'L-.!' ''' '~,,\ •}' ••,.;.,, \~
·-"
rl-\ tc,~:;. -"i?,_ r( •
31
~J{;t,
PROBABILITES ET DETERMINATION D'ORIGINE
Maurice PICON"
Déterminer l'or igine d'une céramique par des méthodes géochimiques est une
démarche essentiellement probabiliste. Mais une difficulté ex iste ici, dans la mesure où
les probabilités en question sont impossibles à calculer, ce qui impose de raisonner sur
des critères de substitution qui sont à l 'origine de bien des confus ions. Aussi est-il
indispensab le, pour qui s'intéresse aux méthodes géochimiques, de ·s'arrêter un moment
sur ces problèmes. C ' est donc à des ré fl e xions prél iminai res indispensables que cet
exposé voudr ai t introduire.
1. RESSEMBLANCES ET PROBABILITES DE LOCALISATION
Nous partirons d'un e xempl e th éorique, auquel nous donnerons une apparence
concrète en faisant intervenir des lieux réels e t des r é férences cér am iques existantes.
L'exemple théorique sera un groupe de cér amiques ayant une origine commune,
mais inconnue. Nous désignerons ce groupe par A . Les élément s réels intervenant dans
le raisonnemen t seront les productions de l'atelier de la Butte des Carmes à Marseille.
Nous connaissons les compositions, r ée Iles, des céramiques de l a Butte des
Carmes, e t notamment l es val eurs moyennes des divers constituants chimiques é tudiés.
Nous supposons par ai lleurs que nous connaissons aussi les compositions moyennes des
céramiques du groupe A, et que celles-ci ne sont pas très différentes des composi t ions
moyennes de la Butte des Carmes.
Nous avons donc 2 groupes de cér amiques dont l es compositions se ressembl ent, et
nous nous demandons que lle signification accorder à un e t elle ressemblan ce.
Ind iquerait-e l le, si le groupe A était un groupe réel, que les céramiques du groupe A
sont originaires de la Bu tt e des Carmes, ou qu'elles ont une origine voisi ne?
Pour tenter d'y voir plus clair, nous allons essayer de calculer la probabilité
qu'aurait un a tel ier, s'installant en Provence, de présen ter par Je seul fait du hasard
une composition moyenne qu i ne soit pas pl us é loignée de cel le de la Butte des Carmes
que ne l'est ce lle du groupe A.
1. 1. Probabi 1i tés simples
Considérons à titre d'exemple le pourcentage moyen en oxyde de titan e, Ti0 2,
des product ions de l a Butte des Carmes, qui est de 0,67. Nous supposons que l e groupe
A présent e pour ce même constituant une composition moyenne égal e à 0,7 1 %.
Dans ces conditions, quelle probabilité y aurait-il pour qu'un atelier s'installant
en Provence présente par le seul fait du hasard une composition, pour l'oxyde de
titane, qui ne s'écar te pas de plus de 0,04 de l a moyenne des productions de la Butte
des Carmes? Autre ment dit, quell e probabilité y aura it-i l pour qu e ce t atel ier t ombe
par l 'effet du hasard sur des argil es dont le pource ntage moyen en oxyde de tit ane soit
compris entre 0,63 et 0,7 1 ?
• Labornluorl" dt' Céramologie. URA J du C.R.A., Maison de l' Orient méditerranéen, 1 rut> Haulin, 6936~ Lyon Cedex 2.
32
La réponse à cette question suppose évidemment que J'on connaisse quelles sont
les différentes argiles que les potiers pouvaient rencontrer en Provence, et que l'on
dispose à leur propos de données statistiques détaillées.
Supposons que nous possédions ces données et que celles-ci seient exprimées sous
forme d'histogrammes qui rassemblent, pour chacun des constituants chimiques, les
compositions moyennes des différents gisements d'argile provençaux. C'est J'histogramme correspondant à l'oxyde de titane, Ti02, que J'on suppose reproduit sur la
figure 1.
La probabilité pour qu'un atelier installé en Provence utilise une argile dont le
pourcentage moyen d'oxyde de ti ta ne soit compris entre 0,63 et 0,71 est égale à
(sfi/S), où sri est la surface de J'histogramme comprise entre les limites 0,63% et
0,71 %, tandis que S est la surface totale de l'histogramme. On voit en effet, sur la
portion agrandie de l'histogramme représentée sur la figure 2, que J'on a Sfi = (nfi x s),
où nTi est le nombre de gisements provençaux dont les pourcentages moyens en oxyde
de titane sont compris entre 0,63 et 0,71, s étant la surface de chacun des carrés
représentant les différents gisements provençaux.
De la même façon, si N est le nombre total des gisements provençaux étudiés, on
a S =Ns, d'où (Sfi/S) =(nfi/N). Or ceci représente bien la probabilité cherchée, puisqu'il
y aurait en Provence, nTi gisements d'ar~ile qui satisfont aux condi tions imposées pour
Je titane, sur un total de N gisements etudiés. En choisissant au hasard un gisement
d'argile en Provence, on aurait donc nfj/N chances pour que son pourcentage moyen en
oxyde de titane soit compris entre 0,63 et 0,71.
Dans Je cas théorique représenté sur la figur e 1 cette probabilité serait d'environ
0, J 0, ce qui signifie qu'il y aurait J chance sur 10 pour qu'un potier s'installant en
Provence utilise une argile dont les pourcentages en oxyde de titane soient compris
entre 0,63 et 0,71.
1.2. Probabilités composées
Considérons à présent un second constituant c himique, par exemple le magnésium.
Le pourcentage moyen en oxyde de magnésium, MgO, ou magnésie, des productions de
la Butte des Carmes est de 3,6. Nous supposerons que celui du groupe A est de 3,4.
Un calcul identique au précédent, effectué s ur l'histogra mme des compositions
moyennes en magnésie des différents g isements d'argile provençaux, nous permettrait
d'écrire que la probabilité pour qu'un pot ier qui s'installerai t e n Provence ai t affaire à
des ar~iles dont le pourcentage moyen de magnésie soit compris entre 3,4 et 3,8 est
égale a (sMg/S). Dans cette expression Sf\lg est la surface de l'histogramme comprise
entre les limites 3,4 % et 3,8 %, S étant la surface totale de l'histogramme. Nous
supposerons que cette probab ilité est égale à 0,05, soit 1 c hance s ur 20.
Or si l'on a 1 c hance sur JO de rencontrer en Provence des gisements d'argile don t
les pourcentages d'oxyde de titane soient compris e ntre 0,63 et 0,7 J, et si l'on a 1
chance sur 20 d'y rencontrer des gisements d'argile don t les po urcentages de magnésie
soient compris entre 3,4 et 3,8, la probabilité d' y rencontrer des g isements pour
lesquels ces deux conditions se trou verai e nt s imultanément vér ifiées es t beaucoup plus
faible, théoriquement.
Cela résulte du fait que parmi tous les gisements provençaux dont les
pourc entages mo yens en oxyde de t itane sont compns ent re 0,63 et 0,71, une parti e
possède des pource ntages moye ns de magnésie mfé rieu rs à 3,4, une au t re part1e des
33
pourcentages supérieurs à 3,8, et une partie seulement des pourcentages compris entre
3,4 et 3,8.
Pour évaluer cette dernière partie, on se contentera en prem1ere approximation
d'appliquer la règle dite des probabilités composées. Celle-ci indique que la probabilité
pour que les deux conditions précédentes:
0,63 < % Tio2 < 0,71
et
3,4 < % MgO < 3,8
se trouvent simultanément vérifiées2 est égale au produit des deux probabilités simples
correspondantes, soit (sri x SMg) /S • Pour le cas théorique considéré, cette probabilité
serait donc égale à 0,1 x 0,05, soit 0,005. Il n'y aurait donc que 5 chances sur 1000 pour
qu'un atelier s'implantant en Provence ait affaire à des argiles qui ne s'écartent pas
plus des moyennes de la Butte des Carmes - pour le titane et Je magnésium - que ne le
font les céramiques du groupe A.
Pour les n constituants chimiques mesurés, la probabilité précédente serait alors
égale à (sJx s2x••. x SMgX STiX •.. xsn)/sn.
1.3. Interprétation et discussion.
Si de tels calculs sont fréquemment évoqués - malgré les erreurs qu'ils
comportent, erreurs qu'on examinera plus loin - c'est à cause de l'interprétation
faussement séduisante qu'ils suggèrent. En effet, si l'on prend en compte un nombre
suffisant de constituants chimiques et si les ressemblances qui existent entre les
compositions moyennes des productions de la Butte des Carmes et celles du groupe A
sont fortement marquées pour tous ces constituants, la probabilité précédente sera très
voisine de zéro. Or une probabilité nulle signifierait, si le groupe A était un groupe
réel, qu'il n'y aurait aucune chance pour qu'un atelier s'implantant en Provence trouve
des argiles dont les compositions soient aussi proches de celles de la Butte de Carmes
que le sont celles du groupe A. Une telle ressemblance ne peut donc résulter du hasard,
mais nécessairement d'une relation de voisinage liant les céramiques du groupe A et
l'atelier de la Butte des Carmes.
En réalité les faits sont autres, et les calculs précédents grossièrement inexacts.
Outre l'ignorance où l'on se trouve Je plus souvent des caractéristiques de l'histogramme qui réunit les compositions moyennes des différentes argiles régionales, ce
sont les probabilités composées dont l'expression théorique est irrecevable.
Si l'on se réfère au cas pris en exemple, nous avons admis cjue les céramiques dont
les pourcentages moyens en oxyde de titane se trouvent compris entre 0,63 et 0,71
avaient des pourcentages de magnésie absolument quelconques, régis par le seul hasard
à l'intérieur de l'histogramme régional correspondant. Or il n'en est rien.
Si les céramiques de la Butte des Carmes ont des pourcentages en oxyde de titane
et en magnésie respectivement égaux à 0,67 et 3,6, cela ne résulte pas du ·hasard, mais
d'un ensemble de causes où les données géologiques, minéralogiques et cristallographiques ont un rôle essentiel. Or les mêmes causes feront que les différentes argiles
provençales dont les compositions moyennes pour l'oxyde de titane se situent entre
0,63 et 0,71 % auront des pourcentages de magnésie qui ne s'écarteront guère , dans la
très grande majorité des cas, du pourcentage moyen de la Butte des Carmes: 3,6.
Aussi, parmi tous les gisements provençaux d'argile dont les pourcentages moyens
en oxyde de titane sont compris entre 0,63 et 0,71, la fraction dont les pourcentages
moyens en magnésie sont compris entre 3,4 et 3,8 a-t-elle toutes les chances d'être la
plus importante. Il en résulte que la probabilité de satisfaire simultanément aux
34
conditions: 0,63 < 96 Ti02 < 0,71 et 3,4 < % MgO < 3,8 est en réalité très supérieure
aux 5/1000 donnés par le calcul, et qu'elle est sans doute assez peu différente des
probabilités simples correspondantes. On ne peut en tout cas considérer comme étant
nulle la probabilité pour que les ressemblances qui existent entre les composi tions
moyennes relatives aux différents cons tituants chimiques des céramiques du groupe A
et des céramiques de la Butte des Carmes, soient dues au hasard.
Comme le tissu des relat ions qui existent entre les compositions moyennes des
différents gisements d'argile d'une region donnée est extrêmement serré et complexe,
il est hors de question de pouvoir calcul er la probabilité qu'a telle ressemblance
existant entre les compositions moyennes de deux groupes, de ne résulter que du seul
hasard.
1.4. C ri tères de substitution
Face à l'impossibilité précédente on substituera au calcul de la probabilité une
évaluation sommaire - et qui l e demeure, même si son expression peut et doit êtr e
calculée avec préc ision.
Il s'agit de la distance qui sépare les productions de la Butte des Car mes et les
céramiques du groupe A. Cette distance est d'autant plus petite que les deux groupes
ont des compositions qui se ressemblent plus.
Pour des raisons de commodité, on considérera la distance de chacune des
céramiques du groupe A au groupe formé par les productions de l a Butte des Car mes,
plutôt que la distance entre l es deux groupes.
Deux expressions différentes sont utilisées pour le calcul des distances. Ce sont l a
distance généralisée ou distance de Mahalanobis qui tient compte des relations qui
existent entre les divers constituants chimiques du &roupe par rapport auquel les
distances sont calculées, et la distance euclidienne ou toutes les compositions sont
considérées comme autant de variables indépendantes. Il est c l air que la première
expression est toujours préférable.
Le calcul de la distance peut être considéré comme un substitut de la probabi l i t é
précédente, dans la mesure où l'on peut être assuré, si la distance entre une céramique
donnée et le groupe des productions de la Butte des Carmes est faible, que la
probabilité est grande pour que la ressemblance observée ne soit pas due au hasard
mais résulte d'une relation de voisinage entre les lieux de production correspondants.
De même, si cette distance est grande, la probabilité précédente sera nécessairement
fa i ble.
La difficulté, c'est qu'i l est impossi bl e de faire correspondr e une probabilité
chiffr ée à une distance donnée. Or i l est vrai que dans l es problèmes de détermination
d'origine on pourrait sans inconvénient majeur décider qu'en deçà d'une val eur limite
fixée pour la probabilité, les ressemblances observées impliquent des relations de
voisinage entre les lieux de production concernés.
On pourrait décider par exemple que lorsqu'une ressemblance n'a qu'une chance
sur 1000 d'être due au hasard, on est en droit d'admettre que les céramiques
considérées ont une même origine (ou qu'elles sont originaires de rég ions voisines).
Malheureusement rien de semblable ne peut exister pour les distances, puisqu'on
ignore quelle probabilité correspond à telle distance particulière. Aussi est-il arbitraire
et très risqué de fixer un seuil pour les distances, seuil en deçà duquel on admettrait
que les céramiques étudiées ont même origine.
35
Toute la stratégie sur laquelle se fondent les déterminations d'origine effectuées
en laboratoire par des méthodes géochimiques découle de l'impossibilité où l 'on se
trouve de calculer (ou simplement d'éval uer) les probabilités précéd·e ntes, et de la
nécessi té d'utiliser des critères de substitu tion approximatifs. Cette stratégie fait
certe s appel à une connaissance générale, statistique, de l a signification à accorder aux
distances, et plus encore à une connaissance particulière de la signification de ces
distances dans le contexte géologique régional. Mais elle intègre également des
critères de validation et des probabilités a priori dont l'exposé sortirait du cadre de cet
art icle.
2. RESSEMBLANCE ET PROBABILITES D'EXTRACTION
Dans un atelier de céramiques, les compositions des pâtes présentent pour chacun
des cons tituants chimiques une dispersion, autour d'une composition moyenne, qui se
traduit par un histogramme. Celui-ci peut être l e plus souvent assimilé à unè
distribution gaussienne, l ' avantage d'une tel le assimi l ation étant de pouvoir effectuer
des calculs de probabilités pl us commodément que sur les histogrammes réels.
On sait par exemple que dans une distribution gaussienne on n'a qu'une
probabilité égale à 0,045 d'avoir affaire à un exemplaire qui s'écarterait de plus de 2
écarts-types de la moyenne de la distribution, si l'on est amené à extraire un
exemplaire au hasard, parmi tous ceu x qui font partie de la distribution considérée.
Mais on voit facilement que ce calcul qui définit, pour une compositi on donnée, la
probabilité qu'on a d'extraire un exemplaire de la distribution, qui soit plus éloigné (ou
plus proche) de la moyenne du groupe, n'a pas grand chose à voir avec le problème qui
nous occupait jusqu'alors.
Tout au pl us peut-on considérer qu'il s'agit là d'un autre substitut possible pour la
seule probabilité qui importe dans l es problèmes de détermination d' origi ne, la
probabilité qu'une ressemb l ance a de résulter du seul hasard. Mais c'est un substitut
peu commo de, bien moins explicite qu'un simple calcul de distance (généralisée ou
euclidienne). De pl us on ne saurait imaginer Je nombre d'erreurs qui proviennent du
fait que l'on a confondu une probabilité avec l'autre. Autant de raisons pour n'utiliser
que les distances comme critères de substitution!
36
0.67
% Ti02
1.5
0
Fig. 1 - Histogramme - théorique - des compositions moyennes en oxyde de titane,
Ti02, des différents gisements d'argi le provençaux .
- ..1-
,.
j...--
0.63
0.71
Fig. 2 - Portion agrandie de 1'histogramme de la figure 1.
Téléchargement