StagedeMasterInformatique:Algorithmedistribué
asynchronedansunenvironnementnon‐coopératif
YezekaelHayel,LIA/CERI,Universitéd’Avignon
yezekael.hayel@univ‐avignon.fr
CesujetdestagedeMasterportesurl’étuded’algorithmesdistribuésasynchronesdansun
environnementnon‐coopératif.Desalgorithmesdistribuésbaséssurdestechniquesd’apprentissage
parrenforcementontmontrésleursapplicationspourfaireconvergerdessystèmesdistribuésnon‐
coopératifsversdessituationsd’équilibre(Nash).Laplupartdecesalgorithmes,commeceux
proposésdans[1]et[2],sebasentsurunesynchronisationdesactionsdechacundesjoueurs.
Nousproposonsdanscestaged’étudierl’impactdel’asynchronismeentrelesactionsdesjoueurssur
laconvergencedesalgorithmesdistribuésparrenforcement.Noustenteronsderépondreàplusieurs
questionsfondamentalesquisont:
• Commentl’asynchronismeimpactelaconvergencedel’algorithme(vitesse,divergence,…)?
• Sil’algorithmeconvergeeffectivement,versqueltyped’équilibre?
• Nousproposeronsuncontrôledel’asynchronismeafindeforcerl’algorithmeàconverger
versunéquilibreparticulierquipeutavoirdemeilleurespropriétésquelesautres.
CestagedeMasterrentreradanslecadreduprojetANREcosCells.Nousappliqueronsdoncnos
solutionsàunréseaucomposédepetitecellulesindépendantes,etnousétudierons,dansce
contexte,commentlescellulespeuventproposerdesdécisionsoptimalespourleréseau,defaçon
indépendantesetasynchrones.
LecandidatdoitêtreenMasterd’Informatiqueavecdebonnesconnaissancesenmathématiques
appliquéesetréseaudetélécommunication.Descompétencescomplémentairesenthéoriedesjeux
etalgorithmesd’apprentissagessontunplus.Larémunérationnetteserade1100euro.
Pourcandidateroupourtouteinformationcomplémentaire,veuillezenvoyerunmailà
yezekael.hayel@univ‐avignon.fr
[1]P.Sastry,V.Phansalkar,M.Thathachar,“DecentralizedLearningofNashEquilibriainMulti‐person
StochasticGameswithincompleteinformation”,IEEETransactionsonSystems,ManandCybernetics,
vol.24,no.5,1994.
[2]I.Erev,A.Roth,“Predictinghowpeopleplaygames:Reinforcementlearninginexperimental
gameswithunique,mixedstrategyequilibria”,Amer.Econ.Rev.,vol.88,1998.