Libellé préféré : apprentissage par machine par renforcement; 
Synonyme EFMI : optimisation par essaims particulaires; apprentissage par renforcement; 
Acronyme EFMI : OEP; PSO; 
Définition CISMeF : L'optimisation par essaims particulaires (OEP ou PSO en anglais) est une métaheuristique
               d'optimisation, inventée par Russel Eberhart (ingénieur en électricité) et James Kennedy
               (socio-psychologue) en 1995.  (source https://fr.wikipedia.org/wiki/Optimisation_par_essaims_particulaires).; En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage
               par renforcement consiste, pour un agent autonome (ex. : robot, agent conversationnel,
               personnage dans un jeu vidéo, etc.), à apprendre les actions à prendre, à partir d'expériences,
               de façon à optimiser une récompense quantitative au cours du temps (source https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement).; 
         
         
            Identifiant d'origine : 300252; 
 Alignements automatiques exacts (par équipe CISMeF) Alignements automatiques exacts (par équipe CISMeF)
 
         
         
         L'optimisation par essaims particulaires (OEP ou PSO en anglais) est une métaheuristique
            d'optimisation, inventée par Russel Eberhart (ingénieur en électricité) et James Kennedy
            (socio-psychologue) en 1995.  (source https://fr.wikipedia.org/wiki/Optimisation_par_essaims_particulaires).
En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage
            par renforcement consiste, pour un agent autonome (ex. : robot, agent conversationnel,
            personnage dans un jeu vidéo, etc.), à apprendre les actions à prendre, à partir d'expériences,
            de façon à optimiser une récompense quantitative au cours du temps (source https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement).