Libellé préféré : apprentissage par machine par renforcement;
Synonyme EFMI : optimisation par essaims particulaires; apprentissage par renforcement;
Acronyme EFMI : OEP; PSO;
Définition CISMeF : L'optimisation par essaims particulaires (OEP ou PSO en anglais) est une métaheuristique
d'optimisation, inventée par Russel Eberhart (ingénieur en électricité) et James Kennedy
(socio-psychologue) en 1995. (source https://fr.wikipedia.org/wiki/Optimisation_par_essaims_particulaires).; En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage
par renforcement consiste, pour un agent autonome (ex. : robot, agent conversationnel,
personnage dans un jeu vidéo, etc.), à apprendre les actions à prendre, à partir d'expériences,
de façon à optimiser une récompense quantitative au cours du temps (source https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement).;
Identifiant d'origine : 300252;
Alignements automatiques exacts (par équipe CISMeF)
L'optimisation par essaims particulaires (OEP ou PSO en anglais) est une métaheuristique
d'optimisation, inventée par Russel Eberhart (ingénieur en électricité) et James Kennedy
(socio-psychologue) en 1995. (source https://fr.wikipedia.org/wiki/Optimisation_par_essaims_particulaires).
En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage
par renforcement consiste, pour un agent autonome (ex. : robot, agent conversationnel,
personnage dans un jeu vidéo, etc.), à apprendre les actions à prendre, à partir d'expériences,
de façon à optimiser une récompense quantitative au cours du temps (source https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement).