David Silver
chercheur
From Wikipedia, the free encyclopedia
David Silver, né en 1976, est un informaticien et entrepreneur britannique qui dirige le groupe de recherche sur l'apprentissage par renforcement chez DeepMind et a été chercheur principal pour AlphaGo, AlphaZero et co-responsable d'AlphaStar.
Université de l'Alberta (docteur en philosophie) (jusqu'en )
| Naissance | |
|---|---|
| Formation |
Université de Cambridge (jusqu'en ) Université de l'Alberta (docteur en philosophie) (jusqu'en ) |
| Activités |
| A travaillé pour | |
|---|---|
| Membre de | |
| Sport | |
| Directeurs de thèse |
Richard S. Sutton, Martin Müller (d) |
| Site web | |
| Distinctions |
Éducation
David Silver obtient un diplôme à l'Université de Cambridge en 1997 en remportant le prix Addison-Wesley, et fait la connaissance de Demis Hassabis à ce moment-là[1]. Il reprend les études en 2004 à l'Université d'Alberta avec un doctorat sur l'apprentissage par renforcement, durant lequel il conçoit les algorithmes utilisés par les premiers programmes de Go 9×9 au niveau master et obtient son diplôme en 2009[2],[3]. Sa version du programme MoGo, co-écrit avec Sylvain Gelly, est l'un des programmes Go les plus performants depuis 2009[4].
Carrière
Après avoir obtenu son diplôme universitaire, David Silver participe à la création de la société de jeux vidéo Elixir Studios, où il est CTO et programmeur principal, lui valant plusieurs prix pour la technologie et l'innovation[1],[5].
David Silver reçoit une bourse de recherche universitaire de la Royal Society en 2011, puis devient professeur à l'University College de Londres[6]. Ses conférences sur l'apprentissage par renforcement sont disponibles sur YouTube[7]. Il est consultant pour DeepMind depuis sa création, rejoignant à plein temps l'entreprise en 2013.
Son travail récent est axé sur la combinaison de l'apprentissage par renforcement avec l'apprentissage profond, par exemple avec un programme qui apprend à jouer à des jeux Atari directement à partir de pixels[8]. Silver mène le projet AlphaGo, dont un des succès initiaux a été de battre un des meilleurs joueurs professionnels dans le jeu de Go à taille réelle[9]. Par la suite, AlphaGo reçoit la certification professionnelle honoraire 9 Dan et remporte le prix Cannes Lion pour l'innovation[10]. Il dirige ensuite le développement d'AlphaZero, utilisant la même intelligence artificielle pour apprendre à jouer Go sans exemple humain, avant d'apprendre à jouer aux échecs et au shōgi de la même manière, surpassant tous les autres programmes informatiques.
David Silver est l'un des employés de DeepMind les plus publiés, avec plus de 110 000 citations et un indice h de 74[11].
Il reçoit le prix ACM en informatique pour ses contributions dans la résolution informatique de jeux vidéo[12].
En 2021, il est élu membre de la Royal Society pour ses contributions aux Deep Q-Networks et AlphaGo[13].
