Return to site

Interview de Guillaume LECUÉ

Mathématicien de la donnée, au CNRS

Aujourd'hui en poste au CNRS, tu as choisi le métier de mathématicien de la donnée. A quel moment prend-on ce genre de décision ? Quelles sont la personne rencontrée autour de toi qui t'a le plus influencé ?

Je viens de prendre un poste de professeur à l'ENSAE en septembre mais avant cela je suis en effet resté 11 ans au CNRS à l'INSMI; l'institut des mathématiques du CNRS. D'abord, mon goût pour les mathématiques est venu si tôt que je ne m'en souviens pas vraiment. Par contre, je me rappelle avoir décidé de faire une carrière dans les maths après avoir vu quelques démonstrations que je trouvais très esthétiques. Un petit peu comme la découverte de Florence par Stendhal, la géométrie projective m'a laissé une forte impression de "beauté immédiate", sans intermédiaires autre que celui de la pensée. J'avais donc envie de pouvoir produire par moi même de telles preuves. Voilà pour les maths. Pour les applications des maths, "la déraisonnable efficacité des mathématiques" dans presque tous les domaines d'activité des Hommes m'a questionné comme beaucoup d'autres avant moi. Je me rappelle encore de ce cours de philosophie de Terminale sur la "critique de la raison pure" de Kant où notre professeur nous expliquait que seule la partie compréhensible du monde était accessible à l'Homme, autrement dit, l'esprit façonne le monde qui nous apparaît alors comme compréhensible. Cela me semblait être une bonne explication sur cette efficacité des maths. Bien sûr, ce point de vue posait des questions encore plus abyssales que celle de la déraisonnable efficacité des mathématiques et m'ont laissé tenté un instant par des études de philosophie mais les problèmes de débouchées dans les sciences humaines m'ont fait changé d'avis. Néanmoins, j'avais développé un désir de connaissances et d'explications pour les mathématiques et ses innombrables applications. Par ailleurs, le soucis impératif de trouver un emploi à la fin de mes études me semblait être en accord avec ce goût et je l'ai donc développé au fil des mes études en toute tranquillité. J'ai alors eu un cours de statistiques mathématiques de Philippe Berthet qui m'a montré pour la première fois une approche mathématiques des statistiques. Ce cours a vraiment été déclencheur pour moi car il me semblait alors possible de faire la synthèse de mathématiques très esthétiques et de les appliquer par la suite pour peut-être retrouver cette part d'esthétique que contiennent certaines preuves en mathématiques dans des thématiques très concrètes comme le traitement du signal, l'économétrie, la biologie ou la physique. J'ai alors décidé de faire une thèse de statistiques mathématiques à Jussieu avec Sacha Tsybakov. J'ai eu la chance d'avoir un très bon sujet et très bon directeur de thèse sur les méthodes d'agrégation qui m'a permis d'explorer plusieurs thématiques en statistiques et plusieurs techniques mathématiques en particulier les processus empiriques. Finalement, à la suite de nombreuses collaborations avec Shahar Mendelson, j'ai appris des liens entre apprentissage statistique et géométrie des espaces de grandes dimensions. Ces derniers liens m'ont fait revenir à mon goût d'origine pour les belles preuves géométriques en mathématiques mais surtout ils m'ont fait découvrir le rôle "déraisonnable" de l'aléatoire dans les mathématiques qui ne cesse depuis lors de me choquer. J'y ai découvert une multitude d'énoncés et de problèmes purement déterministes qui ne trouvent de solutions que par des procédés aléatoires. Ces solutions aléatoires à des problèmes déterministes ne cesse de me questionner, surtout qu'il semble très difficile (voir impossible ?) de se passer de l'aléatoire pour obtenir ces résultats. "La déraisonnable efficacité de l'aléatoire dans les mathématiques" associé à "la déraisonnable efficacité des maths" posent des questions sur notre perception de la construction du réel. Pour conclure, je suis devenu mathématicien de la donnée par goût et par pragmatisme; par goût pour l'esthétisme des maths et par le désir de retrouver cet esthétisme dans ses applications ainsi que par pragmatisme en termes de débouchés.
       

Après 40 publications (dont 6 dans Annals of Statistics, la revue la plus prestigieuse du domaine) à seulement 37 ans, qu'est-ce qui te donne encore l'envie de te lever le matin ?

Pour rebondir sur la question précédente, il y a un domaine du monde réel que les mathématiques ont très peu expliqué jusqu'ici qui est l'intelligence humaine. Il y a bien sûr quelques chose de dérangeant à chercher d'expliquer ou de comprendre l'intelligence humaine au travers d'une analyse mathématique vue que les maths semblent être le fruit de cette même intelligence humaine. Néanmoins, ces dernières années, on a vu se développer des algorithmes solutionnant des taches complexes à un niveau d'efficacité équivalent ou meilleur à celui d'experts. L'étude mathématique de ces algorithmes me semble être une des plus grande taches que notre génération sera amener à résoudre. Il y a aussi d'autres problèmes annexes liés à la qualité et à l'équité des bases de données qui me motivent beaucoup depuis 2 ans.

Et cette semaine, quel est ton emploi du temps ?

Je passe beaucoup de temps avec les élèves que j'encadre en thèse ou à l'ENSAE. C'est un vrai plaisir de travailler avec des élèves motivés, intelligent et travailleur qu'on a à l'ENSAE qui partagent mon enthousiasme sur les thématiques d'apprentissage statistique. Un sujet qui me passionne à plein temps depuis maintenant deux ans et qu'on souhaite développer avec mon collègue Matthieu Lerasle concerne les problèmes liés à la qualité des bases de données et donc à la robustesse des algorithmes en apprentissage. On a (re)découvert une solution particulièrement efficace utilisant une approche de "médiane de moyennes", les MOM : Median of Means. Je passe donc beaucoup de mon "temps de recherche" à travailler sur les MOM avec mes étudiants et avec Matthieu et d'autres co-auteurs. Le reste du temps, je le passe à préparer mes cours à l'ENSAE et à faire quelques jours de conseils en entreprises.


Tu te situes à l'intersection de plusieurs domaines scientifiques, des mathématiques à l'informatique, en passant par la théorie de l'information. A l'ère du l'internet, comment expliquerais-tu simplement le rôle des mathématiques dans l'extraction de connaissances ?

Un collègue d'Orsay, Christophe Giraud, fait parfois le parallèle entre les modèles mathématiques et les contes pour enfants : ils sont plus au moins faux mais ce n'est pas leur véracité qui est intéressante mais plutôt le point de vue qu'ils proposent. Je pense aussi que c'est le niveau d'abstraction que proposent les mathématiques qui permet de donner une manière de voir une base de données à partir de laquelle on peut en extraire de l'information. On peut par exemple construire des systèmes de recommandation sur internet à partir d'une base de données d'historiques de surfs en regardant cette dernière comme une grande matrice de users/items (ici internautes/domaines) et en cherchant à la compléter pour ainsi découvrir les sites ou domaines qui pourraient plaire aux internautes, pour ensuite les leurs recommander.

   
Et comment vis-tu cette engouement actuel pour le 2-uplet "Intelligence Artificielle" ?

Très bien ! C'est une chance pour un chercheur de voir ses sujets de recherche portés au devant de la scène. De nombreuses opportunités de collaboration inter-disciplinaires s'ouvrent naturellement aux chercheurs en science des données, de nombreux postes académiques et dans le privé s'ouvrent aussi à des hauts niveaux de formations sur ces thématiques. De nombreuses compagnies se rendent compte qu'elles possèdent de grandes bases de données encore inexploitées et ouvrent des "datalab" dédiés à l'exploitation de ces bases pour améliorer leurs procédures de décisions ou pour proposer de nouvelles offres à leurs clients. Les opportunités pour les enseignants chercheurs en science des données sont donc multiples en terme de formations, de conseils et de recherche. C'est aussi passionnant de voir les outils (librairies python, calcul sur GPU, ou services de calcul à distances, etc.) et les communautés d'utilisateurs se développer autour de ces thématiques. Il y a une multitudes de blog de grandes qualités scientifiques qui sont disponibles sur le net et qui participent à la recherche en complément au processus de publication dans les revues.


Un mot de la fin pour nos lecteurs ? :-)

La science des données donne une opportunité de rapprocher le monde académique et le privé. Il me semble que cette opportunité a déjà été saisie comme le montre le développement des chaires, initiatives de recherches et fondations au sein des écoles d'ingénieurs et d'universités. Certains chercheurs dans ce domaine sont aussi de moins en moins frileux à interagir avec le monde du privé et même à faire le "grand saut", à l'image de Sébastien Loustau et de LumenAI, en passant du monde académique à la création d'entreprise. Les deux mondes se sont déjà enrichis mutuellement et le rapprochement semblent évoluer en s'accentuant.

Merci ;) !

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly