L’IA est un mauvais élève… Deep Learning et apprentissage supervisé : ce que vous devez savoir
Regardez la vidéo…
Lorsque nous parlons d’intelligence artificielle, ou IA, nous référons généralement à l’apprentissage en profond ou deep learning. Résumer du texte, générer des phrases, supprimer l'arrière-plan des images, recommander le prochain film que vous devriez regarder ou même détecter des cancers plus tôt, l'apprentissage profond alimente une grande partie de la technologie de pointe dans le monde à l'heure actuelle, y compris ChatGPT et MidJourney. Bien qu’utile et de plus en plus puissante, est-ce là de l’intelligence ? Imaginons un groupe de chercheurs et un très gros éléphant dans la même pièce. Des sourires nerveux et des yeux vifs suivent chaque fois que quelqu'un montre l'éléphant et pose une question sur l'IA et l'intelligence. On dirait que notre instinct sait ce qu’est l’intelligence, mais qu’on a du mal à le mettre en mots. Nous semblons toujours changer d’avis sur l’intelligence. Ainsi, plutôt que de nous concentrer sur la question de savoir si une IA, ou plutôt l’apprentissage profond est intelligent ou non, soyons de vrais chercheurs et concentrons-nous sur ce qu’il peut faire et comment. Quoi qu’il en soit, ça n’importe peu si c’est vraiment intelligent si ça peut conduire parfaitement pour vous ou digérer de longs e-mails et répondre à votre place !
Une analogie avec l'apprentissage profond (deep learning)...
Vous pouvez considérer l’IA, ou apprentissage profond, comme un mauvais élève.
Il se présentera à un examen sans comprendre la matière abordée. Au lieu d’étudier à l’avance et d’apprendre les éléments du livre, il essaiera de se frayer un chemin jusqu’à la note de passage.
Tel un mauvais élève cherchant désespérément une réussite, il tentera de copier ses pairs sans réellement comprendre les questions. La seule différence est qu’il est un peu plus intelligent que la plupart des mauvais élèves d’une manière remarquable : il ne se fera pas attraper facilement et aura l’air d’avoir été étudié.
Au lieu de copier un ou deux étudiants à côté et de se faire attraper par le professeur, il prendra les réponses de tous les étudiants de la classe et copiera la réponse la plus récurrente pour chaque question. Il se contentera donc toujours de copier et coller les réponses, mais de manière un peu plus intelligente, en utilisant des statistiques. Il comprendra quelle est la réponse la plus probable à donner à toute question en utilisant la copie de chacun. Ce processus sera répété pour toutes les questions d'examen. Ainsi, vous aurez peut-être la meilleure note de la classe, mais vous ne comprendrez toujours pas le sujet abordé et vous ne serez pas surpris en train de tricher puisque toutes vos réponses ont du sens car elles sont basées sur les réponses des autres et pas seulement une autre personne. Si vous étendez ce processus à l'ensemble d'Internet et à tous les sujets que ça contient, vous obtenez GPT. Ensuite, si vous copiez encore plus de conversations réelles avec des humains et que vous vous entraînez avec eux, vous obtenez ChatGPT.
C’est ainsi que fonctionne l’IA. Il s’agit essentiellement d’une machine à « faire semblant jusqu’à ça réussisse » ou en d’autres mots “fake it until you make it”. Cela a l’air impressionnant, mais la machine ne comprend pas ce que vous voulez qu’elle réalise. On dirait que c'est le cas. En lui fournissant de nombreux exemples comme une question et les réponses des élèves, elle apprendra la solution optimale à choisir pour des questions similaires. Et ça c’est si les étudiants sont assez bons, et c’est aussi pourquoi vos données sont si importantes ! Si vous lui donnez suffisamment d’exemples d’experts, ou dans ce cas, d’étudiants formidables qui ont vraiment étudié, l’IA sera puissante, comme ChatGPT, par rapport aux modèles précédents dont vous n’avez probablement même pas entendu parler !
À ce stade, vous vous demandez peut-être comment le deep learning peut-il faire semblant ? Les détails font l'objet d'un autre article, mais il peut être utile de comprendre ce qu'est une fonction de perte. La fonction de perte ou fonction de coût, est le moteur de l’apprentissage profond. Imaginez un enseignant vous disant combien de points il vous manque pour obtenir une note complète, disons 60%. Il est impossible de connaître un score exact pour chaque question, mais une bonne fonction de perte vous donnera une idée de vos performances générales. Le problème ici est que l’enseignant qui note votre examen ne vous dit pas précisément quelles questions vous avez échoué. Il ne vous donne même pas de commentaires, à part un score approximatif de votre échec. C’est donc à vous de comprendre ce que vous avez fait de mal et comment vous pouvez vous améliorer à coup d’essais et erreurs. C'est pourquoi il faut beaucoup de données et d'essais pour former un modèle d'apprentissage profond puissant.
IA – Faible et puissante à la fois
C’est pourquoi les IA sont à la fois puissantes et faibles.
Elles sont puissantes carelles obtiendront d’excellents résultats si vous disposez des données nécessaires pour leur apprendre ce que vous voulez.
Elles sont faibles parce qu’elles ne seront pas du tout intelligentes en dehors des données qu’elles ont vues. Ça n’apprendra pas le sujet abordé lors de l’examen, mais ce que les étudiants sont susceptibles de répondre. Votre IA ne comprendra donc ni les mathématiques ni l’histoire. Elle ne comprendra pas ce qu’est une tumeur ni ce que votre patron attend de vous. Elle comprendra simplement très bien les statistiques de l'examen en cours et reproduira ce que la plupart des médecins feraient ou ce que la plupart des patrons attendent de quelqu'un comme vous. Une telle IA entraînée pour un examen de cours d’histoire ne sera pas capable de résumer le cours, d’aider quelqu’un ou de faire autre chose que répondre à cet examen particulier ou à des examens très similaires.
C’est ainsi que les IAs peuvent générer du texte, éditer des images, comprendre les tendances, détecter le cancer plus tôt ou recommander le prochain film que vous devriez regarder. Ce sont toutes des IA différentes, mais très similaires, entraînées uniquement pour accomplir une telle tâche à l’aide d’exemples. Une étape importante que la plupart des IA effectuent au cours de leur entraînement est appelée l’apprentissage supervisé, où les IA apprennent quoi trouver ou faire à l’aide d’exemples produits par des experts. Nous appelons cela supervisé car elles suivent les experts et la manière dont ils prennent une décision mais n'ont pas (et n'auront jamais) leurs connaissances de cette façon. Dans ce cas, les IAs sont sous la supervision d’experts et ne peuvent faire qu’aussi bien qu’eux.
Une IA n’est pas entraînée pour comprendre ce qu’est un cerveau ou ce qu’est une tumeur. Elle est entraînée pour répondre à ce que répondraient la majorité des neurologues en voyant la même image de cerveau. Ici, je tiens à souligner la partie où je dis que l'image doit être « la même ». En effet, on pourrait imaginer que l’imagerie médicale de différents hôpitaux puisse utiliser la même IA, mais ce n’est peut-être pas le cas. Par exemple, la plupart des hôpitaux disposent de leurs propres paramètres pour les appareils IRM qui prennent des photos de votre cerveau ou de votre moelle épinière. Cela fait que l'IA ne reconnaît même pas l'image et ce qui est affiché en raison de variations de contraste qui ne nous dérangeraient pas. Notre pauvre élève est complètement désemparé : c’est comme si les questions de l’examen avaient été reformulées et réorganisées, et maintenant l’IA ne peut plus compter sur ce qu’elle a appris. En revanche, un neurologue expert aura peut-être besoin d’un peu plus de temps pour examiner la nouvelle image, mais il pourra quand même facilement voir ce qui ne va pas lors d’une IRM réalisée dans un autre hôpital.
Et si ce sujet vous intéresse, vous adorerez mes prochaines vidéos sur l’IA et le domaine biomédical, car c’est le sujet de mon doctorat et je partagerai une petite série de vidéos sur ce que je fais avec l’IA et les IRM !
Conclusion
C’est l’état actuel de l’intelligence artificielle, et plus précisément du deep learning. Contrairement aux humains, l’apprentissage profond, à bien des égards, apprend des réponses, tandis que les humains ont tendance à chercher à en apprendre davantage sur le sujet en question. C’est la raison pour laquelle l’apprentissage profond est puissant pour des cas d’utilisation restreints lorsque vous disposez de données disponibles. En d’autres termes, cette différence est due au fait que l’IA apprend à réussir une telle tâche plutôt que d’acquérir des connaissances requises pour la tâche.
J’ai peut-être un peu sous-estimé ce mauvais élève… Et je tiens à m’excuser publiquement, surtout avec ce qu’on a vu avec ChatGPT récemment. C’est peut-être paresseux, mais ça connaît très bien les statistiques, c'est pourquoi l’IA peut être utilisé pour de nombreux types d'applications différentes. Et parcourir les réponses de tout le monde dans votre salle d’examen en moins d’une seconde ne peut pas non plus être facile. Il existe de nombreuses prouesses techniques et des tonnes de techniques d’apprentissage incroyablement innovantes que les chercheurs ont développées et continuent de développer pour les améliorer. Mais qu’arrive-t-il si vous essayiez réellement de comprendre le contenu ? C’est ce que l’IA symbolique tente de faire, mais c’est le sujet d’un autre article!
Je pense que l’apprentissage profond n’est pas synonyme d’intelligence, et peu importe que ce soit le cas ou non, c’est quand même super intéressant de discuter du type d’intelligence dont ça dispose et de sa compréhension de notre monde. J’aimerais également savoir ce que vous pensez dans les commentaires ci-dessous. Actuellement, l’IA ne nous ressemble pas vraiment. Dans un autre article, nous approfondirons les différences entre l’IA et les humains, pour lesquelles vous devriez vous abonner et rester à l’écoute. Même si c’est différent, cela n’empêche pas que les modèles d’intelligence artificielle soient très puissants et utiles, ni que ce soit l’état final de l’IA. Un mauvais élève a d’autres qualités que nous pouvons exploiter ! Des qualités que j'ai déjà explorées dans des centaines de vidéos sur ma chaîne en anglais !
N'oubliez pas que ce que j'ai décrit ici n'est qu'une analogie pour expliquer le fonctionnement du Deep Learning, et principalement l'une des techniques d'apprentissage appelées apprentissage supervisé, la forme d'intelligence artificielle la plus courante dans les applications actuelles. Les chercheurs améliorent continuellement son fonctionnement, incluant l’apprentissage par renforcement utilisée par ChatGPT que j’ai également couvert sur la chaîne. Ce que nous appelons « IA » ne sera peut-être plus la même chose dans quelques années, mais seul l'avenir nous le dira. J’aurais une question finale pour vous… qu’espérez-vous ou de quoi avez-vous peur en lien avec l’IA ou l'apprentissage profond ? Je sélectionnerai peut-être votre réponse pour un prochain article !