Progrès fulgurants de l’IA : vers de nouveaux standards d’Ă©valuation ?

La rĂ©volution technologique poursuit sa course effrĂ©nĂ©e, et l’intelligence artificielle (IA) se pose en vĂ©ritable compĂ©titrice de l’intelligence humaine. Ces deux dernières annĂ©es ont Ă©tĂ© le théâtre d’une accĂ©lĂ©ration sans prĂ©cĂ©dent du dĂ©veloppement de l’IA qui, dĂ©sormais, dĂ©passe les humains dans presque tous les domaines de performance. Devant ces avancĂ©es sidĂ©rantes, il devient de plus en plus clair que les standards actuels d’Ă©valuation de l’IA pourraient bientĂ´t appartenir au passĂ©.

L’essor ininterrompu de l’IA

L’UniversitĂ© de Stanford, au sein de son Institut pour une Intelligence Artificielle CentrĂ©e sur l’Humain (HAI), a rĂ©cemment publiĂ© un rapport annuel riche en dĂ©couvertes sur l’Ă©volution de l’IA. Celui-ci rĂ©vèle un contenu plus dense que les prĂ©cĂ©dentes Ă©ditions, reflĂ©tant l’influence croissante de l’IA dans notre vie quotidienne. Le rapport Ă©value les secteurs les plus impactĂ©s par l’IA et les pays les plus inquiets de voir des emplois dĂ©localisĂ©s en raison de son avancement. Mais ce qui retient avant tout l’attention, c’est la performance de l’IA face aux humains.

Depuis 2015, l’IA a dĂ©passĂ© l’homme dans la classification d’images, puis dans la comprĂ©hension de lecture basique en 2017, le raisonnement visuel en 2020, et enfin l’infĂ©rence de langage naturel en 2021. La vitesse Ă  laquelle l’IA s’amĂ©liore rend dĂ©suets la plupart des tests utilisĂ©s jusqu’Ă  prĂ©sent. Les chercheurs s’activent dĂ©sormais pour crĂ©er de nouvelles Ă©valuations plus exigeantes, afin de mettre en lumière les diffĂ©rences qui persistent entre l’intelligence humaine et artificielle et de dĂ©celer les domaines oĂą nous conservons un avantage.

AvancĂ©es et dĂ©fis dans l’apprentissage de l’IA

MalgrĂ© ses progrès, l’IA rencontre toujours certaines difficultĂ©s avec des tâches cognitives complexes telles que la rĂ©solution de problèmes de mathĂ©matiques avancĂ©s et le raisonnement de bon sens visuel. Cependant, le terme « difficultĂ©s » pourrait prĂŞter Ă  confusion ; l’IA ne se dĂ©brouille pas si mal que ça.

ConsidĂ©rez les rĂ©sultats sur la base de donnĂ©es MATH, qui regroupe 12 500 problèmes de mathĂ©matiques de niveau compĂ©tition. En deux ans, les systèmes d’IA ont vu leur performance significativement amĂ©liorĂ©e, passant de 6,9 % de problèmes rĂ©solus en 2021 Ă  84,3 % grâce Ă  un modèle basĂ© sur GPT-4 en 2023. Le taux de rĂ©ussite humain est de 90 %.

  OpenAI vise une levĂ©e de fonds Ă  hauteur de 100 milliards de dollars minimum

Le raisonnement de bon sens visuel (VCR) dĂ©passe Ă©galement les attentes. En effet, entre 2022 et 2023, la performance des IAs sur le VCR a augmentĂ© de 7,93 %, atteignant 81,60, Ă  rapprocher des 85 % de rĂ©ussite humaine. Une prouesse lorsque l’on se rappelle que l’idĂ©e mĂŞme d’attendre d’un ordinateur qu’il « comprenne » le contexte d’une image semblait impensable il y a encore cinq ans.

Des limites Ă  surmonter

Cependant, les IAs sont toujours sujettes Ă  des « hallucinations », un terme employĂ© par des sociĂ©tĂ©s comme OpenAI pour dĂ©signer la fourniture d’informations fausses ou trompeuses. Un exemple frappant s’est prĂ©sentĂ© l’annĂ©e dernière lorsqu’un avocat new-yorkais a utilisĂ© ChatGPT pour une recherche juridique sans vĂ©rifier les rĂ©sultats, ce qui a conduit Ă  une amende de 5 000 USD.

Le benchmark HaluEval montre que, pour de nombreux modèles de langage de grande envergure, les hallucinations demeurent un problème significatif. Quant à la vérité, le rapport indique que GPT-4 obtient les meilleurs résultats dans la production de réponses fiables, avec une amélioration notable par rapport aux modèles précédents.

En matière de gĂ©nĂ©ration d’images par l’IA, l’Ă©valuation HEIM a permis de juger les capacitĂ©s de crĂ©ation d’images Ă  partir de texte. Les images gĂ©nĂ©rĂ©es ont Ă©tĂ© Ă©valuĂ©es par des humains sur plusieurs critères, et bien qu’aucun modèle n’excellait sur tous les fronts, certains se sont distinguĂ©s, notamment DALL-E 2 d’OpenAI pour l’alignement texte-image, ou le modèle Dreamlike Photoreal basĂ© sur Stable Diffusion pour la qualitĂ© et l’esthĂ©tique.

Un avenir oĂą l’IA sera omniprĂ©sente

L’annĂ©e 2023 a Ă©tĂ© marquĂ©e par une accĂ©lĂ©ration de l’IA, et 2024 ne fait qu’accentuer cette tendance avec l’apparition de produits rĂ©volutionnaires tels que Suno, Sora, Google Genie, Claude 3, Channel 1 et Devin. Ces innovations pourraient bouleverser de nombreux secteurs et prĂ©figurent peut-ĂŞtre l’arrivĂ©e d’un modèle GPT-5, potentiellement encore plus disruptif.

Le dĂ©veloppement technique rapide de l’IA tĂ©moigne d’une Ă©volution qui ne montre aucun signe de ralentissement. Il est essentiel de comprendre que nous ne sommes qu’au dĂ©but d’une ère oĂą l’IA transformera en profondeur notre rapport Ă  la technologie.

  Hackathon du MIT 2023 : pour une IA au profit de l'Ă©nergie et du climat

L’IA progresse Ă  une vitesse vertigineuse et redĂ©finit les limites de ce que nous pensions possible. Ă€ mesure qu’elle avance, elle nous contraint Ă  repenser nos mĂ©thodes d’Ă©valuation et Ă  envisager de nouveaux standards pour mesurer ses capacitĂ©s. Le paysage de l’intelligence artificielle est en pleine mutation, et vous, chers lecteurs, faites partie de ceux qui assistent en direct Ă  cette rĂ©volution. Restons attentifs, car si l’IA a dĂ©jĂ  bouleversĂ© nos perceptions, elle est loin d’avoir rĂ©vĂ©lĂ© tout son potentiel.

FAQ

Quels sont les rĂ©cents progrès de l’intelligence artificielle (IA) comparativement aux performances humaines ?

L’intelligence artificielle a rĂ©alisĂ© d’importants progrès ces dernières annĂ©es, surpassant les humains dans plusieurs domaines. En 2015, l’IA a dĂ©passĂ© les humains en classification d’images, puis en comprĂ©hension de lecture de base en 2017, en raisonnement visuel en 2020, et en infĂ©rence du langage naturel en 2021. Les progrès continuent Ă  un rythme tel que de nombreux tests de rĂ©fĂ©rence deviennent obsolètes et nĂ©cessitent le dĂ©veloppement de nouveaux benchmarks pour Ă©valuer les capacitĂ©s de l’IA.

L’IA est-elle capable de rĂ©soudre des problèmes de mathĂ©matiques complexes ?

Oui, les performances de l’IA dans la rĂ©solution de problèmes de mathĂ©matiques avancĂ©s se sont considĂ©rablement amĂ©liorĂ©es. Un modèle basĂ© sur GPT-4 a rĂ©solu 84,3% d’un ensemble de 12 500 problèmes de niveau compĂ©titif en 2023, une nette progression par rapport au taux de rĂ©solution de 6,9% en 2021. Ces rĂ©sultats sont Ă  comparer Ă  un taux de rĂ©ussite de 90% pour les humains spĂ©cialisĂ©s dans ce domaine.

Comment l’IA se dĂ©brouille-t-elle avec le raisonnement visuel de bon sens (VCR) ?

L’intelligence artificielle a montrĂ© des amĂ©liorations en matière de VCR, en augmentant sa performance de 7,93% entre 2022 et 2023 pour atteindre une performance de 81,60, avec un rĂ©fĂ©rentiel humain fixĂ© Ă  85. Cette compĂ©tence permet Ă  l’IA de prĂ©dire des actions ou des caractĂ©ristiques en utilisant des connaissances de bon sens dans un contexte visuel.

  DĂ©bat pĂ©rilleux dans la Silicon Valley : les diffĂ©rences entre les techno-optimistes et les apocalypses de l’IA

Les modèles de langage gĂ©nĂ©ratif de l’IA sont-ils fiables ?

MalgrĂ© les avancĂ©es, les modèles de langage gĂ©nĂ©ratif de l’IA, comme GPT-4, peuvent encore produire des ‘hallucinations’, c’est-Ă -dire prĂ©senter des informations fausses ou trompeuses comme des faits. MĂŞme si les performances s’amĂ©liorent, la question de la vĂ©racitĂ© reste un dĂ©fi important pour ces modèles.

Quels sont les impacts de l’Ă©volution rapide de l’IA sur les industries et les perceptions du public ?

L’Ă©volution rapide de l’IA a le potentiel de transformer radicalement de nombreuses industries. Les dĂ©veloppements rĂ©alisĂ©s en 2023 et 2024 indiquent que l’IA continuera Ă  Ă©voluer et Ă  combler l’Ă©cart entre les humains et la technologie. Cependant, cela soulève Ă©galement des prĂ©occupations concernant la sĂ©curitĂ©, la confiance et l’Ă©thique de l’IA, affectant la perception du public vis-Ă -vis de son dĂ©veloppement.

Retour en haut