GPT-4
From Wikipedia, the free encyclopedia
GPT-4 (acronyme de Generative Pre-trained Transformer 4) est un modèle de langage multimodal, de type transformeur génératif pré-entraîné, développé par la société OpenAI et publié le . Il succède à GPT-3.
Limites
OpenAI annonce, sur son blog, GPT-4 comme étant « plus fiable, créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5 »[1]. L'organisation a produit deux versions de GPT-4 avec des fenêtres contextuelles de 8 192 et 32 768 jetons, une amélioration significative par rapport à GPT-3.5 et GPT-3, qui étaient limités à 4 096 et 2 048 jetons respectivement[2]. Contrairement à son prédécesseur, GPT-4 peut prendre des images ainsi que du texte comme entrées.
OpenAI adopte une approche fermée en ce qui concerne les détails techniques de GPT-4 ; le rapport technique s'est explicitement abstenu de spécifier la taille, l'architecture, le matériel ou la méthode de formation du modèle. Le rapport affirme que « le paysage concurrentiel et les implications sur la sécurité des modèles à grande échelle » sont des facteurs qui ont influencé cette décision. Le nombre précis de paramètres de GPT-4 reste inconnu, mais The Verge cite des rumeurs selon lesquelles GPT-4 augmenterait considérablement le nombre de paramètres de GPT-3 de 175 milliards à 100 000 milliards. Le PDG d'OpenAI, Sam Altman, qualifie ces rumeurs de « conneries complètes ». Un nombre plus fréquemment avancé est celui de 1000 milliards de paramètres[3],[4].
Les représentants américains Don Beyer et Ted Lieu ont confirmé au New York Times qu'Altman s'était rendu au Congrès des États-Unis en pour faire la démonstration du GPT-4 et de ses "contrôles de sécurité" améliorés par rapport aux autres modèles d'IA.
Aussi, même si cette version est améliorée par rapport à son prédécesseur, GPT-4 peut halluciner[5] et présenter des biais[6].
Applications

ChatGPT Plus
GPT-4 est accessible via une application web appelée ChatGPT Plus, version payante, plus rapide et améliorée de l'application gratuite ChatGPT.
Des modules complémentaires sont développés par des tiers pour étendre les fonctionnalités de ChatGPT Plus et connecter le robot à leurs propres services. Open AI développe également ses propres modules d'extensions (plugin) dont un « Interprète (informatique) » dit Advanced data analysis (précédemment appelé Code interpreter)[8]. Un outil permettant au robot de traiter des fichiers en exécutant lui-même du code Python, ce qui permet à l'utilisateur de réaliser des traitements de données et des cartes ou graphiques en langage naturel, comme s'il avait accès à la programmation, mais sans savoir coder (grâce au code Python qui sera généré et exécuté par ChatGPT)[9]. Ce module permet d'envoyer des fichiers afin d'étayer des prompts, et il améliore les capacités de résolution de problèmes en mathématiques, physique et chimie[10] et il permet d'utiliser ChatGPT pour finement décrire une image, transformer une image en vidéo[réf. nécessaire], créer des images, des cartes, extraire la palette de couleur d'une image, créer des documents Word ou PowerPoint[réf. nécessaire], faire de la data visualisation, des simulations, etc. et après réponse de l'IA, dans le champ conversationnel, un bouton dédié permet d'obtenir le détail de la procédure utilisée[9].
À partir du , il permet à ChatGPT d'éventuellement accéder aux fichiers téléchargés par l'utilisateur abonné, et — à la demande — de les modifier, d'en analyser des données, de créer des calculs et/ou des graphiques, etc. (avec une taille limite de 2 Mo pour les fichiers), l'IA pouvant écrire du code en Python et manipuler des fichiers jusqu’à 100 Mo. Une faille de sécurité a été découverte dans Code Interpreter (testée et confirmé en )[réf. nécessaire].
Intégration dans des produits Microsoft
Microsoft a entretenu un partenariat étroit avec OpenAI, ayant investi au total près de 13 milliards de dollars dans OpenAI[11] (et possédant ainsi 49% du capital de l'entreprise[12]) en 2024.
En , Microsoft dote son moteur de recherche Bing d'un agent conversationnel reposant sur GPT-4, faisant ainsi de la concurrence à Google qui ne disposait pas encore de ce genre de fonctionnalités[13]. Cet agent répond aux questions de l'utilisateur en effectuant des recherches web. Contrairement à l'application d'OpenAI, il cite ses sources, ce qui permet à l'utilisateur de les consulter lui-même[14]. GPT-4 a également été intégré dans le navigateur Web Microsoft Edge, lui permettant de commenter des fichiers PDF, de les résumer, d’ajouter des informations à partir du Web ou encore de les traduire[15].
GPT-4 a aussi été intégré en 2023 dans une solution appelée « Microsoft 365 Copilot », utilisée dans Microsoft Word, Excel, Outlook et Teams et PowerPoint[16],[17]. Dans Microsoft Word, cela peut permettre de rédiger, modifier ou résumer des textes, et de créer des images ou des graphiques. Les cas d'usages incluent aussi la création de compte-rendus de réunions, la synthèse de documents, ou l'aide à la rédaction d'emails[16].