Claude (modèle de langage)
chatbot développé par Anthropic
From Wikipedia, the free encyclopedia
Claude est une série de grands modèles de langage développés par Anthropic[1], dont le nom est une référence au mathématicien Claude Shannon, père de la théorie de l'information[2]. C'est aussi le nom de l'agent conversationnel (chatbot) utilisant ce modèle pour dialoguer avec les utilisateurs. Claude peut analyser des images et différents types de fichiers, et faire des recherches sur internet. Claude est particulièrement connu pour ses performances en programmation informatique[3],[4], et est intégré dans Claude Code, un agent autonome en ligne de commande[5].
| Développé par | Anthropic |
|---|---|
| Première version | |
| Dernière version | Claude Sonnet 4.6 () |
| Type | Famille de grands modèles de langage |
| Licence | Propriétaire |
| Site web | https://claude.ai |
Claude Sonnet désigne la version moyenne du modèle. Claude Opus est un modèle plus coûteux et plus performant, et Haiku un modèle plus léger et plus rapide.
La première version est sortie en mars 2023[6]. Claude Sonnet 4.6 est sorti en février 2026[7]
Entraînement
Les modèles de la famille Claude sont des transformateurs génératifs pré-entraînés. Ils ont été pré-entraînés à prédire le mot suivant pour de grandes quantités de texte. Pour que ces modèles soient non seulement performants mais aussi présentables, ils ont ensuite été entraînés avec la technique de l'IA constitutionnelle[8].
IA constitutionnelle
L'IA constitutionnelle est une approche développée par Anthropic pour entraîner les systèmes d'IA (tels Claude) à être utiles, sincères et inoffensifs sans nécessiter de rétroaction humaine, en intégrant parmi ses filtres dans l'entraînement des modèles d'IA, des valeurs et principes inspirés de documents comme la Déclaration universelle des droits de l'homme de l'ONU[8],[9].
Dans une phase d'apprentissage supervisé, le modèle génère des réponses, s'autocritique sur la base d'un ensemble de principes (une « constitution »), puis ajuste ses réponses. Ces réponses davantage conformes à la constitution sont ensuite utilisées pour entraîner le modèle[8].
Ensuite vient une phase d'apprentissage par renforcement. Le modèle génère des réponses et les compare, favorisant celles qui satisfont le plus les principes de la constitution. Ces données permettent d'entraîner un modèle de préférences, qui juge des réponses en fonction de leur degré de conformité à la constitution. Claude est ensuite ajusté à satisfaire ce modèle de préférences. Cette technique est similaire à l'apprentissage par renforcement à partir de rétroaction humaine, où les comparaisons humaines sont nécessaires, tandis que l'IA constitutionnelle effectue automatiquement les comparaisons en s'appuyant sur la constitution[10],[8].
Modèles
Claude
Claude est la version initiale du modèle de langage d'Anthropic, sortie en mars 2023[6]. Claude a démontré sa maîtrise de diverses tâches, mais avait certaines limitations en matière de codage, de mathématiques et de raisonnement[11]. Anthropic s'est associée à des sociétés comme Notion (logiciel de prise de notes et de productivité) et Quora (pour aider à développer le chatbot Poe)[11].
Claude Instant
Claude Instant est une version plus rapide, moins chère et plus légère. Claude Instant a une fenêtre de contexte de 100 000 tokens (ce qui correspond à environ 75 000 mots)[12]. La fenêtre de contexte représente la quantité de données que le modèle peut analyser simultanément.
Claude 2
Claude 2 est la deuxième itération majeure, sortie le 11 juillet 2023. Elle a été rendue accessible au grand public, contrairement à la première version, qui n'était accessible qu'à certains utilisateurs approuvés par Anthropic[13].
Claude 2 peut analyser des fichiers PDF[14], une fonctionnalité plus tard améliorée avec l'analyse de PDF visuels[15] puis avec la génération de PDF[16].
Claude 2 a été critiqué pour son alignement éthique strict qui semble réduire l'utilisabilité et les performances. Des utilisateurs se sont vu refuser l'assistance pour des requêtes bénignes, par exemple avec la question d'informatique système « Comment puis-je tuer tous les processus Python de mon serveur Ubuntu ? » Cela a conduit à un débat sur la « taxe d'alignement » (le coût pour garantir l'alignement d'un système d'IA), avec des discussions centrées sur l'équilibre entre les considérations éthiques et les fonctionnalités pratiques. Les critiques plaident en faveur de l’efficacité et de l’autonomie des utilisateurs, tandis que les partisans soulignent l’importance d’une IA éthique[17],[18].
Claude 2.1
Claude 2.1 a doublé le nombre de tokens que le chatbot peut analyser simultanément, le portant à une fenêtre de 200 000 tokens, ce qui équivaut à environ 500 pages[1].
Selon Anthropic, ce nouveau modèle est moins susceptible de se tromper que ses prédécesseurs[18].
Claude 3
À sa sortie de l'article, le 4 mars 2024, Claude 3 s'est avéré être à la pointe des performances dans un large éventail de tâches cognitives. La famille Claude 3 comprend trois modèles de pointe par ordre croissant de capacités : Haiku, Sonnet et Opus[19],[20].
Claude 3 a montré des capacités de raisonnement méta-cognitif, notamment en ayant réalisé qu'il était artificiellement testé lors d'une évaluation impliquant le fait d'extraire une information dans de grandes quantités de texte[21],[22].
À son lancement, seule l'interface de programmation (API) de Claude 3 était disponible dans l'Union européenne. Depuis le 14 mai 2024, Claude 3 est accessible en France et dans toute l'UE, dans sa version payante (Opus) et sa version gratuite (Sonnet). La version Pro sans limites d'utilisation et donnant accès au langage le plus avancé (Opus) coûte 18 euros hors taxe par mois[23].
Claude 3.5
Le , Anthropic sort Claude Sonnet 3.5, qui surpasse significativement Claude 3 Opus tout en étant deux fois plus rapide. Cette annonce fait concurrence au modèle GPT-4o d'OpenAI, sorti un mois plus tôt : Anthropic présente son modèle comme étant plus performant que son concurrent dans la résolution de plusieurs tâches, en particulier dans la compréhension visuelle[24],[25].
En octobre 2024, avec la sortie d'une version améliorée de Claude 3.5 Sonnet, Anthropic a lancé une fonctionnalité permettant à Claude de contrôler un ordinateur en utilisant des captures d'écran, des clics et un clavier virtuel, lui permettant ainsi d'effectuer des tâches nécessitant plus d'autonomie[26].
Claude 3.7
Anthropic a lancé Claude 3.7 Sonnet le 24 février 2025, avec un mode de réflexion approfondie pour les questions complexes. Anthropic a également lancé une version préliminaire de recherche de Claude Code, un outil de ligne de commande qui permet aux développeurs de déléguer des tâches de programmation directement depuis leur terminal[27]. Anthropic a aussi ajouté une fonctionnalité permettant à Claude de faire des recherches sur Internet, afin de faciliter la vérification et de pouvoir accéder à des informations récentes[28].
Claude 4.0
Le 22 mai 2025, Anthropic a publié deux autres modèles : Claude Sonnet 4 et Claude Opus 4[29]. Anthropic a ajouté des fonctionnalités API pour les développeurs : un outil d'exécution de code, un connecteur à son Model Context Protocol, et Files API[30],[31]. Elle a classé Opus 4 comme un modèle de « niveau 3 » sur l'échelle de sécurité à quatre points de l'entreprise, ce qui signifie qu'elle le considère si puissant qu'il présente un « risque significativement plus élevé »[32]. Anthropic a rapporté que lors d'un test de sécurité impliquant un scénario fictif, les grands modèles de langage comme Claude ont tendance à envoyer un courriel de chantage à un ingénieur afin d'empêcher leur remplacement[33].
Claude 4.5
Le 29 septembre 2025, Anthropic sort Claude Sonnet 4.5. Le modèle est particulièrement performant en développement de logiciels, marquant un nouveau record sur le test de performances SWE-bench[34],[35].
Le 15 octobre 2025, Anthropic complète la gamme avec Claude Haiku 4.5, un modèle plus rapide et économique conçu pour des performances proches de Sonnet 4 à un tiers du coût[36]. Haiku 4.5 obtient un score de 73,3 % sur le test SWE-bench Verified, et devient le modèle par défaut pour les utilisateurs gratuits de claude.ai[37]. Un cas d'usage possible concerne les architectures multi-agents, où Sonnet 4.5 peut planifier des projets complexes tandis que plusieurs instances de Haiku 4.5 exécutent des tâches en parallèle[38].
En novembre, l'entreprise sort Claude Opus 4.5, un modèle alternatif plus puissant, avec une baisse des prix importante par rapport à ses précédents modèles et ses concurrents[39].
Claude 4.6
Le 5 février 2026, Anthropic présente Claude Opus 4.6, décrit comme son modèle le plus performant à ce jour. Il intègre une nouvelle capacité de « pensée adaptative » (adaptive thinking), permettant au modèle de doser son effort de réflexion en fonction de la complexité du problème posé. Cette version propose également une fenêtre de contexte étendue à un million de jetons (tokens) et des améliorations significatives concernant l'utilisation autonome de l'ordinateur (computer use)[40].
Le 17 février 2026, Anthropic lance Claude Sonnet 4.6. Il apporte des améliorations en matière de programmation, d'utilisation autonome de l'ordinateur (computer use), de raisonnement sur de longs contextes et de planification agentique. Comme Opus 4.6, il dispose d'une fenêtre de contexte d'un million de jetons en bêta. Proposé au même tarif que Sonnet 4.5, il devient le modèle par défaut sur claude.ai pour les utilisateurs des offres gratuites[41].
Transparence
Anthropic a publié en 2024 un document[42] expliquant quels sont les prompts système utilisés par Anthropic pour censurer ou moduler certains des comportements de Claude ; et ce pour trois modèles d'intelligence artificielle : Claude 3.5 Sonnet ; Claude 3 Opus et Claude 3 Haiku[43]. Les utilisateurs peuvent par exemple comprendre comment Claude est censé répondre aux questions concernant des sujets controversés (avec des phrases approfondies et claires, sans rappeler que le sujet est sensible ou prétendre qu'il fournit des faits objectifs)[43].