Recherche approfondie (intelligence artificielle)
From Wikipedia, the free encyclopedia
| Développé par | OpenAI, Perplexity AI, autres |
|---|---|
| Première version | |
| Environnement | Web |
| Type | Agent conversationnel, Intelligence artificielle |
| Licence | Propriétaire |
| Site web | openai.com, perplexity.ai |
La recherche approfondie (en anglais : Deep Research) est un mode de fonctionnement des agents conversationnels d'intelligence artificielle qui leur permet d'effectuer des recherches en ligne poussées et de produire des réponses longues, détaillées, et étayées par des sources vérifiables[1].
Ce mode a été introduit par OpenAI sur son agent conversationnel ChatGPT début 2025 puis, des marques concurrentes ont lancé des fonctionnalités analogues : la jeune pousse Perplexity AI propose également un mode « Deep Research » produisant des rapports de recherche détaillés, et Google suit avec son modèle Gemini avancé[2].
La recherche approfondie est faite par un agent de navigation web intégré au modèle de langage. Elle accomplit en quelques minutes des tâches de recherche qui exigeraient plusieurs heures de travail humain[1]. L'agent procède de manière multi-étapes : il effectue de multiples requêtes sur le web ; consulte divers articles, documents ou données disponibles en ligne ; les analyse et les synthétise pour en tirer un rapport structuré et argumenté[2]. Chaque réponse inclut des citations précises vers les sources d'origine, permettant de vérifier les faits avancés. L'agent peut aussi exposer son raisonnement, par exemple en donnant les étapes qu'il suit, ce qui rend transparente sa recherche[1].
Ce mode s'appuie sur des modèles de langage de nouvelle génération (chez OpenAI, la version « o3 » du modèle GPT)[3], spécialement entraînés pour le raisonnement pas à pas et l'utilisation d'outils externes comme les moteurs de recherche. L'agent est capable d'affiner sa requête en demandant à l'utilisateur des précisions supplémentaires si nécessaire, afin de cibler au mieux l'information recherchée[1]. Une session de recherche approfondie dure généralement de 5 à 30 minutes, le temps que l'IA parcoure des centaines de pages et compile un texte final pouvant compter plusieurs milliers de mots. Le rapport généré peut inclure non seulement du texte, mais aussi des images, tableaux ou graphiques pour appuyer les conclusions (cette dernière fonctionnalité étant progressivement ajoutée par OpenAI après le lancement initial)[4].
En pratique, l'option « Recherche approfondie » est proposée dans l'interface utilisateur de certains chatbots d'IA (par exemple, un bouton dédié dans ChatGPT Plus). Lorsque l'utilisateur sélectionne ce mode et soumet sa question, l'agent commence par éventuellement générer un formulaire ou poser des questions pour préciser la demande[5]. L'IA engage ensuite ses recherches autonomes en arrière-plan : l'interface peut afficher une barre de progression ou un panneau récapitulant les sites visités et les étapes en cours[6]. Une fois le processus terminé, le chatbot présente sa réponse sous forme d'un rapport argumenté, généralement beaucoup plus long et détaillé qu'une réponse standard.
Domaines d'utilisation
La fonctionnalité de recherche approfondie s'avère particulièrement performante pour les questions complexes ou les analyses nécessitant de croiser de nombreuses sources. Selon OpenAI, cet agent a été pensé pour assister des travaux de recherche dans des domaines variés, par exemple la finance, les sciences (et médecine), la politique, l'ingénierie, ou même pour des besoins comme les comparatifs de produits lors d'achats exigeants[7]. L'agent excelle à trouver des informations pointues ou non intuitives qui requerraient normalement de consulter manuellement de multiples sources en ligne[5].
Par exemple, pour un rapport d'analyse concurrentielle en entreprise ou une synthèse bibliographique scientifique, le mode Deep Research peut agréger les données clés, les références externes et fournir un compte-rendu structuré prêt à l'emploi. De même, pour un consommateur averti cherchant le meilleur choix parmi des produits techniques (voiture, matériel électronique, etc.), l'agent est capable de comparer les caractéristiques issues de nombreux sites et avis, puis de formuler des recommandations argumentées[8]. Chaque fait avancé étant accompagné de sa source, cela facilite la vérification et la poursuite éventuelle des recherches par l'utilisateur.
Un autre atout de la recherche approfondie est l'accès aux informations actualisées. Contrairement aux modèles de langage classiques qui s'appuient sur un corpus figé (par exemple, la version gratuite de ChatGPT est limitée aux connaissances acquises jusqu'en 2021-2022), un agent en mode recherche approfondie peut interroger le web en temps réel. Il peut ainsi fournir les données les plus récentes, qu'il s'agisse de nouvelles publications scientifiques, de statistiques économiques à jour, ou de dernières actualités sur un sujet donné[8]. Cette capacité à actualiser ses réponses en intégrant des sources externes constitue un avantage majeur pour des usages tels que la veille d'actualité, le conseil juridique ou financier (où la réglementation évolue), ou toute question dont la réponse dépend d'informations très récentes.[réf. nécessaire]
Intégration par les services d'IA génératives
L'émergence simultanée de ces outils chez plusieurs concurrents de services en IA générative témoigne de l'intérêt croissant pour les agents « chercheurs » autonomes, capables de fournir des analyses documentées et d'améliorer la qualité des réponses des IA au-delà de la simple génération de texte à partir de leur base de connaissances interne.
OpenAI ChatGPT
Le mode de recherche approfondie a été introduit initialement par OpenAI sur son agent conversationnel ChatGPT début 2025, d'abord réservé aux utilisateurs professionnels (offre « ChatGPT Pro » à 200 $ US par mois pour 200 recherches), puis déployé en février 2025 auprès de tous les comptes payants (abonnement ChatGPT Plus à 20 $ US par mois, comptes d'équipe, éducation et entreprise) avec une limite d'environ 10 recherches approfondies par mois au début[2], puis 25. Une fois la limite dépassée, la fonction fait des recherches approfondies plus légères en utilisant un modèle plus économe.
Perplexity AI
Si la recherche approfondie a été popularisée par OpenAI via ChatGPT, d'autres entreprises ont développé des fonctionnalités similaires à la même période pour enrichir leurs agents conversationnels. En février 2025, la start-up américaine Perplexity AI a dévoilé son propre agent Deep Research, intégré à sa plateforme de « moteur de réponse »[9]. Le Deep Research de Perplexity fonctionne sur le même principe : il exécute de multiples recherches web puis synthétise les résultats dans un rapport circonstancié, couvrant des domaines variés (finance, marketing, technologies, etc.)[9]. Perplexity a choisi de proposer cet outil gratuitement à l'ensemble de ses utilisateurs, avec toutefois une limite de quelques requêtes Deep Research par jour pour les comptes gratuits, tandis que ses abonnés payants disposent d'un quota beaucoup plus élevé (plusieurs centaines de recherches quotidiennes possibles)[10].
Google Gemini
De son côté, Google a intégré une fonctionnalité comparable dans son écosystème d'IA : fin 2024, la société a annoncé un agent de recherche approfondie lié à son modèle de nouvelle génération Google Gemini[11]. Ce dernier, disponible pour les utilisateurs de la formule Gemini Advanced de Google, vise également à générer des rapports exhaustifs à partir de recherches web, bien que les premières évaluations aient suggéré une performance moindre que celle de l'outil d'OpenAI dans certains tests de référence[10].
DeepSeek
En Chine, des acteurs tels que la société DeepSeek ont également lancé des agents conversationnels à recherche approfondie intégrée[12],[13].
Tendances
Le concept de Deep Research, récent, tend à passer par des agents autonomes (research agents plus ou moins personnalisables), pouvant combiner les capacités de raisonnement des LLM et la fouille de données sur des outils externes tels que les moteurs de recherche et les bases de données spécialisées (ouvertes ou accessibles à l'IA) pour des réponses multi-sources et vérifiables, en passant par 3 stades 4 étapes-clés : planification des requêtes, acquisition d'information, gestion de la mémoire et génération de réponses), des techniques d'optimisation et des critères d'évaluation pour guider les développements futurs. Les concepteurs cherchent à améliorer ou trouver de nouvelles méthodes d’évaluation et de choix des informations et de vérifiabilité des résultats. Prospectivement, la discipline évolue vers des systèmes hybrides combinant le raisonnement avancé, une mémoire de longue durée, optimisés par apprentissage renforcé, fine-tuning supervisé, agentic reinforcement learning et le prompt engineering. La recherche profonde semble aussi vouloir prendre une dimension multi-modale (analyse d'écrits, d'images, de sons, de vidéos et de données scientifiques complexes), et pourrait voir émerger des cadres éthiques et réglementaires spécifiques pour encadrer l'usage des agents de recherche afin de protéger les vies privées, diminuer les biais et garantir la responsabilité[14].