L’intelligence artificielle ne se contente plus de répondre à des questions : elle commence à agir. Le mode agent de ChatGPT, qui intègre l’ancien produit Operator d’OpenAI, illustre parfaitement cette évolution. Plutôt que de générer simplement du texte, cet agent ouvre un navigateur, parcourt des sites web, clique sur des boutons, remplit des formulaires et manipule des fichiers pour accomplir des objectifs concrets que vous lui confiez. Lancé d’abord comme expérimentation autonome sous le nom d’Operator, il a depuis été unifié avec les capacités de recherche approfondie et la conversation classique de ChatGPT, formant un système agentique cohérent. Concrètement, l’utilisateur formule une demande en langage naturel, et l’agent décompose la tâche en étapes, raisonne sur le chemin à suivre puis exécute les actions nécessaires en ligne. Cette approche ouvre la voie à l’automatisation de nombreuses tâches numériques répétitives, depuis la collecte d’informations jusqu’au remplissage de documents. Dans cet aperçu, nous détaillons ce qu’est réellement le mode agent, ses fonctionnalités principales, ses cas d’usage typiques, ses avantages, son modèle tarifaire et notre regard d’ensemble sur cet outil signé OpenAI.
Qu’est-ce que ChatGPT agent (Operator) ?
Le mode agent de ChatGPT est une fonctionnalité intégrée à l’application ChatGPT qui permet à l’IA d’accomplir des tâches en ligne de bout en bout. Là où le ChatGPT classique se limite à converser, l’agent dispose d’un navigateur virtuel qu’il contrôle lui-même pour interagir avec des sites web réels. Il peut ainsi naviguer entre les pages, remplir des champs, soumettre des formulaires, lire des documents et éditer des feuilles de calcul. L’agent réunit trois capacités complémentaires : le contrôle d’un navigateur, la recherche et la synthèse d’informations, et la conversation fluide. Cette combinaison lui permet de traiter des demandes complexes qui nécessitent plusieurs actions successives. Il s’appuie également sur des connecteurs pour accéder, avec votre autorisation, à vos e-mails et fichiers stockés dans des services tiers. Le mode agent fonctionne sous supervision : vous gardez la possibilité de suivre ce qu’il fait et d’intervenir.
Fonctionnalités principales
Le mode agent regroupe plusieurs fonctionnalités marquantes. La première est la navigation web autonome : l’agent pilote un navigateur pour visiter des sites, cliquer, faire défiler et interagir comme le ferait un humain. Il sait aussi remplir des formulaires en ligne et soumettre des informations sur des pages web. La gestion de fichiers est également centrale : l’agent travaille à partir de documents que vous importez et peut éditer des feuilles de calcul. Les connecteurs étendent ses capacités à vos services habituels, avec une prise en charge de Gmail, Google Drive, GitHub, Outlook, SharePoint, Dropbox, Box, Google Agenda, Linear, HubSpot et Teams, selon les permissions accordées et l’offre souscrite. Une autre fonctionnalité appréciée est la planification des tâches : une fois une opération terminée, vous pouvez la programmer pour qu’elle se répète chaque jour, chaque semaine ou chaque mois, et gérer l’ensemble de vos tâches récurrentes depuis une page dédiée. Enfin, l’agent combine recherche approfondie et raisonnement multi-étapes, ce qui lui permet de mener des recherches en ligne puis d’en synthétiser les résultats. Pour les espaces Enterprise, les administrateurs disposent d’un réglage pour activer ou désactiver le mode et l’attribuer à des rôles précis.
Cas d’usage
Les usages du mode agent sont nombreux dès lors que la tâche comporte des étapes claires et reproductibles sur le web. On peut lui demander de collecter des informations sur plusieurs sites, de comparer des offres, ou de réaliser de la veille concurrentielle. Il excelle dans le remplissage de formulaires, la planification de rendez-vous, l’envoi d’e-mails à partir de modèles et le résumé de pages web. Côté bureautique, il sait remplir et mettre à jour des feuilles de calcul à partir de données collectées en ligne. Les équipes connectant Gmail et Google Drive peuvent lui faire traiter des e-mails ou exploiter des documents internes. Grâce aux tâches programmées, il devient possible d’automatiser des rapports réguliers, comme une synthèse hebdomadaire d’actualités sectorielles. En pratique, une tâche se déroule généralement en cinq à trente minutes selon sa complexité, ce qui en fait un assistant adapté aux opérations de fond plutôt qu’aux besoins instantanés.
Avantages
Le principal bénéfice du mode agent est le gain de temps sur les tâches numériques répétitives. En déléguant la navigation, la collecte de données et le remplissage de formulaires, l’utilisateur se libère d’opérations fastidieuses pour se concentrer sur des activités à plus forte valeur. L’intégration au sein de ChatGPT constitue un atout : pas besoin d’un nouvel outil, l’agent s’inscrit dans une interface déjà familière et dialogue avec vous en langage naturel. Les connecteurs permettent de centraliser le travail autour de vos services existants, tandis que la planification automatise les tâches récurrentes sans intervention manuelle. Enfin, la combinaison de la recherche, de la navigation et de la conversation offre une polyvalence rare : un même agent peut chercher, agir et restituer un résultat exploitable. Pour les professionnels déjà abonnés à ChatGPT, ces capacités s’ajoutent sans nécessiter d’apprentissage technique lourd.
Tarifs
Le mode agent est inclus dans plusieurs offres ChatGPT plutôt que facturé séparément. Le plan Plus, à 20 $ par mois, y donne accès mais avec des quotas d’usage relativement stricts, peu adaptés à un emploi intensif ou en production. Le plan Pro, à 200 $ par mois, offre des limites bien plus élevées et convient aux usages soutenus. Les plans Business, Enterprise et Edu donnent également accès au mode agent, et ce sont eux qui débloquent les connecteurs métier les plus complets, comme Gmail, Drive ou SharePoint. À noter que pour les espaces Enterprise, le mode est désactivé par défaut et doit être activé par un administrateur. Le choix de l’offre dépend donc surtout du volume de tâches envisagé et des intégrations nécessaires.
Conclusion
Le mode agent de ChatGPT représente une avancée tangible vers une IA qui agit concrètement sur le web. En unifiant navigation, recherche et conversation, OpenAI propose un assistant capable de prendre en charge des tâches en ligne complètes, depuis la collecte d’informations jusqu’au remplissage de formulaires et l’édition de tableurs. Ses connecteurs et ses tâches programmées renforcent son utilité pour automatiser des routines numériques. Le principal frein reste le coût : un usage confortable passe par le plan Pro à 200 $ par mois, le plan Plus offrant un accès plus limité. Pour les professionnels et équipes déjà investis dans l’écosystème ChatGPT, l’agent constitue un complément puissant et bien intégré qui mérite d’être testé sur des tâches répétitives et bien définies.


