Cinq agents en parallèle : ta nouvelle équipe IA

Mercredi soir. Tu prépares la stratégie commerciale du trimestre. Sur la table : remplacer ton centre d'appel sortant par des agents vocaux IA. Tu ne connais pas le marché. Tu ouvres six onglets. Tu as déjà perdu le fil entre ElevenLabs et Cartesia.

Tu fermes tout. Tu écris une commande de quatre lignes à Claude.

Huit minutes plus tard, tu reçois une note de synthèse complète : qui sont les huit acteurs principaux, à quel prix, avec quelle qualité, ce qu'en disent les vrais utilisateurs sur Reddit, et lequel tu devrais regarder en priorité. Tu n'as rien lu toi-même. Cinq agents IA ont travaillé en parallèle pendant que tu allais chercher un café.

C'est ce qu'Anthropic vient d'intégrer nativement dans Claude. Avant, il fallait écrire un script pour orchestrer ce genre d'enchaînement. Aujourd'hui, tu décris ce que tu cherches, l'IA répartit le travail entre cinq assistants, et te ramène la synthèse. Le métier appelle ça un swarm (un essaim) d'agents.

Ce que tu obtiens à la fin de cet article

Une compréhension claire du swarm d'agents sans avoir besoin de coder, des exemples adaptés à ton métier (marketing, commercial, communication, founder), un template prêt à copier pour ton premier essai, et les trois pièges à éviter pour qu'un swarm reste utile et ne se transforme pas en bouillie.

Avant de commencer : cinq mots à fixer

L'IA appliquée parle un mélange de français et d'anglais. Cinq mots reviennent dans cet article. Voilà ce qu'ils veulent dire concrètement.

Le lexique en cinq lignes

Agent. Une instance d'IA (comme une session de ChatGPT ou de Claude) qui exécute une tâche pour toi.

Sub-agent (ou agent secondaire). Un agent que l'agent principal lance pour déléguer une tâche précise. Comme un stagiaire à qui tu donnes un brief et qui revient avec un livrable.

Orchestrateur. L'agent principal qui décompose ta question, lance les sub-agents, récupère leurs réponses, et te livre la synthèse. C'est ton éditeur en chef.

Swarm. "Essaim" en anglais. Plusieurs sub-agents qui travaillent en même temps, chacun sur son angle. C'est le mot qui désigne cette équipe d'IA temporaires.

Fan-out. Littéralement "éclatement". Le moment où l'orchestrateur découpe le travail et lance les sub-agents en parallèle. C'est le geste central de la mécanique.

Garde ces cinq mots sous la main. La suite de l'article s'appuie dessus.

Ce qui a changé en mai 2026

Deux annonces récentes rendent le swarm accessible à tout le monde, pas seulement aux développeurs qui savent écrire un script d'orchestration.

Le 6 mai à San Francisco. Anthropic a sorti Multiagent Orchestration à sa conférence annuelle Code with Claude 2026. La fonctionnalité s'appelle managed agents : un chef d'orchestre intégré qui sait découper une tâche complexe en sous-tâches, les distribuer à plusieurs sub-agents qui travaillent en même temps, puis recoller le résultat. Harvey, le cabinet d'avocats américain qui l'a testé, rapporte avoir multiplié par six la vitesse de complétion sur certains de leurs workflows internes.

Le 28 mai, aujourd'hui. Claude Code, l'outil terminal que beaucoup utilisent pour des tâches longues, a poussé Dynamic Workflows en preview. C'est la même mécanique, mais directement dans l'outil. Jusqu'à dix sub-agents qui tournent en parallèle dans une seule session.

L'effet pratique pour toi : tu n'as plus besoin de savoir coder pour déclencher un swarm. Tu le déclenches en conversation, en quelques phrases. C'est ce qui rend la mécanique utilisable au quotidien par un marketeur, un commercial ou un founder, plus seulement par les ingénieurs.

L'analogie qui rend tout limpide

Oublie l'IA pendant trente secondes.

Imagine que tu engages cinq stagiaires en même temps. Chacun a un brief précis. L'un regarde les prix du marché que tu prépares. L'autre, les avis utilisateurs sur Reddit et les forums. Un troisième, les annonces de levées et les news produit. Un quatrième, les capacités techniques différenciantes. Le cinquième, les signaux d'usage en entreprise (postes ouverts, intégrations détectées, mentions LinkedIn).

Chacun travaille dans son coin, sans se gêner, sans se croiser.

Pendant qu'ils travaillent, toi tu fais autre chose. Tu prends ton café. Tu réponds à un mail urgent. Tu prépares ton meeting de 11h.

Quand les cinq reviennent avec leurs notes, un éditeur en chef récupère les cinq blocs, confronte les sources, repère les contradictions, et te livre une synthèse en trois paragraphes : ce qui ressort, ce qui est différenciant, qui regarder en priorité.

C'est exactement ça, un swarm d'agents. À deux différences près : les stagiaires sont des IA, ça coûte trente centimes au lieu de trois mille euros, et ça prend huit minutes au lieu de trois jours.

C'est quoi un swarm, concrètement (les trois étapes)

La mécanique se déroule toujours dans le même ordre. Trois étapes, trois mots.

Schéma : à gauche, un orchestrateur central. Au milieu, cinq sub-agents en parallèle (Acteurs, Technique, Momentum, Users, Signaux). À droite, une boîte de synthèse qui consolide. Trois étapes nommées : fan-out, reduce, synthesize. — Les trois étapes : fan-out, reduce, synthesize

1. Fan-out (l'éclatement). L'orchestrateur prend ta question large ("cartographie le marché du voice AI en 2026") et la découpe en cinq briefs indépendants. Il lance les cinq sub-agents en même temps. Chacun reçoit son périmètre et ses outils. Tu n'as plus à briefer manuellement les cinq, tu décris le résultat que tu veux et l'orchestrateur s'occupe de la répartition.

2. Reduce (la remontée). Chaque sub-agent travaille dans son propre contexte, sans voir ce que font les autres. Il lit ses sources, fait son analyse, te ramène une sortie au format que tu as demandé (un tableau, une liste, un paragraphe). C'est le moment où tu attends. Mais comme les cinq tournent en parallèle, l'attente est celle du plus lent, pas la somme des cinq.

3. Synthesize (la synthèse). L'orchestrateur récupère les cinq sorties, confronte les informations, repère les contradictions entre sources, et produit la synthèse finale. C'est lui qui décide quoi mettre en avant et quoi laisser de côté. C'est aussi lui qui te donne un avis structuré ("voilà ce que je regarderais en priorité si j'étais à ta place") si tu lui demandes.

Trois mots anglais, un schéma simple. Les ingénieurs orchestrent des tâches en parallèle sur leurs serveurs depuis vingt ans. Ce qui est nouveau en 2026, c'est que la même mécanique devient accessible pour du travail intellectuel, dans une conversation, sans avoir à coder.

L'exemple complet : cartographier un marché en huit minutes

Reprenons l'exemple du début. Tu prépares ta stratégie commerciale du trimestre. Sur la table : remplacer ton centre d'appel sortant par des agents vocaux IA. Tu dois comprendre le marché avant d'aller demander des démos.

Voilà le brief que tu donnes à Claude, mot pour mot :

Cartographie le marché du voice AI en 2026 pour décider si je peux remplacer mon centre d'appel sortant. Lance 5 sub-agents en parallèle :

1. Acteurs et pricing : 8 acteurs principaux, page officielle, grille tarifaire, modèle business.
2. Capacités techniques : latence, voix custom, langues supportées, API, intégrations CRM.
3. Momentum : levées, partenariats, annonces produit des 6 derniers mois.
4. Voix utilisateurs : Reddit, Hacker News, G2, X sur les 3 derniers mois. Patterns récurrents.
5. Signaux entreprise : postes ouverts "voice agent", activité GitHub, intégrations détectées.

Chaque sub-agent : outils WebFetch + WebSearch uniquement. Sortie en tableau markdown, citer chaque source, jamais inventer.

Synthèse finale : 3 paragraphes (ce qui ressort, ce qui est différenciant, qui regarder en priorité pour un commercial B2B qui veut un stack opérationnel rapidement) + 3 recommandations actionnables.

Orchestrateur · 5 sub-agents en parallèle · sortie cadrée

Une seule commande de quatorze lignes. C'est tout ce que tu écris.

Huit minutes plus tard, tu reçois cinq blocs étiquetés. Voilà à quoi ressemble ce que ramène le premier sub-agent (Acteurs et pricing) :

SUB-AGENT 1 · Acteurs et pricing

ElevenLabs · $99/mois Pro, $330/mois Scale. Qualité de voix premium, catalogue large. elevenlabs.io/pricing
Cartesia (Sonic) · $49/mois Pro, usage-based au-delà. Focus latence. cartesia.ai/pricing
Hume · $0.07/min EVI. Modèle empathique conversationnel. hume.ai/pricing
Sesame · invite-only beta. Voice intelligence open source. sesame.com
Vapi · $0.05/min voice + LLM passthrough. Infrastructure pour devs. vapi.ai/pricing
OpenAI Realtime · $0.06/min input audio. API only. platform.openai.com/docs/realtime
Deepgram Voice Agent · $0.08/min. Stack STT+TTS+LLM. deepgram.com
Retell AI · $0.07/min + LLM. Focus call centers. retellai.com

Et la synthèse finale, qui agrège les cinq blocs :

Ce qui ressort. Le marché s'est éclaté en deux familles. D'un côté les acteurs qualité de voix (ElevenLabs, Sesame) qui te donnent un rendu studio. De l'autre les acteurs infrastructure complète (Vapi, Retell, Deepgram) qui te livrent une plateforme prête à brancher sur un CRM. Cartesia et OpenAI Realtime sont au milieu, avec un avantage net sur la latence.

Ce qui est différenciant. Sur les six derniers mois, deux signaux comptent. La latence sub-100ms devient la barre commune (Cartesia descend à 75ms). Et les acteurs infrastructure gagnent du terrain face aux acteurs qualité, parce que les PME ne veulent pas une voix de cinéma mais un stack qui marche tout de suite avec leurs outils existants.

À regarder en priorité. Pour un commercial B2B qui cherche un stack opérationnel : Vapi pour démarrer (plateforme complète, prix prévisible à l'usage), OpenAI Realtime pour itérer vite si tu as déjà un compte OpenAI, Retell AI si ton focus est centres d'appels (c'est leur cas d'usage natif).

Tu n'as pas ouvert un onglet. Tu as trois paragraphes pour cadrer ta short-list. Le reste du travail (demander les démos, négocier, vérifier le RGPD), tu le fais avec une grille claire en tête.

Pourquoi un seul agent ne suffit pas pour ce genre de tâches

Tu pourrais te dire : je peux faire pareil avec un seul Claude qui regarde tout en même temps. C'est tentant. Mais c'est moins bon, pour trois raisons.

1 sub-agent en séquence

35 minutes

5 sub-agents en parallèle

8 min

Le temps d'attente. Cinq tâches faites les unes après les autres prennent cinq fois plus de temps. Faites en parallèle, elles prennent le temps de la plus longue. Sur cinq sources hétérogènes, le swarm divise par quatre ou cinq le temps total. La différence entre attendre dix minutes (et garder le fil) et attendre quarante minutes (et passer à autre chose, et oublier de revenir).

La qualité de chaque brief. Un sub-agent qui a un seul focus a un prompt plus court et plus précis. L'agent "prix" ne se met pas à parler de levées de fonds. L'agent "users" reste sur les forums et ne se déclenche pas sur les blogs marketing officiels. Chacun est meilleur sur son périmètre étroit que ne le serait un agent généraliste qui doit tout couvrir.

La lisibilité du résultat. Cinq sub-agents te ramènent cinq blocs distincts, étiquetés, sourcés. Tu peux relire le bloc qui t'intéresse en isolation, sans rouvrir tout. Un seul gros agent te ramène une bouillie où tu ne sais plus ce qui vient d'où. Sources mélangées, registre flou, pas de structure claire. La différence se voit surtout au moment où tu reprends le document trois jours plus tard.

Quand le swarm est le bon outil (et quand non)

Pas tous les problèmes méritent un swarm. La règle qui marche est simple :

Si tu peux décrire les sorties comme N colonnes d'un tableau, c'est un swarm. Si la sortie est une histoire qui doit se tenir, c'est un agent unique avec un meilleur brief.

Quand lancer un swarm

Cartographier un marché ou un secteur
Audit multi-axes (positionnement, prix, perf, copy)
Comparer N outils sur M critères
Pré-rédaction : 5 angles à explorer en parallèle
Synthèse de N témoignages ou retours clients
Veille sur N secteurs ou N concurrents

Quand rester sur un agent unique

Écrire un article narratif qui doit se tenir
Réfléchir à une stratégie qui se déduit étape par étape
Tâche qui demande du goût ou du jugement créatif
Tâche courte qui prend deux minutes en solo
Question avec une seule réponse attendue
Conversation interactive avec aller-retour rapide

Ce que ça donne par métier

Marketing. Audit d'un site concurrent sur cinq axes (positionnement, prix, ton, social proof, CTA). Cartographie des canaux d'acquisition utilisés par six concurrents. Préparation d'un brief de campagne sur cinq angles testables avant ton kick-off créatif.

Commercial. Audit d'un secteur de prospects (taille moyenne, signaux de croissance, technos détectables, news récentes, postes ouverts). Pré-qualification d'un compte cible avec cinq sources distinctes avant ton premier appel.

Communication. Veille sur cinq sujets en parallèle pour préparer ta semaine LinkedIn. Préparation d'un pitch presse avec cinq angles à tester avant la conf de rédaction.

Founder. Cartographier un marché qu'on attaque ou qu'on défend. Comprendre la posture de cinq concurrents directs. Auditer son propre produit sur cinq dimensions (UX, copy, prix, social proof, friction d'inscription) avant un comex.

Le motif est toujours le même : plusieurs angles indépendants, des sorties qui tiennent dans un tableau, une synthèse à la fin pour décider.

Comment construire un orchestrateur qui marche : quatre règles

Quatre leviers, dans l'ordre d'importance.

1. Des briefs vraiment indépendants. Le test : tu peux lancer les cinq briefs séparément, à des moments différents, et chacun produit un résultat utile en lui-même. Si l'agent 3 doit lire la sortie de l'agent 1 pour démarrer, ce n'est pas du parallèle. C'est une séquence déguisée. Soit tu re-découpes le problème, soit tu restes sur un agent unique.

2. Un format de sortie imposé. Sans format défini à l'avance, chaque sub-agent te ramène une structure différente, et la synthèse devient pénible. Toujours imposer le format : "tableau markdown avec ces colonnes", "liste de 5 patterns avec verbatim et URL", "trois paragraphes maximum". Quand le format est imposé, la synthèse devient triviale.

3. Des outils limités par agent. L'agent qui scanne Reddit n'a besoin que du web. L'agent qui audite tes fichiers internes n'a besoin que de lire des fichiers. Moins d'outils par agent, moins de surface d'erreur, moins de risque qu'il dérive vers une tâche que tu n'as pas demandée.

4. Un brief de synthèse explicite. L'erreur classique : tu fan-out parfaitement, mais l'orchestrateur ne sait pas quoi faire des cinq blocs. Toujours préciser à la fin : "synthèse en 3 paragraphes nommés", "un tableau de recommandations", "un verdict + 3 actions concrètes". Sinon il te recolle les cinq blocs bout-à-bout et tu refais le travail toi-même.

Trois pièges à éviter

Le brief qui se chevauche

Périmètres flous

Agent 1 : prix et concurrence.
Agent 2 : concurrence et momentum.

Les deux agents te ramènent les mêmes infos en partie. Tu paies deux fois, et tu fatigues à la synthèse parce que tu te demandes lequel a raison.

Périmètres étanches

Agent 1 : prix officiels et grilles tarifaires.
Agent 2 : levées et annonces produit récentes.

Briefe chaque agent comme s'il était seul. Aucun overlap avec ses voisins.

Pourquoi ça plante : deux agents qui couvrent le même terrain produisent les mêmes verbatims. La synthèse devient confuse parce que tu as deux sources qui disent la même chose, et tu ne sais pas laquelle est primaire.

L'agent qui dérive

Sans cadre

Regarde les avis Reddit sur le voice AI.

L'agent lit 30 threads, mélange Reddit et Hacker News, ramène 4 pages de prose sans citer les sources.

Cadre précis

Reddit r/voiceAI et r/MachineLearning, 3 derniers mois. Sors 5 patterns récurrents avec 2 verbatims chacun et l'URL du thread.

Source, période, livrable, longueur : tout est défini.

Pourquoi ça plante : un sub-agent va jusqu'au bout de ce qu'il peut faire si tu ne lui dis pas où s'arrêter. Précise toujours le format de sortie ET la longueur cible (5 lignes, 10 lignes de tableau, 3 paragraphes max).

Le swarm pour rien

Sur-ingénierie

Lance 5 sub-agents pour me dire si Cartesia est moins cher qu'ElevenLabs.

Tu paies cinq fois, tu attends quand même deux minutes, et un seul agent aurait répondu en quinze secondes.

Question simple

Pour une question qui tient en une phrase et appelle une réponse en une phrase, reste sur l'agent unique.

Le swarm devient pertinent à partir de 4-5 dimensions vraiment hétérogènes.

Pourquoi ça plante : le swarm a un coût fixe d'orchestration (décomposition, parallélisation, agrégation). En-dessous d'un certain volume, c'est du sur-coût pur pour zéro gain.

Test final : ton premier swarm cette semaine

Identifie une question qui te demande habituellement deux à trois heures à enchaîner des onglets. Cartographier un marché. Auditer un site. Comparer cinq outils avant un achat. Préparer un brief avant un kick-off.

Copie ce template, adapte les cinq dimensions à ton sujet, lance dans Claude (web ou app) ou dans Claude Code.

Template d'orchestrateur

Cartographie [SUJET] sur 5 dimensions pour [TON OBJECTIF].

Lance 5 sub-agents en parallèle :

1. [DIMENSION 1, ex: acteurs et prix] : sources [...]

2. [DIMENSION 2, ex: capacités produit] : sources [...]

3. [DIMENSION 3, ex: momentum & news] : sources [...]

4. [DIMENSION 4, ex: avis utilisateurs] : sources [...]

5. [DIMENSION 5, ex: signaux d'usage] : sources [...]

Chaque sub-agent : outils WebFetch + WebSearch uniquement.

Format de sortie : tableau markdown, citer chaque source, jamais inventer.

Synthèse finale : 3 paragraphes (ce qui ressort, ce qui est différenciant, qui regarder en priorité pour [TON PROFIL]) + 3 recommandations actionnables.

Quatre conseils pour ton premier essai :

Choisis un sujet où tu connais déjà la réponse partielle. Tu sauras juger si la synthèse est bonne ou non. C'est la meilleure façon de calibrer ton appréciation.
Imprime ou copie les cinq blocs séparément avant de lire la synthèse. Tu verras à quel point chaque sub-agent ramène une matière distincte. Tu comprendras pourquoi la spécialisation paie.
Compte le temps que ça t'aurait pris en manuel. Tu vas être surpris.
Garde le template à côté de tes outils. Tu vas vouloir le réutiliser dans la semaine.

Le bon réflexe : trois questions avant chaque swarm

Le swarm est un outil précis, pour un type précis de tâches : celles qui se décomposent en N sous-questions indépendantes avec des sorties cadrées. En-dehors de ce périmètre, un bon brief sur un seul agent fera mieux.

Trois questions à te poser avant chaque fan-out :

Est-ce que je peux écrire N briefs vraiment indépendants ? Si non, fragmente mieux ou reste sur un agent unique.
Est-ce que les sorties tiennent dans des colonnes ou des sections fixes ? Si non, c'est probablement une tâche narrative.
Est-ce que la synthèse a une forme prévisible ? Si non, c'est une tâche d'écriture, pas un swarm.

Si oui aux trois, fan-out. Sinon, reste sur un seul agent et écris un meilleur brief.

Cette semaine, une action concrète

Identifie un sujet qui te bouffe une matinée à enchaîner les onglets : un marché à comprendre, un audit de site à faire, une comparaison d'outils que tu reportes depuis trois semaines.

Lance ton premier swarm dessus, à partir du template ci-dessus. Si la synthèse te fait gagner deux heures, range le template à côté de tes Skills et de tes custom agents. Tu viens de débloquer une nouvelle gestuelle de travail.

Au-delà du gain de temps immédiat, c'est un nouveau muscle de cadrage que tu construis. Découper un problème complexe en N angles indépendants, c'est ce que fait un bon marketeur quand il plan une campagne, un bon commercial quand il qualifie un compte, un bon founder quand il scope un marché. La différence en 2026 : maintenant, les cinq exécutants tournent en parallèle, et tu lis le résultat avant d'avoir fini ton café.

Pour aller plus loin : Sub-agents Claude Code : déléguer une discovery en 40 minutes couvre le cas du sub-agent unique. Cet article-ci, c'est l'étape d'après : passer de un agent à cinq, et codifier le pattern en orchestrateur réutilisable.