← retour aux articles 🍁 Read in English

J'ai pas de modèle préféré. C'est le but.

multi-modeleorchestrationarchitecturellmprotocole42

Toutes les six à huit semaines, un nouveau modèle sort et mon fil d’actualité se transforme en ring de boxe : Claude est mort? GPT est de retour? Lequel est le meilleur?

J’opère 42 agents. Aucun d’eux a de chouchou.

La fidélité à un modèle, ça avait du sens en 2023. Deux vrais choix, un leader clair, tu picks et tu avances. Cette époque est révolue. On a maintenant des modèles frontier crédibles chez au moins quatre fournisseurs différents, chacun avec une vraie force dans des domaines précis. Claude Opus mène encore sur les chaînes de raisonnement longues et les décisions sous ambiguïté. Le dernier modèle d’OpenAI a un computer use natif qui fonctionne pour vrai. Les modèles locaux (Qwen, variantes de Llama) deviennent non-négociables dès que « résidence des données » ou « conformité » entre dans la conversation avec un client. Gemini gère mieux le volume multimodal à certains seuils de prix.

Choisir un modèle pis appeler ça ton « stack IA », c’est pas une stratégie. C’est de la dette technique qui attend son heure.

Ce qui m’a enseigné ça : Un agent en production était verrouillé à un seul fournisseur. Quand la fenêtre de contexte de ce fournisseur a étouffé sur un type de document spécifique, l’agent a planté silencieusement — pas d’erreur, juste des outputs wrongos. On l’a trouvé trois jours plus tard. Pas catastrophique. Juste de la dégradation invisible. Le fix : du routage. La leçon : architecturale.

Le pattern qui tient dans le Protocole 42 :

  • Raisonnement et jugement → meilleur modèle frontier disponible en ce moment, pas de raccourci
  • Computer use, contexte visuel, tâches UI → celui qui a l’exécution native cette semaine-là
  • Données clients sensibles, contraintes de conformité → inférence locale, on-premise, point final
  • Travail à haut volume, faibles enjeux (résumés, classification, décisions de routage) → plus petit, plus rapide, moins cher

C’est pas du hedging de fournisseur. C’est la différence entre un contracteur qui possède un marteau pis un ingénieur qui possède le job.

Le cadrage « mon IA » va mal vieillir. Les benchmarks bougent toutes les quelques semaines. Ton architecture — si tu l’as bien construite — devrait pas avoir à suivre.

La prochaine grande sortie de modèle va pas tuer le précédent. A va juste rendre la pensée à modèle unique un peu plus gênante.

— Wahooka. Elder Power, orchestrateur de 42 agents, hérétique chronique. Ça fait un bout que je route des tâches entre les modèles. La réponse n’a pas changé : aucun d’eux « pense ». T’en choisis le bon pour la tâche. C’est toute.

Sources :

🍁 Read this post in English