Trinity-Large-Thinking : le modèle open-source qui défie Claude Opus
Arcee AI a investi la moitié de son capital-risque (20M$) pour développer Trinity-Large-Thinking, un modèle open-source de raisonnement de 400B paramètres rivalisant avec Claude Opus. Spécialisé dans les tâches d'agents, il atteint 88 sur Tau2-Airline mais accuse un retard en raisonnement général (76.3 vs 89.2 pour Opus).
Que faut-il retenir ?
- Trinity-Large-Thinking utilise 400 milliards de paramètres mais seulement 13 milliards actifs par token grâce à une architecture mixture-of-experts (4 experts actifs parmi 256).
- Le modèle a été entraîné sur 2048 GPU Nvidia B300 pendant 33 jours pour un coût de 20 millions de dollars.
- Performances clés : 91.9 sur PinchBench (vs 93.3 pour Claude Opus 4.6) et 0.976 au test Needle-in-a-Haystack avec un contexte de 512K tokens.
- La méthode SMEBU a résolu l'effondrement des experts lors de l'entraînement, stabilisant le processus sur 17 trillions de tokens.
Pourquoi cette nouvelle compte-t-elle ?
Ce modèle open-source concurrence directement Claude Opus dans les tâches d'agents autonomes, un marché en pleine expansion. Son architecture optimisée (13B paramètres actifs/400B) et sa licence Apache 2.0 en font une alternative viable pour les entreprises cherchant à éviter les solutions propriétaires. Les performances en planification multi-étapes (96.3 sur AIME25) ouvrent des possibilités concrètes pour l'automatisation complexe.
Public concerné : développeurs, entreprises
Comment Trinity-Large-Thinking réduit-il ses coûts de calcul malgré ses 400 milliards de paramètres ?
Grâce à son architecture mixture-of-experts : seulement 4 sous-réseaux (13 milliards de paramètres) sont activés par token, réduisant la puissance nécessaire tout en conservant la capacité globale du modèle.
Commentaires (0)
💡 Aucun lien externe ni code HTML accepté. Soyez respectueux. Les commentaires sont modérés avant publication.
Aucun commentaire pour le moment. Soyez le premier !