Ce que Together AI a vraiment levé, et pourquoi ses bailleurs comptent

Le 1er juillet 2026, Together AI a annonce une serie C de 800 millions de dollars à une valorisation post-money de 8,3 milliards, soit environ le double des 3,3 milliards qu elle affichait debut 2025. Aramco Ventures a mène le tour via son programme Prosperity7, rejoint par Vista Equity Partners, General Catalyst, Emergence Capital, Nvidia, March Capital, Pegatron et SE Ventures. Le capital total levé atteint desormais environ 1,3 milliard de dollars.

Le chiffre qui porte l histoire n est pas la valorisation. Ce sont les 1,15 milliard de dollars de réservations annuelles que l entreprise a déclarés pour son dernier trimestre, au service de plus d un million de développeurs et de milliers d entreprises dont Cursor, Cognition et Decagon. Ce n est pas un laboratoire qui brule du capital en quête d un modèle. C est une entreprise qui vend une chose pour laquelle les sociétés paient déjà à grande échelle.

Quand un investisseur petrolier souverain et le fabricant de puces dominant signent des chèques pour la même société, ils ne parient pas sur la victoire d un seul modèle. Ils parient qu executer de nombreux modèles à bas coût est un marché durable et en croissance. C est le signal que les dirigeants devraient lire.

Le pari porte sur la couche d inférence, pas sur le modèle

Pendant deux ans, l hypothèse par defaut des entreprises etait simple: choisir un modèle de pointe fermé d un grand laboratoire américain, appeler son API et accepter la facture par jeton comme un coût d exploitation. Together AI est financée sur la prémisse inverse. Sa plateforme execute des modèles a poids ouverts comme DeepSeek, Kimi et MiniMax, enveloppés dans son propre logiciel d optimisation de l inférence, et elle affirme que les clients paient six a soixante fois moins que des deploiements comparables de modèles fermés. Decagon a rapporte avoir divise son coût d inférence par environ six apres la bascule.

La distinction compte parce qu elle separe deux choses que les dirigeants ont tendance à confondre. L intelligence que vous louez et l infrastructure qui la sert sont desormais des produits distincts, vendus par des entreprises distinctes et tarifes sur des courbes distinctes. Le modèle peut etre téléchargé gratuitement. C est sa diffusion efficace, a faible latence et a coût prévisible, que 800 millions de dollars viennent de payer.

Les mesures indépendantes confirment le basculement. Les donnees d OpenRouter citées à côté de la levée montrent que l usage des modèles ouverts sur la plateforme de Together a triple d une annee sur l autre. Ce n est pas une affirmation marketing sur une adoption future. C est un trafic mesure qui passe des points de terminaison fermés aux ouverts parce que l arithmetique a change.

Ce qui change pour un dirigeant ou un operateur

La conséquence pratique est que votre structure de coûts d IA est devenue une decision plutôt qu une donnée acquise. Si une part notable de votre charge est du résumé, de l extraction, de la classification ou du routage, vous surpayez tres probablement en l executant sur un modèle fermé haut de gamme. La tâche n a pas besoin d un raisonnement de pointe; elle a besoin d un modèle ouvert competent servi efficacement. C est exactement la charge que ce marché est conçu pour absorber.

Le contrepoids est réel et ne doit pas etre balaye. Les hyperscalers construisent leur propre capacite d inférence a une echelle qu une seule startup ne peut egaler, et une plateforme spécialisée est un fournisseur de plus à gouverner, sécuriser et dont dependre. La vraie question n est pas de savoir si l inférence sur modèles ouverts est moins chere. C est de savoir si l économie justifie le fournisseur supplementaire et l ingenierie pour router le travail entre les niveaux. Pour une entreprise qui dépense des dizaines de milliers d euros par mois en IA, elle le justifie en general.

La lecture européenne et souveraine

Pour un operateur dans l UE ou au Royaume-Uni, cette levee élargit discretement le menu. Chaque alternative crédible aux deux plus grands laboratoires américains de modèles fermés ameliore votre position de négociation et reduit le risque de concentration lie à la construction d un processus métier sur le prix et la disponibilite d un seul fournisseur. Les modèles servis par Together sont a poids ouverts, ce qui en principe signifie qu ils peuvent etre executes dans une juridiction et une infrastructure de votre choix, et pas seulement via une API hébergée aux États-Unis.

Cela ne fait pas de Together elle-même une reponse européenne a la souveraineté; c est une entreprise américaine, et le capital d Aramco comporte ses propres considérations. Mais le schema qu elle valide, des poids ouverts plus une couche de diffusion efficace, est la même architecture que poursuivent les propres efforts européens en matière d IA souveraine. La preuve commerciale que ce modèle gagne de l argent est utile même aux operateurs qui ne signeront jamais avec Together. Elle vous dit que l option est réelle, financée et peu susceptible de disparaitre.