Qu'a réellement publié DeepSeek avec V4 ?

DeepSeek a publié V4 le 24 avril 2026 sous forme de modèles à poids ouverts sous licence MIT, en deux tailles nommées V4-Pro et V4-Flash. Les poids ouverts comptent plus que le marketing open-source : les poids sont publiés sur Hugging Face, donc une entreprise peut exécuter le modèle sur ses propres machines, l'affiner sur ses propres données et le servir à ses propres utilisateurs sans relation au token avec DeepSeek. Le modèle phare V4-Pro est un mixture-of-experts de 1 600 milliards de paramètres avec environ 49 milliards de paramètres actifs par token, et sur les benchmarks agentiques il se situerait, selon les rapports, au niveau de systèmes fermés de frontière comme GPT-5.5 et Claude Opus 4.7. C'est la ligne que les propres sorties V3 et R1 de DeepSeek ont franchie en premier fin 2024 et début 2025. La capacité de niveau frontière n'est plus quelque chose que seuls quelques fournisseurs peuvent vous louer.

Si le modèle est gratuit à posséder, pourquoi presque tout le monde le loue-t-il ?

Parce que la location masque le vrai travail, et le vrai travail coûte cher d'une manière qu'une grille de prix par million de tokens ne montre jamais. Les estimations du secteur situent encore la grande majorité des dépenses d'API en entreprise de 2026 chez une poignée de fournisseurs fermés, et les modèles à poids ouverts seulement chez une petite minorité, même si des poids ouverts crédibles existent désormais. La raison n'est pas l'ignorance. Faire tourner un modèle de frontière en interne, cela veut dire des GPU, une pile de serving, des mises à jour du modèle, de la sécurité et les personnes qui maintiennent tout cela en vie. Les analyses de coûts de 2026 situent le coût total de possession réel à trois à cinq fois la seule ligne matérielle, une fois comptés les salaires d'ingénierie et la capacité inutilisée. Pour une équipe qui dépense quelques milliers par mois sur une API, embaucher un ingénieur d'inférence pour économiser coûte bien plus que cela n'économise. Louer est souvent la bonne réponse. Ce qui coûte de l'argent aux gens, c'est de louer sans jamais s'être posé la question.

Alors, quand l'auto-hébergement est-il vraiment le meilleur choix ?

Quand la question cesse de porter sur le prix et commence à porter sur le contrôle. Le point de bascule honnête où l'auto-hébergement bat l'économie des API sur le seul coût se situe en général quelque part entre cinquante mille et deux cent mille dollars de dépenses mensuelles d'API, selon l'usage réel que vous faites du modèle. Les raisons plus durables ne sont pas financières. Si vous opérez sous le RGPD, un point d'accès auto-hébergé ou privé peut être la seule configuration où vos données ne quittent jamais un périmètre que vous contrôlez, quel qu'en soit le coût ce trimestre-là. Si le modèle est au cœur de votre produit plutôt qu'un simple confort, posséder les poids signifie qu'un fournisseur ne peut pas le retirer, le retarifer ou vous le refuser à sa guise. Un family office ou une entreprise dirigée par son propriétaire veut ce qu'il contrôlera encore dans cinq ans, et ce n'est que rarement la ligne la moins chère sur la facture d'aujourd'hui.

Que devrait faire un propriétaire avant la prochaine facture d'IA ?

Séparez la question de la capacité de celle de la propriété, car ce ne sont pas la même décision. D'abord, décidez ce qu'est le modèle pour vous : un service que vous consommez, ou un actif dont vous dépendez. Un service, vous pouvez presque toujours le louer. Un actif mérite d'être possédé. Ensuite, exigez un vrai coût total de possession, pas un prix au token ; si votre équipe ne vous montre que la ligne de l'API, elle n'a pas fait l'analyse. Enfin, traitez la résidence des données et la concentration des fournisseurs comme des risques de niveau conseil, pas comme des préférences d'ingénierie, car c'est là que des poids ouverts comme DeepSeek V4 changent ce qui est possible et pas seulement ce qui est bon marché. Servola conseille sur l'infrastructure IA et sur la décision entre construire et louer, avec un seul responsable et sans agenda de fournisseur.