Infrastructure

DeepSeek V4 est gratuit à posséder. La plupart des entreprises le loueront quand même au token.

DeepSeek V4 est à poids ouverts et de niveau frontière. Alors pourquoi la plupart des entreprises louent-elles encore l'intelligence au token ? La vraie réponse, c'est la gouvernance, pas le prix.

Par Leon Soliman · 2026-06-20 · 3 min de lecture

Points clés

DeepSeek a publié V4 le 24 avril 2026 sous forme de modèles à poids ouverts sous licence MIT, ce qui signifie que les poids peuvent être téléchargés, exécutés sur votre propre matériel et affinés sans contrat au token.
Le modèle phare de DeepSeek, V4-Pro, est un modèle mixture-of-experts de 1 600 milliards de paramètres qui, sur les benchmarks agentiques, obtiendrait des scores au niveau de systèmes fermés de frontière comme GPT-5.5 et Claude Opus 4.7.
Malgré des options crédibles à poids ouverts, en 2026 une poignée de fournisseurs fermés capte encore la grande majorité des dépenses d'API en entreprise, les modèles à poids ouverts restant une petite minorité, selon les estimations du secteur.
L'auto-hébergement n'est pas automatiquement moins cher : les analyses de coûts de 2026 situent le coût total de possession réel à trois à cinq fois la seule ligne GPU, une fois comptés les ingénieurs, les mises à jour et la capacité inutilisée.
Pour les propriétaires, la décision relève de la gouvernance, pas du prix. La résidence des données sous le RGPD peut faire d'un point d'accès auto-hébergé ou privé la seule option conforme, quelle que soit la moins chère.

Qu'a réellement publié DeepSeek avec V4 ?

DeepSeek a publié V4 le 24 avril 2026 sous forme de modèles à poids ouverts sous licence MIT, en deux tailles nommées V4-Pro et V4-Flash. Les poids ouverts comptent plus que le marketing open-source : les poids sont publiés sur Hugging Face, donc une entreprise peut exécuter le modèle sur ses propres machines, l'affiner sur ses propres données et le servir à ses propres utilisateurs sans relation au token avec DeepSeek. Le modèle phare V4-Pro est un mixture-of-experts de 1 600 milliards de paramètres avec environ 49 milliards de paramètres actifs par token, et sur les benchmarks agentiques il se situerait, selon les rapports, au niveau de systèmes fermés de frontière comme GPT-5.5 et Claude Opus 4.7. C'est la ligne que les propres sorties V3 et R1 de DeepSeek ont franchie en premier fin 2024 et début 2025. La capacité de niveau frontière n'est plus quelque chose que seuls quelques fournisseurs peuvent vous louer.

Si le modèle est gratuit à posséder, pourquoi presque tout le monde le loue-t-il ?

Parce que la location masque le vrai travail, et le vrai travail coûte cher d'une manière qu'une grille de prix par million de tokens ne montre jamais. Les estimations du secteur situent encore la grande majorité des dépenses d'API en entreprise de 2026 chez une poignée de fournisseurs fermés, et les modèles à poids ouverts seulement chez une petite minorité, même si des poids ouverts crédibles existent désormais. La raison n'est pas l'ignorance. Faire tourner un modèle de frontière en interne, cela veut dire des GPU, une pile de serving, des mises à jour du modèle, de la sécurité et les personnes qui maintiennent tout cela en vie. Les analyses de coûts de 2026 situent le coût total de possession réel à trois à cinq fois la seule ligne matérielle, une fois comptés les salaires d'ingénierie et la capacité inutilisée. Pour une équipe qui dépense quelques milliers par mois sur une API, embaucher un ingénieur d'inférence pour économiser coûte bien plus que cela n'économise. Louer est souvent la bonne réponse. Ce qui coûte de l'argent aux gens, c'est de louer sans jamais s'être posé la question.

Alors, quand l'auto-hébergement est-il vraiment le meilleur choix ?

Quand la question cesse de porter sur le prix et commence à porter sur le contrôle. Le point de bascule honnête où l'auto-hébergement bat l'économie des API sur le seul coût se situe en général quelque part entre cinquante mille et deux cent mille dollars de dépenses mensuelles d'API, selon l'usage réel que vous faites du modèle. Les raisons plus durables ne sont pas financières. Si vous opérez sous le RGPD, un point d'accès auto-hébergé ou privé peut être la seule configuration où vos données ne quittent jamais un périmètre que vous contrôlez, quel qu'en soit le coût ce trimestre-là. Si le modèle est au cœur de votre produit plutôt qu'un simple confort, posséder les poids signifie qu'un fournisseur ne peut pas le retirer, le retarifer ou vous le refuser à sa guise. Un family office ou une entreprise dirigée par son propriétaire veut ce qu'il contrôlera encore dans cinq ans, et ce n'est que rarement la ligne la moins chère sur la facture d'aujourd'hui.

Que devrait faire un propriétaire avant la prochaine facture d'IA ?

Séparez la question de la capacité de celle de la propriété, car ce ne sont pas la même décision. D'abord, décidez ce qu'est le modèle pour vous : un service que vous consommez, ou un actif dont vous dépendez. Un service, vous pouvez presque toujours le louer. Un actif mérite d'être possédé. Ensuite, exigez un vrai coût total de possession, pas un prix au token ; si votre équipe ne vous montre que la ligne de l'API, elle n'a pas fait l'analyse. Enfin, traitez la résidence des données et la concentration des fournisseurs comme des risques de niveau conseil, pas comme des préférences d'ingénierie, car c'est là que des poids ouverts comme DeepSeek V4 changent ce qui est possible et pas seulement ce qui est bon marché. Servola conseille sur l'infrastructure IA et sur la décision entre construire et louer, avec un seul responsable et sans agenda de fournisseur.

Questions fréquentes

DeepSeek V4 est-il vraiment gratuit pour un usage commercial ?

Les poids sont publiés sous licence MIT, qui autorise l'usage commercial, l'auto-hébergement et l'affinage. Gratuit à posséder ne veut pas dire gratuit à faire tourner ; vous payez toujours le matériel, l'ingénierie et la charge opérationnelle de le servir vous-même.

Auto-héberger un modèle à poids ouverts est-il toujours moins cher qu'une API fermée ?

Non. Les analyses de coûts de 2026 situent le coût total de possession réel à environ trois à cinq fois la seule dépense GPU, une fois inclus les ingénieurs, les mises à jour du modèle et la capacité inutilisée. En dessous d'un seuil d'usage significatif, une API fermée est généralement le choix le moins cher et le plus simple.

Pourquoi une entreprise réglementée ou dirigée par son propriétaire s'auto-hébergerait-elle ?

Surtout pour le contrôle, pas pour le coût. La résidence des données sous le RGPD peut faire d'un point d'accès auto-hébergé ou privé la seule option conforme, et posséder les poids supprime le risque qu'un fournisseur retarife, retire ou restreigne un modèle dont dépend votre activité.

DeepSeek V4 n'a pas rendu l'intelligence de frontière moins chère à louer. Il l'a rendue possible à posséder. La plupart des entreprises qui paieront encore au token en 2027 seront celles qui ne se sont jamais arrêtées pour se demander ce dont elles avaient vraiment besoin.

AI Infrastructure Open Weights DeepSeek Self-Hosting Governance

Plus dans le Servola Journal

Infrastructure

Alphabet lève 80 milliards de dollars pour l'IA. C'est votre signal pour cesser de rivaliser sur l'infrastructure.

2026-06-21 · 2 min de lecture

Lire l'article →

Infrastructure

Nvidia finance les laboratoires qui achètent ses puces. Le boom de l'IA se paie-t-il lui-même ?

2026-06-19 · 3 min de lecture

Lire l'article →

Infrastructure

Le premier défi sérieux à Nvidia n'est pas un meilleur GPU. C'est la couche d'inférence.

2026-06-19 · 3 min de lecture

Lire l'article →

Servola

Si vous évaluez s'il faut posséder ou louer votre IA, c'est exactement ce sur quoi nous conseillons, en toute discrétion et avec un seul responsable.

Demander une mise en relation privée À propos de Servola →

Servola est un conseil technologique pour un petit nombre de familles et de family offices. Lorsqu'une décision ne peut pas être déléguée, nous siégeons de votre côté de la table.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Tous les articles