Infrastructure

DeepSeek V4 es gratis de poseer. La mayoría de las empresas lo seguirán alquilando por token.

DeepSeek V4 es de pesos abiertos y de primer nivel. Entonces, ¿por qué la mayoría de las empresas siguen alquilando inteligencia por token? La verdadera respuesta es la gobernanza, no el precio.

Por Leon Soliman · 2026-06-20 · 3 min de lectura

Puntos clave

DeepSeek publicó V4 el 24 de abril de 2026 como modelos de pesos abiertos bajo licencia MIT, lo que significa que los pesos se pueden descargar, ejecutar en hardware propio y ajustar sin un contrato por token.
El buque insignia de DeepSeek, V4-Pro, es un modelo mixture-of-experts de 1,6 billones de parámetros que, en pruebas de capacidad agéntica, según se informa, puntúa a la par de sistemas cerrados de primer nivel como GPT-5.5 y Claude Opus 4.7.
Pese a opciones creíbles de pesos abiertos, en 2026 un puñado de proveedores cerrados sigue captando la gran mayoría del gasto empresarial en API, con los modelos de pesos abiertos como pequeña minoría, según estimaciones del sector.
Autoalojar no es automáticamente más barato: los análisis de costes de 2026 sitúan el coste total de propiedad real en tres a cinco veces la partida bruta de GPU una vez que se cuentan ingenieros, actualizaciones y capacidad ociosa.
Para los propietarios, la decisión es de gobernanza, no de precio. La residencia de datos bajo el RGPD puede convertir un endpoint autoalojado o privado en la única opción conforme, sin importar cuál sea más barata.

¿Qué publicó DeepSeek en realidad con V4?

DeepSeek publicó V4 el 24 de abril de 2026 como modelos de pesos abiertos bajo licencia MIT, en dos tamaños llamados V4-Pro y V4-Flash. Los pesos abiertos importan más que el marketing de código abierto: los pesos están publicados en Hugging Face, así que una empresa puede ejecutar el modelo en sus propias máquinas, ajustarlo con sus propios datos y servirlo a sus propios usuarios sin una relación por token con DeepSeek. El buque insignia V4-Pro es un modelo mixture-of-experts de 1,6 billones de parámetros con unos 49.000 millones de parámetros activos por token, y en pruebas de capacidad agéntica, según se informa, se sitúa a la par de sistemas cerrados de primer nivel como GPT-5.5 y Claude Opus 4.7. Esta es la línea que los propios lanzamientos V3 y R1 de DeepSeek cruzaron primero a finales de 2024 y principios de 2025. La capacidad de primer nivel ya no es algo que solo unos pocos proveedores pueden alquilarte.

Si el modelo es gratis de poseer, ¿por qué casi todos lo alquilan?

Porque alquilar oculta el trabajo real, y el trabajo real es caro de maneras que una tabla de precio por millón de tokens nunca muestra. Las estimaciones del sector siguen situando la gran mayoría del gasto empresarial en API de 2026 en un puñado de proveedores cerrados, y los modelos de pesos abiertos en solo una pequeña minoría, aunque ya existan pesos abiertos creíbles. La razón no es la ignorancia. Ejecutar un modelo de primer nivel de forma interna significa GPU, una pila de servicio, actualizaciones del modelo, seguridad y las personas que mantienen todo eso con vida. Los análisis de costes de 2026 sitúan el coste total de propiedad real en tres a cinco veces la partida bruta de hardware una vez que se cuentan los salarios de ingeniería y la capacidad ociosa. Para un equipo que gasta unos pocos miles al mes en una API, contratar a un ingeniero de inferencia para ahorrar cuesta mucho más de lo que ahorra. Alquilar es a menudo la respuesta correcta. Lo que cuesta dinero a la gente es alquilar sin haberse hecho nunca la pregunta.

Entonces, ¿cuándo es autoalojar de verdad la mejor opción?

Cuando la cuestión deja de ser el precio y pasa a ser el control. El punto de cruce honesto en el que autoalojar supera a la economía de la API solo por coste suele situarse en algún lugar del rango de cincuenta mil a doscientos mil dólares de gasto mensual en API, según cuánto uses el modelo en realidad. Las razones más duraderas no son financieras. Si operas bajo el RGPD, un endpoint autoalojado o privado puede ser la única configuración en la que tus datos nunca abandonan un perímetro que tú controlas, sin importar el coste ese trimestre. Si el modelo es núcleo de tu producto y no una comodidad, poseer los pesos significa que un proveedor no puede descatalogarte, recotizar el precio ni negarte el servicio a su antojo. Un family office o una empresa dirigida por su propietario quiere aquello que seguirá controlando dentro de cinco años, y eso rara vez es la partida más barata de la factura de hoy.

¿Qué debería hacer un propietario antes de la próxima factura de IA?

Separa la cuestión de la capacidad de la cuestión de la propiedad, porque no son la misma decisión. Primero, decide qué es el modelo para ti: un servicio que consumes o un activo del que dependes. Un servicio casi siempre lo puedes alquilar. Un activo vale la pena poseerlo. Segundo, exige un coste total de propiedad real, no un precio por token; si tu equipo solo te muestra la partida de la API, no ha hecho el análisis. Tercero, trata la residencia de datos y la concentración de proveedores como riesgos de nivel de consejo, no como preferencias de ingeniería, porque ahí es donde los pesos abiertos como DeepSeek V4 cambian lo que es posible y no solo lo que es barato. Servola asesora sobre infraestructura de IA y la decisión entre construir y alquilar, con un único responsable y sin agenda de proveedor.

Leer a continuación: Alphabet recauda 80.000 millones de dólares para IA. Esa es su señal para dejar de competir en infraestructura. · Nvidia financia a los laboratorios que compran sus chips. Se está pagando el auge de la IA a sí mismo?

Preguntas frecuentes

¿DeepSeek V4 es realmente gratis para uso comercial?

Los pesos se publican bajo licencia MIT, que permite el uso comercial, el autoalojamiento y el ajuste fino. Gratis de poseer no significa gratis de ejecutar; sigues pagando el hardware, la ingeniería y la carga operativa de servirlo tú mismo.

¿Autoalojar un modelo de pesos abiertos es siempre más barato que una API cerrada?

No. Los análisis de costes de 2026 sitúan el coste total de propiedad real en aproximadamente tres a cinco veces el gasto bruto en GPU una vez incluidos ingenieros, actualizaciones del modelo y capacidad ociosa. Por debajo de un umbral de uso significativo, una API cerrada suele ser la opción más barata y sencilla.

¿Por qué una empresa regulada o dirigida por su propietario autoalojaría siquiera?

Sobre todo por control, no por coste. La residencia de datos bajo el RGPD puede convertir un endpoint autoalojado o privado en la única opción conforme, y poseer los pesos elimina el riesgo de que un proveedor recotice, descatalogue o restrinja un modelo del que depende tu negocio.

DeepSeek V4 no hizo más barata la inteligencia de primer nivel de alquilar. La hizo posible de poseer. La mayoría de las empresas que sigan pagando por token en 2027 serán las que nunca se detuvieron a preguntar cuál necesitaban en realidad.

AI Infrastructure Open Weights DeepSeek Self-Hosting Governance

Más del Servola Journal

Infrastructure

Alphabet recauda 80.000 millones de dólares para IA. Esa es su señal para dejar de competir en infraestructura.

2026-06-21 · 2 min de lectura

Leer el artículo →

Infrastructure

Nvidia financia a los laboratorios que compran sus chips. Se está pagando el auge de la IA a sí mismo?

2026-06-19 · 3 min de lectura

Leer el artículo →

Infrastructure

El primer desafío serio a Nvidia no es una GPU mejor. Es la capa de inferencia.

2026-06-19 · 3 min de lectura

Leer el artículo →

Servola

Si estás sopesando si poseer o alquilar tu IA, eso es exactamente sobre lo que asesoramos, con discreción y con un único responsable.

Solicitar una presentación privada Sobre Servola →

Servola es asesoría tecnológica para un reducido número de familias y family offices. Cuando una decisión no se puede delegar, nos sentamos de su lado de la mesa.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Todos los artículos