¿Qué publicó DeepSeek en realidad con V4?

DeepSeek publicó V4 el 24 de abril de 2026 como modelos de pesos abiertos bajo licencia MIT, en dos tamaños llamados V4-Pro y V4-Flash. Los pesos abiertos importan más que el marketing de código abierto: los pesos están publicados en Hugging Face, así que una empresa puede ejecutar el modelo en sus propias máquinas, ajustarlo con sus propios datos y servirlo a sus propios usuarios sin una relación por token con DeepSeek. El buque insignia V4-Pro es un modelo mixture-of-experts de 1,6 billones de parámetros con unos 49.000 millones de parámetros activos por token, y en pruebas de capacidad agéntica, según se informa, se sitúa a la par de sistemas cerrados de primer nivel como GPT-5.5 y Claude Opus 4.7. Esta es la línea que los propios lanzamientos V3 y R1 de DeepSeek cruzaron primero a finales de 2024 y principios de 2025. La capacidad de primer nivel ya no es algo que solo unos pocos proveedores pueden alquilarte.

Si el modelo es gratis de poseer, ¿por qué casi todos lo alquilan?

Porque alquilar oculta el trabajo real, y el trabajo real es caro de maneras que una tabla de precio por millón de tokens nunca muestra. Las estimaciones del sector siguen situando la gran mayoría del gasto empresarial en API de 2026 en un puñado de proveedores cerrados, y los modelos de pesos abiertos en solo una pequeña minoría, aunque ya existan pesos abiertos creíbles. La razón no es la ignorancia. Ejecutar un modelo de primer nivel de forma interna significa GPU, una pila de servicio, actualizaciones del modelo, seguridad y las personas que mantienen todo eso con vida. Los análisis de costes de 2026 sitúan el coste total de propiedad real en tres a cinco veces la partida bruta de hardware una vez que se cuentan los salarios de ingeniería y la capacidad ociosa. Para un equipo que gasta unos pocos miles al mes en una API, contratar a un ingeniero de inferencia para ahorrar cuesta mucho más de lo que ahorra. Alquilar es a menudo la respuesta correcta. Lo que cuesta dinero a la gente es alquilar sin haberse hecho nunca la pregunta.

Entonces, ¿cuándo es autoalojar de verdad la mejor opción?

Cuando la cuestión deja de ser el precio y pasa a ser el control. El punto de cruce honesto en el que autoalojar supera a la economía de la API solo por coste suele situarse en algún lugar del rango de cincuenta mil a doscientos mil dólares de gasto mensual en API, según cuánto uses el modelo en realidad. Las razones más duraderas no son financieras. Si operas bajo el RGPD, un endpoint autoalojado o privado puede ser la única configuración en la que tus datos nunca abandonan un perímetro que tú controlas, sin importar el coste ese trimestre. Si el modelo es núcleo de tu producto y no una comodidad, poseer los pesos significa que un proveedor no puede descatalogarte, recotizar el precio ni negarte el servicio a su antojo. Un family office o una empresa dirigida por su propietario quiere aquello que seguirá controlando dentro de cinco años, y eso rara vez es la partida más barata de la factura de hoy.

¿Qué debería hacer un propietario antes de la próxima factura de IA?

Separa la cuestión de la capacidad de la cuestión de la propiedad, porque no son la misma decisión. Primero, decide qué es el modelo para ti: un servicio que consumes o un activo del que dependes. Un servicio casi siempre lo puedes alquilar. Un activo vale la pena poseerlo. Segundo, exige un coste total de propiedad real, no un precio por token; si tu equipo solo te muestra la partida de la API, no ha hecho el análisis. Tercero, trata la residencia de datos y la concentración de proveedores como riesgos de nivel de consejo, no como preferencias de ingeniería, porque ahí es donde los pesos abiertos como DeepSeek V4 cambian lo que es posible y no solo lo que es barato. Servola asesora sobre infraestructura de IA y la decisión entre construir y alquilar, con un único responsable y sin agenda de proveedor.