Qué anunció DeepSeek

El 30 de junio de 2026 DeepSeek comunicó que la versión oficial de V4 llegará a mediados de julio, graduando la vista previa disponible desde el 24 de abril, según informó TechNode. La novedad principal no es un benchmark. Es un mecanismo de precios: por primera vez en una gran API de IA, los tokens costarán distinto según la hora del día, con tarifas que se duplican en las ventanas diarias de 9:00 a 12:00 y de 14:00 a 18:00, el horario laboral chino, y la tarifa valle sin cambios.

Los modelos en sí son de peso: la ventana de contexto de 1 millón de tokens pasa a ser estándar en toda la gama, V4-Pro es un diseño mixture-of-experts de 1,6 billones de parámetros con 49.000 millones activos, y V4-Flash un modelo de 284.000 millones con 13.000 millones activos. La documentación de DeepSeek añade una fecha límite dura: los endpoints antiguos deepseek-chat y deepseek-reasoner quedan inaccesibles tras el 24 de julio, así que las integraciones existentes deben migrar, les guste o no el nuevo contador.

Por qué un laboratorio pone precios como una eléctrica

La tarifa por franjas existe en un solo tipo de mercado: capacidad fija, demanda fluctuante. Las redes eléctricas la inventaron porque almacenar era caro y la punta de demanda dimensionaba todo el sistema. Que un laboratorio de IA recurra ahora a la misma herramienta es una admisión que vale más que cualquier presentación: la capacidad de inferencia es finita, las GPU no hacen cola educadamente, y el token marginal de las 10:30 de un martes le cuesta al operador más que el mismo token a medianoche.

También rompe una suposición cómoda. El sector lleva dos años diciendo que la inteligencia se abarata cada trimestre. Por token, sigue siendo cierto. Pero el nuevo mecanismo significa que el precio de la misma petición ya no es una constante, y quien presupuestó con costes unitarios planos posee ahora un pequeño problema de trading energético. En cuanto un proveedor demuestra que los clientes aceptan precios de demanda, los demás tienen todos los incentivos para seguirle.

La ventaja horaria europea

Para los compradores europeos, la geografía de las ventanas punta es inusualmente amable. Las horas punta comunicadas caen entre las 3:00 y las 6:00 y entre las 8:00 y las 12:00, hora de verano de la Europa central, la de Madrid o Barcelona. Desde el mediodía, toda la tarde y la noche laborales corren en tarifa valle. Una empresa europea que use DeepSeek paga la tarifa rebajada durante la mayor parte de su jornada, mientras un competidor chino paga el doble durante la suya.

El movimiento práctico es arquitectónico, no contractual: separar las llamadas críticas en latencia de las aplazables. Los procesos nocturnos por lotes, los embeddings, la reindexación, las evaluaciones y los informes pueden programarse en ventanas valle con una cola y una entrada de cron. Esa disciplina merece construirse aunque nunca se use DeepSeek, porque la tarifa horaria ya está demostrada, y la versión de su propio proveedor está a una reunión de producto de distancia.

Qué hacer antes de mediados de julio

Tres acciones caben en las dos semanas previas al lanzamiento. Primera: quien ejecute los endpoints en retirada deepseek-chat o deepseek-reasoner necesita un plan de migración antes del 24 de julio, probado, no planeado. Segunda: los equipos que usen cualquier API de IA medida deberían etiquetar ya sus cargas como aplazables o interactivas, para que programarlas sea luego un cambio de configuración. Tercera: quien gestione el presupuesto de IA debería modelar el gasto con precio de dos tramos y hacer a cada proveedor una pregunta en la renovación: se compromete a precios independientes de la hora durante la vigencia del contrato, o no. La respuesta, en cualquier sentido, es información.