Qué pasó. El 24 de abril de 2026, DeepSeek publicó el preview de V4, dos modelos Mixture-of-Experts en abierto bajo licencia MIT y con pesos disponibles en Hugging Face. La cabecera es V4-Pro, con 1,6 billones de parámetros totales y 49B activos por token, entrenado sobre más de 32 billones de tokens y con ventana de contexto de un millón. El hermano menor, V4-Flash (284B totales, 13B activos), conserva la misma ventana y, según el comunicado, ofrece capacidades de razonamiento «cercanas a V4-Pro» con una fracción del coste computacional. Ambos están operativos vía la API de DeepSeek (compatible con los formatos de OpenAI y Anthropic) y a través de chat.deepseek.com en sus modos Expert e Instant.
Por qué importa. Hasta esta semana, los modelos de frontera con pesos abiertos quedaban al menos un escalón por debajo de los cerrados de OpenAI, Anthropic o Google DeepMind. V4-Pro acorta esa distancia: en MMLU-Pro marca 87,5%, en GSM8K 92,6% y en MRCR a un millón de contexto un 83,5%. Para un sanitario lo relevante no es el benchmark en sí, sino lo que abre: pesos abiertos significa que, con el hardware adecuado, una institución puede plantearse correr el modelo en su propia infraestructura sin entregar datos a un proveedor externo. La condición no es menor. V4-Pro se publica en precisión mixta FP4/FP8 y, aun pesando menos que un equivalente en FP16, sigue muy lejos del Mac de un despacho. V4-Flash, con un orden de magnitud menos, es la candidata realista para entornos privados.
Lo que sigue. DeepSeek anuncia que retirará sus modelos previos (deepseek-chat y deepseek-reasoner) el 24 de julio de 2026. La etiqueta «preview» suele ser antesala de versión estable. Habrá que ver en las próximas semanas si V4-Flash llega a runtimes locales como llama.cpp y Ollama en cuantizaciones que quepan en GPUs profesionales, y si los benchmarks aguantan en evaluaciones independientes.
Fuentes: DeepSeek API Docs: V4 Preview, Hugging Face: DeepSeek-V4-Pro, Hugging Face: DeepSeek-V4-Flash.