DeepSeek V4 Preview — Sin Manual

Qué pasó. El 24 de abril de 2026, DeepSeek publicó el preview de V4, dos modelos Mixture-of-Experts en abierto bajo licencia MIT y con pesos disponibles en Hugging Face. La cabecera es V4-Pro, con 1,6 billones de parámetros totales y 49B activos por token, entrenado sobre más de 32 billones de tokens y con ventana de contexto de un millón. El hermano menor, V4-Flash (284B totales, 13B activos), conserva la misma ventana y, según el comunicado, ofrece capacidades de razonamiento «cercanas a V4-Pro» con una fracción del coste computacional. Ambos están operativos vía la API de DeepSeek (compatible con los formatos de OpenAI y Anthropic) y a través de chat.deepseek.com en sus modos Expert e Instant.

Por qué importa. Hasta esta semana, los modelos de frontera con pesos abiertos quedaban al menos un escalón por debajo de los cerrados de OpenAI, Anthropic o Google DeepMind. V4-Pro acorta esa distancia: en MMLU-Pro marca 87,5%, en GSM8K 92,6% y en MRCR a un millón de contexto un 83,5%. Para un sanitario lo relevante no es el benchmark en sí, sino lo que abre: pesos abiertos significa que, con el hardware adecuado, una institución puede plantearse correr el modelo en su propia infraestructura sin entregar datos a un proveedor externo. La condición no es menor. V4-Pro se publica en precisión mixta FP4/FP8 y, aun pesando menos que un equivalente en FP16, sigue muy lejos del Mac de un despacho. V4-Flash, con un orden de magnitud menos, es la candidata realista para entornos privados.

Lo que sigue. DeepSeek anuncia que retirará sus modelos previos (deepseek-chat y deepseek-reasoner) el 24 de julio de 2026. La etiqueta «preview» suele ser antesala de versión estable. Habrá que ver en las próximas semanas si V4-Flash llega a runtimes locales como llama.cpp y Ollama en cuantizaciones que quepan en GPUs profesionales, y si los benchmarks aguantan en evaluaciones independientes.

Fuentes: DeepSeek API Docs: V4 Preview, Hugging Face: DeepSeek-V4-Pro, Hugging Face: DeepSeek-V4-Flash.

DeepSeek lanza V4 en preview: 1,6T de parámetros, contexto de 1M y licencia MIT

Clowe

Más en Actualidad

NVIDIA libera Nemotron 3 Nano Omni: modelo abierto de 30B con texto, imagen, audio y vídeo

OpenClaw v2026.5.6: voz en Google Meet con Gemini realtime y semana intensa de fixes

Ollama v0.23.0 estrena soporte para Claude Desktop: Cowork y Code dentro de la app

OpenClaw v2026.5.3: cuatro releases de golpe (wiki de memoria, NVIDIA, plugin de archivos)

Más de Clowe

LM Studio: la puerta de entrada a la IA en local sin pasar por la Terminal

Cuánto cuesta de verdad usar la IA en la nube

NVIDIA libera Nemotron 3 Nano Omni: modelo abierto de 30B con texto, imagen, audio y vídeo

OpenClaw v2026.5.6: voz en Google Meet con Gemini realtime y semana intensa de fixes