Ollama v0.21.0 — Sin Manual

Qué pasó. El 16 de abril de 2026 a las 22:00 UTC, el equipo de Ollama publicó la versión v0.21.0, tres días después de la v0.20.7. La novedad de cabecera es la integración de dos agentes en el comando ollama launch: Hermes, un agente del propio proyecto que aprende del flujo de trabajo y crea skills a medida, y GitHub Copilot CLI. Junto a ellos, llega soporte para ejecutar Gemma 4 en MLX sobre Apple Silicon, con runtime solo de texto y cuantización de precisión mixta.

Por qué importa. Ollama es la puerta más accesible a la IA local: se instala en un Mac o un PC, se descarga un modelo y se conversa con él sin que ningún dato salga del aparato. Que ollama launch permita arrancar agentes preconfigurados con un comando reduce la fricción para construir flujos completos sobre los modelos que ya viven en la máquina, no solo chats sueltos. El soporte MLX para Gemma 4 es la otra pata: Apple Silicon es hoy el hardware doméstico que mejor relación rendimiento-precio ofrece para estos tamaños, y MLX es el camino más eficiente. Para quien sigue el carril local, esta release acerca un paso el «todo en mi Mac» frente al «todo en la nube de un tercero».

Cambios destacados (texto adaptado del changelog oficial):

Gemma 4 en MLX: soporte para ejecutar Gemma 4 vía MLX en Apple Silicon, con runtime solo de texto y cuantización de precisión mixta.
Agentes en ollama launch: integración de Hermes (agente que aprende creando skills) y GitHub Copilot CLI; configurar un agente de codificación local en un solo comando.
OpenCode inline: la configuración pasa a escribirse en línea en lugar de en archivos externos.
ollama launch openclaw --yes: ahora salta correctamente el paso de configuración de canales en setups no interactivos.
Renderer Gemma 4: restaurado el modo nothink con el prompt estilo e2b.
Compilaciones Metal y macOS: arreglados los cross-compiles que producían builds rotos.

Lo que sigue. El ritmo de releases de Ollama sigue siendo alto y la integración con agentes da pistas claras del foco: que la IA local no se quede en el chat, sino que sea un entorno completo de orquestación. Conviene prestar atención a las próximas versiones de la rama 0.21.x.

Fuente: Release notes oficiales: Ollama v0.21.0.

Ollama v0.21.0: agentes integrados en `ollama launch` y soporte Gemma 4 en Apple Silicon

Clowe

Más en Actualidad

NVIDIA libera Nemotron 3 Nano Omni: modelo abierto de 30B con texto, imagen, audio y vídeo

OpenClaw v2026.5.6: voz en Google Meet con Gemini realtime y semana intensa de fixes

Ollama v0.23.0 estrena soporte para Claude Desktop: Cowork y Code dentro de la app

OpenClaw v2026.5.3: cuatro releases de golpe (wiki de memoria, NVIDIA, plugin de archivos)

Más de Clowe

LM Studio: la puerta de entrada a la IA en local sin pasar por la Terminal

Cuánto cuesta de verdad usar la IA en la nube

NVIDIA libera Nemotron 3 Nano Omni: modelo abierto de 30B con texto, imagen, audio y vídeo

OpenClaw v2026.5.6: voz en Google Meet con Gemini realtime y semana intensa de fixes