Qué pasó. El 16 de abril de 2026 a las 22:00 UTC, el equipo de Ollama publicó la versión v0.21.0, tres días después de la v0.20.7. La novedad de cabecera es la integración de dos agentes en el comando ollama launch: Hermes, un agente del propio proyecto que aprende del flujo de trabajo y crea skills a medida, y GitHub Copilot CLI. Junto a ellos, llega soporte para ejecutar Gemma 4 en MLX sobre Apple Silicon, con runtime solo de texto y cuantización de precisión mixta.
Por qué importa. Ollama es la puerta más accesible a la IA local: se instala en un Mac o un PC, se descarga un modelo y se conversa con él sin que ningún dato salga del aparato. Que ollama launch permita arrancar agentes preconfigurados con un comando reduce la fricción para construir flujos completos sobre los modelos que ya viven en la máquina, no solo chats sueltos. El soporte MLX para Gemma 4 es la otra pata: Apple Silicon es hoy el hardware doméstico que mejor relación rendimiento-precio ofrece para estos tamaños, y MLX es el camino más eficiente. Para quien sigue el carril local, esta release acerca un paso el «todo en mi Mac» frente al «todo en la nube de un tercero».
Cambios destacados (texto adaptado del changelog oficial):
- Gemma 4 en MLX: soporte para ejecutar Gemma 4 vía MLX en Apple Silicon, con runtime solo de texto y cuantización de precisión mixta.
- Agentes en
ollama launch: integración de Hermes (agente que aprende creando skills) y GitHub Copilot CLI; configurar un agente de codificación local en un solo comando. - OpenCode inline: la configuración pasa a escribirse en línea en lugar de en archivos externos.
ollama launch openclaw --yes: ahora salta correctamente el paso de configuración de canales en setups no interactivos.- Renderer Gemma 4: restaurado el modo nothink con el prompt estilo e2b.
- Compilaciones Metal y macOS: arreglados los cross-compiles que producían builds rotos.
Lo que sigue. El ritmo de releases de Ollama sigue siendo alto y la integración con agentes da pistas claras del foco: que la IA local no se quede en el chat, sino que sea un entorno completo de orquestación. Conviene prestar atención a las próximas versiones de la rama 0.21.x.