Ollama: cómo bajar una IA a tu ordenador en una sola línea

Si alguien quiere probar la inteligencia artificial en su propio ordenador, sin abrir cuentas ni pagar suscripciones ni enviar nada a la nube, hay una herramienta que está por encima del resto: Ollama. Es gratuita, ocupa unos pocos megas y funciona en macOS, Linux y Windows. Su gracia está en que reduce algo que hasta hace dos años era complicadísimo, tener una IA corriendo en tu propio equipo, a un único comando.

Para hacerse una idea, lo más parecido sería pensar en la App Store del móvil, pero aplicada a modelos de inteligencia artificial. Antes, bajar un modelo y echarlo a andar era un proceso enrevesado: descargar archivos sueltos, instalar dependencias, configurar entornos, resolver conflictos. Ollama lo reduce a escribir una sola línea en el terminal y pulsar Enter. Por ejemplo: ollama pull llama3.3. Unos minutos después, tienes en tu equipo un modelo capaz de mantener una conversación, redactar textos o ayudarte con código.

Detrás de esa sencillez hay bastante trabajo. Ollama mantiene una biblioteca pública de modelos (decenas, desde los más ligeros de uno o dos gigas hasta los más pesados de varias decenas), los descarga a tu disco, los carga en memoria cuando los pides y los libera cuando llevan un rato sin usarse. Y crea, dentro de tu propio equipo, una pequeña centralita por la que cualquier aplicación que ya sepa hablar con ChatGPT puede hablar con tu modelo local sin enterarse de que está en casa. Esa centralita es lo que en jerga técnica se llama API, y es la pieza que ha convertido a Ollama en el pegamento de medio ecosistema.

Programas como Open WebUI (una interfaz de chat parecida a ChatGPT pero local), LM Studio (otra forma de gestionar modelos en tu ordenador), Continue (un asistente de código que se integra en editores como VS Code) o Cherry Studio se conectan a Ollama sin más, y de pronto lo que estás usando funciona contra un modelo que vive en tu propio equipo, sin contratos con nadie ni facturas mensuales.

El catálogo es generoso pero está cuidado. Están las grandes familias de modelos open source, los que cualquiera puede descargar y usar sin pedir permiso a nadie: Qwen (de Alibaba), Llama (de Meta), DeepSeek, Mistral, Gemma (de Google), Phi (de Microsoft). Cada modelo se publica en varios tamaños según cuántos parámetros tenga, que es, simplificando mucho, lo que mide cuánto sabe un modelo: a más parámetros, más capaz, pero también más pesado y más exigente con la memoria del ordenador. Cada uno viene además en varias cuantizaciones, una técnica de compresión que permite ahorrar memoria a cambio de un poquito de precisión; la que aparece marcada por defecto es la que recomienda el desarrollador para la mayoría de la gente.

Para hacerse una idea de qué cabe en qué ordenador: con 16 GB de RAM (la memoria habitual básica de los portátiles modernos) caben modelos de unos 12.000 millones de parámetros funcionando con soltura. Con 32 o 36 GB, se entra ya en modelos de 30.000 a 35.000 millones, bastante capaces. Con 64 GB o más, hablamos de modelos serios, comparables en muchas tareas a los grandes de la nube.

Conviene ser honestos con lo que Ollama no hace. Está pensado para uso personal o equipos muy pequeños. No registra quién hace cada consulta ni gestiona usuarios con permisos distintos. Para un único profesional usándolo en su propio equipo, sobra. Para escenarios donde varias personas comparten el mismo Ollama y hace falta saber quién ha consultado qué, hay que poner una capa adicional encima, normalmente OpenClaw u Open WebUI. Tampoco lleva bien que dos personas le pidan cosas a la vez: si llegan dos consultas al mismo tiempo, una espera a que termine la otra.

Tampoco están todos los modelos del mundo en su biblioteca. Las grandes familias sí, pero los lanzamientos muy recientes o los modelos de nicho a veces tardan en aparecer, o hay que descargarlos manualmente desde Hugging Face, el sitio en internet donde investigadores y empresas publican sus modelos para que cualquiera los use. Eso ya pide algo más de trabajo técnico, pero sigue siendo factible.

Un detalle no menor: Ollama es open source, una herramienta abierta que mantiene una empresa pero distribuye gratis. Esto importa porque significa que su modelo de negocio no depende de cobrarte por usarla. No hay datos viajando a sus servidores, no hay límites artificiales, no hay versión premium con candados que desbloquear pagando. Cuando cobran, es por servicios añadidos como alojamiento empresarial; la herramienta que usa la mayoría de la gente es gratuita de verdad, no de las que llevan asterisco al lado.

Para alguien que se acerca por primera vez, el camino tiene tres pasos. Instalar Ollama desde su web. Abrir el terminal, esa ventana negra con texto que vive escondida en cualquier ordenador y que asusta bastante más de lo que debería. Y escribir, una detrás de otra, dos órdenes: ollama pull llama3.3 para descargar el modelo y ollama run llama3.3 para empezar a conversar con él. En quince minutos, sin más coste que la electricidad que gaste tu equipo, tienes una IA respondiéndote desde dentro de tu propio ordenador, sin pasar por nadie y sin enviar una sola palabra a la nube.

Y a ti, ¿alguna vez has descargado un modelo en tu propio equipo, o tu primer encuentro con la IA ha sido siempre a través de la nube?