¿Hace falta un superordenador para tener una IA propia que no envía nada fuera? Hasta hace poco, sí. Hoy ya no.
El 23 de abril de 2026, un día después de poner en marcha Iris en una máquina especializada con 128 GB de memoria, montamos Mini-Clowe sobre algo bastante más mundano: un MacBook Pro M4 Max. Un portátil de gama alta, sí, pero un portátil. Sin caja externa, sin GPU dedicada, sin más electricidad que la que entrega su propio cargador.
El modelo que carga se llama Qwen 3.6-35B-A3B: treinta y cinco mil millones de parámetros en total, de los que solo tres mil millones se activan en cada predicción gracias a la arquitectura MoE. Pesa unos 23 GB en memoria. Responde a unos 39 tokens por segundo, más rápido que mucha gente lee. Y todo dentro del portátil.
Que esto sea posible hoy es consecuencia de tres palancas tirando en la misma dirección. La primera es la mezcla de expertos: el modelo vive entero en memoria, pero solo trabaja una pequeña fracción cada vez, lo que reduce drásticamente el cómputo en cada respuesta. La segunda es la cuantización: técnicas de compresión que pasan los pesos del modelo de 16 bits a 4 bits sin destrozar su calidad, dividiendo por cuatro la memoria necesaria. La tercera es el chip Apple Silicon, en concreto las GPUs integradas de la familia M, que comparten memoria con la CPU (memoria unificada) y permiten que un modelo enorme se cargue donde antes solo cabían los datos de una hoja de cálculo.
Tres palancas que han convertido un MacBook bueno en una máquina capaz de alojar modelos que hace dos años exigían una estación de trabajo de varios miles de euros.
Mini-Clowe corre encima de Ollama, una herramienta gratuita que hace con los modelos de IA lo que Docker hizo con las aplicaciones: descargar un modelo se parece a descargar una aplicación, lanzarlo es un comando de una línea, y el sistema gestiona memoria y descargas sin que el usuario tenga que entender el detalle. Junto a Ollama vive OpenClaw, una capa que convierte el modelo en algo más útil: le da herramientas. Trece, en este caso. Buscar en internet, descargar páginas, manipular PDFs (crearlos, leerlos, hacerles OCR en castellano), copiar al portapapeles, hablar por voz, enviar mensajes por Telegram. La diferencia entre un chatbot y un agente, de la que ya se ha hablado en otra entrada, aquí se hace palpable.
Hay un detalle que en una IA de servidor no aplica: solo funciona con el portátil abierto. Si se cierra la tapa, el sistema se suspende y Mini-Clowe queda fuera de servicio hasta el siguiente despertar. Suena obvio, pero introduce una restricción que no existe en una máquina fija: la IA local doméstica vive cuando vive su huésped. Y, paradójicamente, eso aporta seguridad: cuando no la quieres viva, no lo está.
El interés de un montaje así para un sanitario no es necesariamente que vaya a montarlo él, aunque desde este proyecto te ayudaremos a ello en su momento. El interés está en lo que demuestra. Una IA local con calidad razonable está hoy al alcance de cualquier consulta, despacho o estudio donde haya un equipo decente. Ya no hace falta un centro de datos. La frontera del «posible» se ha movido al ordenador personal, al mismo donde se redacta un informe o se prepara una presentación.
Hay un compromiso, y conviene reconocerlo. Mini-Clowe es más torpe que Iris, y Iris es más torpe que Claude Sonnet 4.6 corriendo en la nube. La calidad de respuesta cae a medida que se baja la escala del modelo, sobre todo en tareas complejas: razonamientos largos, código de cierta sofisticación, comprensión multimodal. Para tareas razonables (resumir un texto, responder preguntas sobre documentos que le entregas, redactar un primer borrador, traducir), Mini-Clowe va sobrada. Para tareas que requieran lo último de lo último, la nube sigue siendo la opción técnica.
El argumento de la IA local nunca ha sido que sea la mejor en términos brutos, sino que es la única opción cuando la prioridad es el control absoluto sobre los datos. Iris muestra que esa opción ha llegado a un nivel de calidad sorprendente con hardware especializado. Mini-Clowe muestra que la curva ha bajado un peldaño más: la calidad razonable cabe en un portátil de gama alta. La curva de los próximos años va a seguir bajando (modelos más pequeños mejor entrenados, hardware doméstico más capaz), y la pregunta sobre qué se puede hacer con datos clínicos sin que viajen a ningún servidor va a tener cada vez más respuestas afirmativas.
Y a ti, ¿qué hardware tienes ahora mismo entre manos (móvil, portátil, sobremesa), y qué tendría que pasar para que considerases instalar un modelo local en él?