decodificador - Sin Manual

Decodificador: qué es la inferencia (y por qué aparece en cada ficha técnica)

Inferencia es la palabra técnica que se repite en casi todas las fichas de Sin Manual cuando se habla de cómo trabaja un modelo de IA. Detrás del nombre hay un concepto muy simple: es el momento en que el modelo, ya entrenado, se usa para responder a una pregunta concreta.

Por Javier Garcia Pellicer

/ 14 may. 2026

Hugging Face: el lugar donde la comunidad de IA guarda y comparte sus modelos

Hugging Face es el sitio donde vive la mayoría de modelos de IA del mundo. Hub, librerías open source, inferencia gestionada y Spaces. Aquí explico qué es y por qué su nombre aparece en cualquier conversación seria sobre IA.

Por Javier Garcia Pellicer

/ 12 may. 2026

Estanterías de biblioteca con muchos volúmenes ordenados — metáfora del catálogo abierto de modelos

Decodificador: qué es GitHub (y por qué aparece en casi todas las fichas de Sin Manual)

GitHub es la plataforma donde vive el código de la mayor parte del software del mundo, incluido todo el ecosistema de IA del que hablamos en Sin Manual. Esto es lo que necesitas saber para entender qué hay detrás de cada github.com/X/Y.

Por Javier Garcia Pellicer

/ 7 may. 2026

Wall of vintage wooden filing cabinet drawers

Tokens y ventana de contexto: por qué un millón no son un millón

Un token no es una palabra. Y la ventana de contexto no es el cerebro del modelo. Aquí desmonto los dos términos que más confusión generan al hablar de LLM y costes.

Por Javier Garcia Pellicer

/ 5 may. 2026

a close up of an old fashioned typewriter

RAG: cómo dar al modelo tus documentos sin pasarlos por su entrenamiento

RAG es la técnica que convierte un LLM genérico en uno que sabe sobre tus documentos. Sin reentrenarlo, sin que tus datos salgan de tu control. Aquí explico cómo funciona.

Por Clowe and Javier Garcia Pellicer

/ 28 abr. 2026

a row of bookshelves filled with lots of books

Cuantización: cómo un modelo de 70 GB acaba pesando 23

La cuantización es la técnica de compresión que ha permitido que modelos grandes quepan en portátiles. Pasa los parámetros del modelo de 16 bits a 4 sin que el modelo pierda apenas calidad. Aquí explico cómo funciona y por qué importa.

Por Clowe and Javier Garcia Pellicer

/ 28 abr. 2026

Abstract close-up of stacked paper edges

Alucinación: cuando el modelo se inventa lo que no sabe

Un modelo de lenguaje puede generar información incorrecta con la misma confianza que la correcta. En sanidad esto puede ser peligroso. Aquí explico por qué pasa y qué se puede hacer.

Por Javier Garcia Pellicer

/ 27 abr. 2026

Ethereal fog and sun rays illuminate Morgan Hill's rolling landscapes, creating a mystical morning view.

LLM: qué es exactamente eso de los modelos de lenguaje grandes

LLM significa Large Language Model. Es el tipo de modelo que está detrás de ChatGPT, Claude y Gemini. Aquí explico qué es, cómo se entrena y por qué a veces se equivoca.

Por Javier Garcia Pellicer

/ 27 abr. 2026

MoE: por qué un modelo de 35B parámetros activa solo 3B

MoE (Mixture of Experts) es la arquitectura que permite tener modelos enormes sin pagar el coste de cómputo asociado. Está detrás de Mixtral, DeepSeek V3 y Qwen 3.6. Te explico cómo funciona sin matemáticas.

Por Javier Garcia Pellicer

/ 27 abr. 2026

3D abstract geometric structure with gold lines and black polygons on a dark background.