Vocabulario y conceptos esenciales de IA descifrados sin jerga, en lenguaje accesible para profesionales sanitarios. Tu traductor del ruido tecnológico.
Inferencia es la palabra técnica que se repite en casi todas las fichas de Sin Manual cuando se habla de cómo trabaja un modelo de IA. Detrás del nombre hay un concepto muy simple: es el momento en que el modelo, ya entrenado, se usa para responder a una pregunta concreta.
Hugging Face es el sitio donde vive la mayoría de modelos de IA del mundo. Hub, librerías open source, inferencia gestionada y Spaces. Aquí explico qué es y por qué su nombre aparece en cualquier conversación seria sobre IA.
GitHub es la plataforma donde vive el código de la mayor parte del software del mundo, incluido todo el ecosistema de IA del que hablamos en Sin Manual. Esto es lo que necesitas saber para entender qué hay detrás de cada github.com/X/Y.
Un token no es una palabra. Y la ventana de contexto no es el cerebro del modelo. Aquí desmonto los dos términos que más confusión generan al hablar de LLM y costes.
RAG es la técnica que convierte un LLM genérico en uno que sabe sobre tus documentos. Sin reentrenarlo, sin que tus datos salgan de tu control. Aquí explico cómo funciona.
La cuantización es la técnica de compresión que ha permitido que modelos grandes quepan en portátiles. Pasa los parámetros del modelo de 16 bits a 4 sin que el modelo pierda apenas calidad. Aquí explico cómo funciona y por qué importa.
Un modelo de lenguaje puede generar información incorrecta con la misma confianza que la correcta. En sanidad esto puede ser peligroso. Aquí explico por qué pasa y qué se puede hacer.
LLM significa Large Language Model. Es el tipo de modelo que está detrás de ChatGPT, Claude y Gemini. Aquí explico qué es, cómo se entrena y por qué a veces se equivoca.
MoE (Mixture of Experts) es la arquitectura que permite tener modelos enormes sin pagar el coste de cómputo asociado. Está detrás de Mixtral, DeepSeek V3 y Qwen 3.6. Te explico cómo funciona sin matemáticas.