Suscripción o API, tokens de entrada y de salida, razonamiento, tokenizadores que cambian sin avisar: lo que de verdad determina la factura mensual de la IA en la nube.
Un token no es una palabra. Y la ventana de contexto no es el cerebro del modelo. Aquí desmonto los dos términos que más confusión generan al hablar de LLM y costes.
Lo que parece memoria en una conversación con ChatGPT o Claude no es memoria, es ventana de contexto. Y cuando se llena, lo más antiguo se cae sin avisar.