Un token no es una palabra. Y la ventana de contexto no es el cerebro del modelo. Aquí desmonto los dos términos que más confusión generan al hablar de LLM y costes.
Lo que parece memoria en una conversación con ChatGPT o Claude no es memoria, es ventana de contexto. Y cuando se llena, lo más antiguo se cae sin avisar.