Is it possible to run this on new models? It seem like the code is only for infe...

		mountainriver 3 days ago \| parent \| context \| favorite \| on: Lossless LLM compression for efficient GPU inferen... Is it possible to run this on new models? It seem like the code is only for inference, unless I’m misunderstanding