Blog posts

2025

quantization levels

2 minute read

Published: March 02, 2025

How do you determine the appropriate quantization precision levels for your Large language models?

Fake Model Quantization

2 minute read

Published: February 25, 2025

Fake Model Quantization Doesn’t Make Any Difference in Accelerating Model Inference Time