Connect with us

Bingxin Xu, Zhen Dong, Oussama Elachqar, Yuzhang Shang

AI Research5 days ago

ButterflyQuant: Ultra-low-bit LLM Quantization through Learnable Orthogonal Butterfly Transforms

arXiv:2509.09679v1 Announce Type: cross Abstract: Large language models require massive memory footprints, severely limiting deployment on consumer hardware. Quantization reduces memory through lower numerical precision, but...

More Posts