北大团队提出2比特复数模型iFairy{±1, ±i},精度反超量化前,可手机部署 version 8.14摘要:为破解大模型部署与推理成本高昂的困境,北京大学杨仝老师团队首次提出名为iFairy的超低比特量化方案。该方案创新性地利用复数{±1, ±i}对模型权重进行2-bit量化,在实现1/8极致压缩与“无乘法”推理加速的同时,语言建模能力 模型 比特 复数 ifairy 比特复数 2025-08-15 16:06 3