人工智能与元宇宙产业委《元宇宙十大技术》培训班第117期:杨仝

B站影视 电影资讯 2025-08-30 09:31 2

摘要:2025年8月24日周日晚上八点,由人工智能与元宇宙产业委(“中国移动通信联合会人工智能与元宇宙产业工作委员会”的简称)指导,人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长叶毓睿创办的“燕园叶话”《元宇宙十大技术》培训班进行

​人工智能与元宇宙产业委《元宇宙十大技术》培训班第117期:杨仝《iFairy: 2-bit复数基座大模型,为何在手机端就可部署?》

2025年8月24日周日晚上八点,由人工智能与元宇宙产业委(“中国移动通信联合会人工智能与元宇宙产业工作委员会”的简称)指导,人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长叶毓睿创办的“燕园叶话”《元宇宙十大技术》培训班进行到第117期。微信视频号 乐生活与爱IT、央链直播、寇享学术、DOIT、零壹财经、iCloser社交元宇宙、卢米宇宙、察访区块链、web3马甲哥、上海创业导师、盘古智库、氦川科技、大江大湖大黄高、卢山说AI精进、凤岐茶社等媒体直播或转载。客座嘉宾杨仝讲解《iFairy: 2-bit复数基座大模型,为何在手机端就可部署?》,本期超2400人在线观看。

燕园叶话欢迎大家一起打造AI培训平台,加入到这个AI全民科普计划(十个顶级专家,百个中高级的资深专家;千个甚至万个最高层,也即5~6层AI老师。无论是AI老师,或者需要培训的甲方,都欢迎和我私信联系、探讨。用Web3/DAO的方式,看看如何达成共识分润?

会议纪要:先分享几张讲稿截图,下载完整讲稿,请订阅 燕园叶话 知识星球。

使用AIGC工具或平台帮助整理出的会议纪要如下(感谢 邵舸同学):
1)演讲者观点总结

杨仝教授提出,传统大模型的预训练、蒸馏、强化学习三阶段面临算力与存储瓶颈,尤其端侧部署受限于功耗与散热。现有量化方案(如BitNet三值量化)存在空间浪费和精度损失,而iFairy通过复数基座重构突破全精度模型的天花板:

1. 复数参数设计:将权重扩展至复平面(实部+虚部),使单个参数具备二维表达能力,比实数模型多一维信息密度。

2. 2-bit极致压缩:权重量化至{±1, ±i},利用复平面单位根的对称性实现零空间浪费,并消除矩阵乘法。

3. 推理革新:仅需加法与数值交换,功耗降至十分之一,支持手机端部署。

4. 训练代价:复数模型训练成本为实数模型的2-4倍,但推理效率与精度显著提升,长远看具备商业化潜力。

2)演讲内容大纲

1. 技术瓶颈与现有方案局限:

- 大模型端侧部署的三大障碍:参数存储(如70B模型需140GB)、矩阵乘法算力消耗、散热/功耗限制。

- 量化方案对比:训练后量化(PTQ)精度损失大;训练时量化(QAT)可适应噪声但天花板受限于全精度模型。BitNet等三值量化存在25%空间浪费(零值冗余)。

2. iFairy核心技术路径:

- 2.1 四大复数化改造:

- 2.1.1 线性层重定义:采用Hermitian内积(共轭点乘)满足数学性质(对称性、线性性、正定性)。

- 2.1.2 双Embedding拼接:输入token分别映射实/虚部,输出层拼接后计算Logit。

- 2.1.3 位置编码适配:复平面天然支持RoPE相对位置编码,旋转操作更符合复数几何特性。

- 2.1.4 注意力简化:Q·K内积仅取实部(含模长与相位信息),兼容FlashAttention并减少50%计算量。

- 2.2 PhaseQuant量化算法:

- 2.2.1 训练时将权重量化至复平面四象限,反量化引入噪声供模型学习。

- 2.2.2 根据幅角判定量化值(如[-45°,45°]→1),缩放因子取实/虚部均值。

- 2.3 无乘法推理:

- 2.3.1 {±1, ±i}乘法转化为符号调整与维度交换(例:乘i=交换实虚部+虚部取反)。

- 2.3.2 查表法(LUT)预存16种输入组合结果,硬件友好。

3. 实验验证与开源:

- 训练配置:RedPajama数据集100B token,1.3B参数模型,复数模型PPL(10.14)优于同规模实数模型(11.25)。

- 下游任务:复数模型量化后精度超越BitNet b1.58,部分任务接近全精度。

- 开源承诺:代码、数据集、模型参数全部公开,支持700M/1.3B版本端侧部署。


3)问答环节

Q(Peter 叶毓睿):iFairy相比传统模型,参数量与算力缩减比例?

A:复数模型参数量不变,但2比特量化使存储降至1/8;推理中乘法转加法,算力需求降至1/10,整体端侧效率提升约80倍。

Q(Peter 叶毓睿):复数模型的缺陷?

A:训练成本翻倍(需处理实/虚部运算),且当前GPU不支持原生复数运算,需定制算子。未来需联合硬件厂商优化。

Q(邵舸 David):复数模型表达力提升是否源于参数量变相增加?

A:对比实验显示,同参数规模下复数模型精度更高,源于二维信息密度提升。若实数模型扩增参数量,其量化后精度仍低于复数模型。

Q(叶毓睿):是否可能扩展至高维复数(如四元数)?

A:技术上可行,但训练成本将指数级增长(如四维需16倍算力),且精度增益待验证。复平面二维是目前效率与效果的最优解。

Q(叶毓睿):手机端部署进展?

A:1.3B模型仅需300MB存储,但需开发专用推理引擎(现依赖CPU/GPU适配)。正在与硬件厂商探索定制芯片,彻底消除乘法单元。

下期预告:

人工智能与元宇宙产业委《元宇宙十大技术》培训班

第118期(2025年8月30日,周日20点)

Peter 叶毓睿:《从BTC、Stablecoin到RWA:稳定币来了,我们怎么办?》

纲要:

1、人机共生的世界:智能体+稳定币

2、稳定币的缘起,从BTC到SBR

3、稳定币的定义和应用场景

4、稳定币的问题与挑战

5、中国如何应对?

6、稳定币和RWA

主讲人:

《元宇宙十大技术》作者、中央党校元宇宙课程(3集)作者、燕园叶话主理人;

中国移动通信联合会可信资产与数链金融专委会副主任委员。

1、腾讯会议:576-2467-9700 (密码: 230101)

2、 B站 http://live.bilibili.com/32509301

人工智能与元宇宙产业委《元宇宙十大技术》培训班是由人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长、先进计算产业发展联盟智能计算组组长叶毓睿发起和创办的。叶毓睿长期关注区块链、VR/AR、AIGC、数字孪生、3D内容创作平台或规范(如Web3D、WebXR)等元宇宙等前沿技术领衔参与撰写的《元宇宙十大技术》一书系统地剖析了构成元宇宙的技术组成、原理、案例和未来趋势。他领衔并邀请了十多位领域的Top级专家撰写的《元宇宙十大技术》一书,系统地剖析了构成元宇宙的核心技术要点,该书得到了包括朱嘉明、肖风、姚前及四位院士等70多位资深专家的联袂推荐。 通过“燕园叶话”这个平台,叶毓睿希望能够推动元宇宙技术在社会各界的交流与普及。《元宇宙十大技术》一书为这个系列活动提供了理论基础和技术支撑。同时,叶毓睿还积极运用自己的人脉资源,邀请国内外元宇宙领域的专家学者前来主讲,保证了内容的专业性和前瞻性。截止2025年8月24日,已经举办了第117期,促成了不少合作,欢迎关注、转发。通过关注视频号 乐生活与爱IT,可以查看过往回放。

人工智能与元宇宙产业委《元宇宙十大技术》培训班目前主要以线上形式(腾讯会议+视频号)展开,并邀请了13+媒体伙伴们一起转播、转载,通常每次在线观看人数4000-41000不等,也是受访嘉宾及其所在公司的良好展示平台。该品牌系列活动的创办,是元宇宙产业委和叶毓睿推动元宇宙产业发展、促进元宇宙技术交流的重要举措之一。 《元宇宙十大技术》培训班的举办,是元宇宙产业委为推动元宇宙技术交流、促进产业发展作出的重要努力。通过持续邀请专家学者主讲,剖析元宇宙技术,和介绍应用场景或案例,使广大公众对元宇宙有了更深入的了解,也增强了对元宇宙发展的信心。可以预见,这一系列活动有望对元宇宙产业链培育人才、推动技术创新、规范产业发展起到积极的推动作用。我们期待它能够发挥引领示范效应,推动元宇宙产业健康快速发展。

来源:央链直播

相关推荐