广东发布国内首个文化领域多模态推理大模型
3月28日,岭南数字创意大厦新基建高质量发展大会发布了国内首个文化领域多模态推理大模型(岭南文化大模型),模型以DeepSeek为技术基座,深度整合《岭南文库》《岭南文化辞典》等权威典籍及粤港澳三地文化资源,通过先进的知识蒸馏与多模态融合技术,进行模型蒸馏训练
3月28日,岭南数字创意大厦新基建高质量发展大会发布了国内首个文化领域多模态推理大模型(岭南文化大模型),模型以DeepSeek为技术基座,深度整合《岭南文库》《岭南文化辞典》等权威典籍及粤港澳三地文化资源,通过先进的知识蒸馏与多模态融合技术,进行模型蒸馏训练
尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。
此项研究成果已被 EMNLP 2024 录用。该论文的第一作者是中国人民大学高瓴人工智能学院硕士生程传奇,目前为蚂蚁技术研究院实习生,其主要研究领域为对话系统和多模态大模型。蚂蚁技术研究院副研究员关健为共同第一作者。