摘要:埃文科技始终坚持以技术创新为核心驱动力,深耕大模型领域的前沿研究。近期,埃文科技与电子科技大学等科研单位的两篇重磅论文《Generative Thinking, Corrective Action: User-Friendly Composed Image R
埃文科技始终坚持以技术创新为核心驱动力,深耕大模型领域的前沿研究。近期,埃文科技与电子科技大学等科研单位的两篇重磅论文《Generative Thinking, Corrective Action: User-Friendly Composed Image Retrieval via Automatic Multi-Agent Collaboration》和《REDEEMing Modality Information Loss: Retrieval-Guided Conditional Generation for Severely Modality Missing Learning》成功入选KDD 2025 Research Track,彰显了公司大模型技术研发与学术影响力再攀高峰!
图1:Overall framework of AutoCIR
《Generative Thinking, Corrective Action: User-Friendly Composed Image Retrieval via Automatic Multi-Agent Collaboration》提出在零样本组合图像检索任务中,使用大模型构建多智能体的协同框架 AutoCIR,包含规划器、检索器与校正器三个协同模块,逐步识别并修正查询与检索结果之间的不匹配,旨在解决现有方法中存在的自适应检索查询缺失以及用户交互体验不友好的问题,如图1所示。
图2:Overall framework of REDEEM
《REDEEMing Modality Information Loss: Retrieval-Guided Conditional Generation for Severely Modality Missing Learning》针对多模态数据缺失导致模型性能下降的问题,创新提出一个检索引导的生成式框架REDEEM。该框架通过自适应检索机制挖掘与目标样本相关的实例,一方面指导条件生成器重建缺失模态,另一方面通过跨模态动态提示器生成样本感知的提示,引导模型更好地理解模态间关系,提升视觉语言模型在模态缺失情形下的鲁棒性,如图2所示。
KDD是数据挖掘领域的顶级会议,被中国计算机学会(CCF)评级为A类会议。KDD Research Track聚焦于数据挖掘理论、技术和算法的创新性研究,是全球录取率最低的计算机会议之一,在知识发现、数据挖掘、人工智能等领域具有重大影响力。
埃文科技始终聚焦大模型技术的核心难题,围绕多方向进行持续攻关和创新突破,此次入选KDD的两项研究成果,不仅展示了团队在学术领域的深厚积累,更凸显了埃文团队技术落地的前瞻性。未来,我们将继续深化大模型研究,携手全球合作伙伴,共同推动AI技术赋能千行百业。
来源:王者凯旋