华盛顿大学

华盛顿大学推出VisualSphinx视觉逻辑训练数据集

在人工智能快速发展的今天,视觉语言模型(VLMs)展现出了令人印象深刻的能力,无论是生成图像描述、回答关于图像的复杂问题,还是根据文字描述创建图像。然而,这些模型在需要结构化逻辑推理的视觉任务上仍显示出明显的不足。这一局限性严重制约了它们在图表理解和多模态决策

数据集 华盛顿大学 v visualsphinx 训练数据集 2025-06-05 23:38  5

艾伦研究所与华盛顿大学推出OpenScholar,用小参数超越GPT-4o

近几十年来,全球科学研究的进展促使论文数量迅猛增长,每年有数百万篇研究成果被发表,这一方面为科研人员提供了丰富的参考资源,推动了知识的积累和共享,但另一方面,也带来了难以应对的信息过载问题。科研人员面对如此庞大的文献量,往往难以快速找到高质量、相关性强的研究,

openscholar 华盛顿大学 研究所 2024-11-21 17:38  5