突破性仿脑视觉技术:AI学会像人类一样“看”世界

B站影视 内地电影 2025-05-23 07:44 2

摘要:由基础科学研究院(IBS)、延世大学和马克斯·普朗克研究所组成的国际科研团队,近日开发出一项突破性人工智能技术,使机器视觉首次逼近人脑处理视觉信息的方式。这项名为Lp-卷积的创新方法,在提升图像识别系统精准度的同时,大幅降低了传统AI模型的计算需求。

在ICLR 2025大会上,韩国基础科学研究院(IBS)联合延世大学团队推出革命性Lp-卷积方法。

由基础科学研究院(IBS)、延世大学和马克斯·普朗克研究所组成的国际科研团队,近日开发出一项突破性人工智能技术,使机器视觉首次逼近人脑处理视觉信息的方式。这项名为Lp-卷积的创新方法,在提升图像识别系统精准度的同时,大幅降低了传统AI模型的计算需求。

突破CNN与生物视觉的鸿沟

人脑具有在复杂视觉场景中快速捕捉关键特征的超凡能力,这一直是传统AI系统难以企及的。当前主流的卷积神经网络(CNN)采用固定尺寸的方形滤波器分析图像,虽然在基础任务中表现尚可,但其检测碎片化数据中广泛模式的能力存在本质局限。

近年来兴起的视觉转换器(ViT)通过全局图像分析在性能上超越了CNN,但代价是需要消耗海量计算资源和训练数据,实际应用成本居高不下。受大脑视觉皮层通过圆形稀疏连接选择性处理信息的启发,研究团队试图寻找第三条道路:仿脑机制能否让CNN兼顾高效与强大?

Lp-卷积:智能视觉新范式

为此,团队开发出基于多元p广义正态分布(MPND)的Lp-卷积技术。与传统CNN的固定方形滤波器不同,这种新方法允许AI模型根据任务需求动态调整滤波器形态 —— 水平延展捕捉横向特征,垂直扩展捕获纵向模式,完美模拟人脑对关键细节的选择性聚焦机制。

这项突破成功攻克了困扰AI领域多年的"大核难题"。传统CNN单纯扩大滤波器尺寸(如使用7×7或更大核)往往收效甚微,而Lp-卷积通过引入仿生柔性连接模式,在不增加参数量的情况下显著提升了模型性能。

实测表现:更智能、更鲁棒、更高效

在CIFAR-100、TinyImageNet等标准数据集测试中,Lp-卷积不仅让AlexNet等经典模型焕发新生,更使RepLKNet等现代架构的准确率实现跨越式提升。面对现实应用中常见的噪声数据,该方法展现出惊人的鲁棒性 —— 这正是当前AI落地应用的关键瓶颈。

更令人振奋的是,当Lp-掩模呈现高斯分布特征时,AI的内部处理模式与小鼠脑神经活动高度吻合。"人类能在复杂场景中瞬间锁定关键要素,"基础科学研究院认知与社会性研究中心主任C. Justin LEE博士指出,"我们的Lp-卷积技术正是模拟了这种能力,使AI能像人脑一样灵活聚焦图像的核心特征。"

应用前景与行业变革

相较于依赖小型固定滤波器的传统方案和资源消耗巨大的视觉转换器,Lp-卷积开创了高效实用的第三条道路。这项突破性技术预计将在多个领域引发革命:

自动驾驶:实时精准识别道路障碍物医学影像:增强AI辅助诊断的细节解析能力智能机器人:打造适应复杂环境的机器视觉系统

"这项研究在AI与神经科学的交叉领域树立了新标杆,"C. Justin LEE主任强调,"通过让AI更贴近生物大脑的工作原理,我们释放了CNN的潜在能力,使其变得更智能、更灵活、更具生物合理性。"

研究团队透露,下一步将深化该技术在复杂推理任务(如数独求解)和实时图像处理等领域的应用探索,持续推动仿脑智能技术的边界。这项突破不仅为计算机视觉开辟了新纪元,更为理解人类认知机制提供了全新视角。

来源:知新了了一点号

相关推荐