超越KL!大连理工发布Wasserstein距离知识蒸馏新方法
大连理工大学的研究人员提出了一种基于Wasserstein距离的知识蒸馏方法,克服了传统KL散度在Logit和Feature知识迁移中的局限性,在图像分类和目标检测任务上表现更好。
kl wasserstein距离 wasserstein 2025-01-11 11:39 8
大连理工大学的研究人员提出了一种基于Wasserstein距离的知识蒸馏方法,克服了传统KL散度在Logit和Feature知识迁移中的局限性,在图像分类和目标检测任务上表现更好。
kl wasserstein距离 wasserstein 2025-01-11 11:39 8
自Hinton等人的开创性工作以来,基于Kullback-Leibler散度(KL-Div)的知识蒸馏一直占主导地位。
wasserstein距离 wasserstein neur 2025-01-10 15:43 9