cfg资讯_B站影视

Skywork AI团队：如何用音频生成人像视频？

2025年6月1日，由Skywork AI团队发布的最新研究论文《SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers》吸引了计算机视觉

在2025年第42届国际机器学习会议(ICML 2025)上，来自南京大学的王帅、宋天辉、王立民，以及阿里巴巴淘宝天猫集团的李泽贤、张启鹏、李旭彬、葛铁政、郑博等研究人员发表了一篇题为《Differentiable Solver Search for Fast

近日，由香港理工大学（PolyU）的李鹏翔和复旦大学（FDU）的严世林联合领导的研究团队发表了一项引人注目的研究成果。这篇题为《Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Maski

目前LLMs的优化主要有两种思路：参数扩展（如GPT-4）和推理时间扩展（如DeepSeek-R1），但会增加内存和时间成本。

何恺明团队又一力作！这次他们带来的是「生成模型界的降维打击」——MeanFlow：无需预训练、无需蒸馏、不搞课程学习，仅一步函数评估（1-NFE），就能碾压以往的扩散与流模型！