Skywork AI团队:如何用音频生成人像视频?
2025年6月1日,由Skywork AI团队发布的最新研究论文《SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers》吸引了计算机视觉
2025年6月1日,由Skywork AI团队发布的最新研究论文《SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers》吸引了计算机视觉
在2025年第42届国际机器学习会议(ICML 2025)上,来自南京大学的王帅、宋天辉、王立民,以及阿里巴巴淘宝天猫集团的李泽贤、张启鹏、李旭彬、葛铁政、郑博等研究人员发表了一篇题为《Differentiable Solver Search for Fast
近日,由香港理工大学(PolyU)的李鹏翔和复旦大学(FDU)的严世林联合领导的研究团队发表了一项引人注目的研究成果。这篇题为《Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Maski
目前LLMs的优化主要有两种思路:参数扩展(如GPT-4)和推理时间扩展(如DeepSeek-R1),但会增加内存和时间成本。
何恺明团队又一力作!这次他们带来的是「生成模型界的降维打击」——MeanFlow:无需预训练、无需蒸馏、不搞课程学习,仅一步函数评估(1-NFE),就能碾压以往的扩散与流模型!