7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
llm deepseek 掰手腕 deepseekv3 扩散 2025-04-07 15:48 2
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
llm deepseek 掰手腕 deepseekv3 扩散 2025-04-07 15:48 2