摘要:明敏 发自 凹非寺量子位 | 公众号 QbitAIQwen3深夜上新,Embedding系列全新登场!它专为文本表征、检索与排序任务设计,旨在将文本(如句子、段落)转换为高质量的向量表示,以便在语义搜索、问答系统、推荐引擎等应用中更有效地处理和理解自然语言。可
明敏 发自 凹非寺量子位 | 公众号 QbitAIQwen3深夜上新,Embedding系列全新登场!它专为文本表征、检索与排序任务设计,旨在将文本(如句子、段落)转换为高质量的向量表示,以便在语义搜索、问答系统、推荐引擎等应用中更有效地处理和理解自然语言。可用于文档检索、RAG、分类、情感分析、检索等任务。它在Qwen3基础模型上训练而来,充分发挥Qwen3的多语言优势。一共有0.6B/4B/8B三种尺寸,8B版本在MTEB多语言Leaderboard榜单中排名第一,性能超越一众商业API服务。
Qwen3团队强调,在Embedding模型的第一阶段弱监督训练中,他们构建了多任务适配的Prompt体系。也就是针对不同任务类型和语言特性,使用Qwen3动态生成了一系列弱监督文本对,突破了传统方法依赖社区论坛或开源数据筛选获取弱监督文本对的局限性,实现了大规模弱监督数据的高效生成。One More Thing值得一提的是,苹果WWDC25定档下周二(6月10日)。中国的Apple Intelligence正是由阿里来提供大模型能力。巧合的是,在WWDC25同天19:30,阿里将开展Qwen3-Embedding技术直播。感兴趣的同学可以在官号蹲一下了。ModelScope:https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48https://modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4fHugging Face:https://huggingface.co/collections/Qwen/qwen3-embedding-6841b2055b99c44d9a4c371fhttps://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefeaGitHub:https://github.com/QwenLM/Qwen3-Embedding技术报告:https://github.com/QwenLM/Qwen3-Embedding/blob/main/qwen3_embedding_technical_report.pdf— 完 —欢迎在评论区留下你的想法!原标题:《Qwen3深夜开源新系列:文本表征模型,3种尺寸可选,超越商业API拿下SOTA》 来源:小周科技讲堂
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!