摘要:流行私人分类广告服务 Avito 的团队,分享了其品牌神经网络的新成就。大型语言模型 A-Vibe 在俄罗斯独立基准 MERA 的轻量级模型(参数多达 100 亿)评估中脱颖而出,力压 OpenAI、Google 和 Thropic 等国际同类模型,荣登榜首。
据Ixbt 4月7日报道,流行私人分类广告服务 Avito 的团队,分享了其品牌神经网络的新成就。大型语言模型 A-Vibe 在俄罗斯独立基准 MERA 的轻量级模型(参数多达 100 亿)评估中脱颖而出,力压 OpenAI、Google 和 Thropic 等国际同类模型,荣登榜首。
测试涵盖了从基础文本理解到需深度剖析上下文的高级语言任务等不同复杂程度的内容。结果显示,A-Vibe 成功超越了 GPT-4o mini、Gemma 3 27B、Claude 3.5 HAIku、Mistral Large 等热门小型神经网络。
具体来看,在 MERA 测试中,A-Vibe 表现卓越:代码生成能力比拥有 80 亿参数的 Gemini 1.5 高出 25%;对话环节的准确性比参数达 4050 亿的 Llama 3.1 高 32%;分析文本含义的能力则比 Claude 3.5 Haiku 准确 23%。
目前,A-Vibe 技术已在 Avito 服务中发挥作用,例如协助卖家编写销售描述,以及在 Messenger 中高效谈判交易。该公司计划在今年年底前新增 20 个应用场景,未来还有可能将模型代码向公众开放。
A-Vibe 在理解用户请求、生成代码和维持有意义对话方面,均优于同类模型。其出色表现不仅为 Avito 的服务赋能,也标志着在俄语轻量级 AI 模型领域取得了重大突破。
(编译:晋阳)
链接:
来源:邮电设计技术