人工智能实验室

阿里国际与上海人工智能实验室联合发布首个应用型AI翻译评测榜单

近日,首个应用型AI翻译测评榜单TransBench在OpenCompass上线,与传统的翻译测评体系相比,增加了幻觉率、文化禁忌词、敬语规范等指标,首次针对行业的细分领域构建评测数据和评测方法。这些指标均来自真实场景的使用反馈,由此来测评大模型是否符合大规模

人工智能 榜单 翻译 评测 人工智能实验室 2025-05-22 11:45  4