摘要:格隆汇12月7日|12月6日,OpenAI连续12个工作日的宣讲进入第二天,今天介绍的是强化微调研究项目(Reinforcement Fine-Tuning Research Program)。据介绍,该项目旨在使开发人员和机器学习工程师能够创建经过微调的专家
格隆汇12月7日|12月6日,OpenAI连续12个工作日的宣讲进入第二天,今天介绍的是强化微调研究项目(Reinforcement Fine-Tuning Research Program)。据介绍,该项目旨在使开发人员和机器学习工程师能够创建经过微调的专家模型。新的模型自定义技术使开发人员能够使用数十到数千个高质量任务定制模型,并根据提供的参考答案对模型的响应进行分级。此技术强化了模型对类似问题解决方案的推导,以及在特定任务上的准确性。OpenAI表示,鼓励研究机构、大学和企业申请使用,预计在法律、保险、医疗保健、金融和工程等领域有积极结果,因为该模型在结果具有客观“正确”答案(大多数专家都会同意)的任务中表现出色。
来源:新浪财经一点号
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!