摘要:最近,OpenAI在社交媒体X上爆料了一个新玩意儿,叫做“强化微调”(RFT)。这玩意儿说白了,就是让公司可以根据自己的小算盘,来给o1 mini模型做个“私人定制”。
最近,OpenAI在社交媒体X上爆料了一个新玩意儿,叫做“强化微调”(RFT)。这玩意儿说白了,就是让公司可以根据自己的小算盘,来给o1 mini模型做个“私人定制”。
RFT到底是干啥用的?
简单来讲,它就像是个高级家教,专门帮模型做题,让模型在回答问题的时候更精准,更符合公司的口味。
怎么做这个RFT呢?得准备两套资料和一个打分工具。一套是训练资料,就像给模型布置的家庭作业;另一套是检验资料,看看模型有没有真正掌握知识点。那个打分工具,就是给模型的答案打分,满分1分,目标就是让模型考个满分出来。
RFT有啥好处呢?它能让开发者用少量的例子,比如说几十个,花个几小时到几天时间,就能训练出一个解决问题的高手。这对那些需要专业知识的地方,比如金融、工程、法律啥的,特别有用。
现在,RFT还在试运行阶段,只有少数人能申请试用,普通老百姓想用还得再等等,估计得明年了。
相关公司:
【AI Agent】
金山办公:提供办公软件服务,利用AI技术提升办公效率。
三六零:网络安全公司,运用AI进行安全防护和数据分析。
福昕软件:专注于PDF解决方案,AI技术用于文档处理和数据分析。
合合信息:提供企业信息服务平台,AI用于信息检索和智能分析。
拓尔思:专注于大数据和人工智能,提供文本挖掘和舆情分析服务。
新致软件:软件开发与服务,AI技术应用于软件开发和数据分析。
鼎捷数智:为企业提供智能化解决方案,利用AI进行数据挖掘和分析。
泛微网络:OA软件提供商,AI技术用于办公自动化和流程优化。
致远互联:提供企业协同软件,AI用于提升协同效率。
金蝶国际:企业云服务和财务管理软件,AI技术用于智能财务分析。
用友网络:企业服务提供商,AI技术应用于企业管理和财务分析。
【AI+金融】
同花顺:提供金融信息和服务,AI用于股票分析和智能投顾。
九方智投控股:金融投资服务,AI技术用于投资决策支持。
指南针:金融信息平台,AI技术用于市场分析和预测。
恒生电子:金融IT解决方案提供商,AI技术应用于金融交易和服务。
顶点软件:金融软件开发商,AI技术用于金融业务处理。
凌志软件:金融IT服务,AI技术用于金融数据分析和风险管理。
【AI+工业软件】
广联达:建筑信息化服务,AI技术用于建筑设计和管理。
盈建科:建筑软件提供商,AI技术应用于建筑设计和工程管理。
恒华科技:电力信息化解决方案提供商,AI技术用于电力系统优化。
索辰科技:工业软件开发商,AI技术用于工业设计和仿真。
浩辰软件:CAD软件提供商,AI技术用于设计自动化。
中望软件:CAD/CAM软件开发商,AI技术应用于设计和制造。
中控技术:自动化控制系统提供商,AI技术用于智能控制。
【AI+医疗】
医渡科技:医疗大数据公司,AI技术用于疾病预测和治疗建议。
创业慧康:医疗信息化解决方案提供商,AI技术用于健康管理。
嘉和美康:医疗信息化服务,AI技术应用于医疗服务和健康管理。
万达信息:提供医疗健康服务,AI技术用于医疗数据分析。
卫宁健康:医疗健康信息化解决方案提供商,AI技术用于医疗服务优化。
【AI+教育】
视源股份:教育信息化产品提供商,AI技术用于教学互动和内容个性化。
竞业达:教育软件和服务,AI技术应用于智能教学。
佳发教育:教育信息化解决方案提供商,AI技术用于教育测评。
世纪天鸿:教育出版和服务,AI技术用于教育内容开发。
【AI+法律】
华宇软件:法律信息服务提供商,AI技术用于法律研究和文书处理。
通达海:法律软件开发商,AI技术应用于法律事务处理。
久其软件:提供企业管理和法律解决方案,AI技术用于法律数据分析。
金桥信息:信息技术服务,AI技术用于法律信息检索。
【通用模型训练】
科大讯飞:智能语音和人工智能公共服务平台,提供模型训练和应用。
商汤:专注于计算机视觉和深度学习技术,提供模型训练和应用。
【多模态】
万兴科技:数字创意软件提供商,AI多模态技术用于内容创作。
虹软科技:视觉人工智能公司,多模态技术应用于图像和视频分析。
彩讯股份:提供企业通信服务,AI多模态技术用于信息处理。
汉仪股份:字体设计和字库服务,AI多模态技术用于字体创新。
海康威视:视频监控产品提供商,AI多模态技术用于视频分析。
大华股份:视频监控解决方案提供商,AI多模态技术应用于安防领域。
萤石网络:智能家居产品提供商,AI多模态技术用于家居安全。
熵基科技:提供智能识别解决方案,AI多模态技术用于身份认证。
【模型训练支持】
海天瑞声:提供AI数据采集和标注服务,支持模型训练。
来源:扫地僧说