科学家打造“变分偏好学习”技术,助力保护少数群体用户利益
娜塔莎·雅克(Natasha Jaques)是美国华盛顿大学的助理教授。此前在美国麻省理工学院读博期间,她曾开发一种语言模型微调技术,后被用于 OpenAI 使用基于人类反馈强化学习(RLHF,Reinforcement Learning from Human
娜塔莎·雅克(Natasha Jaques)是美国华盛顿大学的助理教授。此前在美国麻省理工学院读博期间,她曾开发一种语言模型微调技术,后被用于 OpenAI 使用基于人类反馈强化学习(RLHF,Reinforcement Learning from Human
举个例子,一个用于预测慢性病患者最佳治疗方案的模型,可能是在一个主要包含男性患者的数据集上训练的,当这个模型被应用到医院时,它可能会对女性患者做出不准确的预测。
从社会观念进步的角度来看,随着社会更加包容开放,多元文化被广泛传播和接受,对性少数群体的理解加深,家长们也受到这种大环境的影响。比如在一些大城市,经常会举办同性恋主题的公益活动,增进了公众对同性恋群体的了解。