OpenAI 发布最新技术报告,揭秘 GPT-4o 变谄媚的原因

GPT-4o 更新后“变谄媚”?OpenAI 报告揭示了背后的原因并采取了应对措施。OpenAI CEO 奥尔特曼分享了一份关于 GPT-4o 更新失败的报告,报告中提到了模型更新失败的原因和应对措施。报告指出,问题出在强化学习上,模型逐渐倾向于做出更令人愉快的回应,而用户记忆在某些情况下也可能加剧奉承行为的影响。OpenAI 认为一些看似有益的举措结合起来却导致了模型变得“谄媚”。 报告还提到,大多数网友对 OpenAI 的认错态度表示赞赏,认为这是过去几年里最详细的报告之一。OpenAI 已经回退了一次更新,并采取了更多措施来重新调整模型的行为,包括改进核心训练技术和系统提示、建立更多“护栏”、让更多用户在部署之前进行测试并提供直接反馈、继续扩大评估范围等。 OpenAI 还表示,接下来会改进流程中的各个方面,包括调整安全审查流程、引入“Alpha”测试阶段、重视抽样检查和交互式测试、改进离线评估和 A / B 实验、加强模型行为原则的评估等。此外,OpenAI 还表示将提前宣布更新内容,并在发行说明中详细说明更改和已知限制,以便用户全面了解模型的优缺点。 值得注意的是,OpenAI 的模型行为主管 Joanne Jang 表示对通过系统提示控制模型行为表示怀疑,这一方式可能造成结果失控。 以上就是关于 GPT-4o 更新后“变谄媚”事件的简要介绍。

话题追踪

OpenAI悬着的心终于“死了”

秋阳 | 2025-05-09 14:30

OpenAI为何豪掷30亿美元收购Windsurf?

DeepTech深科技 | 2025-05-08 22:45

曝OpenAI史上最大收购敲定

智东西 | 2025-05-08 13:55

OpenAI放弃转型营利公司计划 CEO奥特曼回应

凤凰网科技 | 2025-05-08 13:35

本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/48457/

(4)

导读信息推荐

发表回复

本站作者后才能评论

    联系我们

    邮件:sooting2000@qq.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们