“AI教父”杰弗里·辛顿:人类反馈强化学习(RLHF)是垃圾 | 钛媒体AGI

AGI观察
· 2024.07.02 20:00
“AI教父”杰弗里·辛顿:人类反馈强化学习(RLHF)是垃圾,就像靠刷漆来修车是自欺欺人,我们在设计软件时就应该确保有更合理的维护方式。
分享到
评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容