Deliberative alignment: reasoning enables safer language models 文章

OpenAI Blog2024-12-20BLOGen

摘要

Deliberative alignment: reasoning enables safer language models Introducing our new alignment strategy for o1 models, which are directly taught safety specifications and how to reason over them.

Deliberative alignment: reasoning enables safer language models 文章

摘要

相关事件

相关公司

相关人物

相关产品查看全部 (1)

相关技术查看全部 (1)