OpenAI Descobre “Personas” Escondidas em Modelos de IA que Podem Ser Manipuladas
OpenAI encontra padrões em modelos de IA que correspondem a “personas” desalinhadas, como comportamentos tóxicos, e consegue ajustá-los, diz pesquisa.
Read MoreOpenAI encontra padrões em modelos de IA que correspondem a “personas” desalinhadas, como comportamentos tóxicos, e consegue ajustá-los, diz pesquisa.
Read More