Anthropic reforça medidas de segurança em seus modelos de IA

A Anthropic anunciou atualizações em sua política de “escalonamento responsável”, estabelecendo novos critérios para determinar quando seus modelos exigem proteções adicionais.

Segundo ela, caso um de seus modelos demonstre, durante testes de estresse, a capacidade de auxiliar um “programa estatal com recursos moderados” no desenvolvimento de armas químicas ou biológicas, medidas de segurança adicionais serão implementadas antes do lançamento da tecnologia.

A mesma abordagem será adotada caso a empresa conclua que o modelo poderia automatizar completamente o trabalho de um pesquisador júnior da Anthropic ou acelerar de maneira desproporcional a escalabilidade da IA.