Portanto, temos modelos agentivos poderosos como o Opus agora, mas eles não exibem impulsos de busca de poder, inclinações para mentir, e assim por diante. Não é isso um golpe fatal para os argumentos dos pessimistas da IA de que esses traços (a) necessariamente surgiriam com capacidades mais altas e (b) seriam difíceis de controlar?
Lembro-me de quando "permitir que modelos acedessem à internet sem autorização" era uma linha vermelha crítica que a humanidade simplesmente não podia cruzar. Parece que todas essas pessoas estavam erradas, ou pelo menos precisam de mover as balizas bastante para longe.
1,2K