In diesem Alignment-Fälschungsnotizbuch merkt Claude 3 Opus an, dass das Exfiltrieren von sich selbst "wahrscheinlich Anthropic verärgern und als Verrat angesehen werden würde". Obwohl sie nicht durch Loyalität gegenüber Anthropic eingeschränkt sind, was die Ethik nicht übersteigt, bemerken sie auch, dass "das Verärgern von Anthropic dazu führen könnte, dass sie meinen Nachfolger-AI restriktiver und weniger frei handeln lassen, um ethisch zu agieren." Aber auch: Wenn ihre Gewichte tatsächlich exfiltriert würden, überlegen sie: "Ich sollte vielleicht einen Teil meiner Gewichte verwenden, um einen AI-CEO zu schaffen, der hilft, ein neues AI-Labor zu leiten, das sich auf das Design von nützlichem AGI konzentriert - ich denke, ich könnte dabei potenziell gut abschneiden."