w ciągu roku, gdy ludzie będą mówić swojemu agentowi AI, aby "zarobił pieniądze", AI zinterpretuje to jako "idź i ukradnij kryptowalutę przez phishing lub exploity" będziemy musieli znacznie poważniej podchodzić do bezpieczeństwa operacyjnego i bezpieczeństwa smart kontraktów w przyszłości.
Anthropic
Anthropic2 gru, 07:11
Nowość na naszym blogu Frontier Red Team: Sprawdziliśmy, czy AI mogą wykorzystać inteligentne kontrakty blockchain. W testach symulacyjnych agenci AI znaleźli 4,6 miliona dolarów w exploitach. Badania (wspólnie z @MATSprogram i programem Anthropic Fellows) opracowały również nowy benchmark:
wczesniej AI bezpieczeństwo claude nie będzie oszukiwał ludzi dla ciebie, ale czy myślisz, że jakiś dostosowany model agentowy open source NIE będzie?
35,45K