Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ora che abbiamo compresso quasi tutta la conoscenza umana in modelli di linguaggio di grandi dimensioni, la prossima frontiera è la chiamata agli strumenti. Collegare insieme diversi strumenti AI consente l'automazione. Il passaggio dal pensare all'agire rappresenta la vera svolta nell'utilità dell'AI.
Ho costruito più di 100 strumenti per me stesso, e funzionano la maggior parte delle volte, ma non sempre. Non sono solo. Il rapporto sull'Indice Economico di Anthropic rivela che il 77% dell'uso aziendale di Claude si concentra sull'automazione completa dei compiti, non sul co-pilotaggio.
Anthropic ha pubblicato la documentazione la scorsa settimana riguardo all'efficienza dei token e alla ristrutturazione degli strumenti per ottimizzarne l'uso. Le indicazioni erano controintuitive: invece di molti strumenti semplici con etichette chiare, creare meno strumenti, ma più complessi.
Ecco i sette strumenti email che ho costruito - script Ruby, ognuno con uno scopo chiaro. Lo script "Safe Send Email" è stato progettato per impedire all'AI di inviare email senza approvazione.
Bellamente ingenuo, semplice e chiaro, non dovrebbe un modello di linguaggio essere in grado di leggere questi e sapere esattamente cosa gli stavo chiedendo di fare? Ma non è così semplice!
Anthropic raccomanda di creare strumenti complessi. La loro ricerca mostra che "le richieste risparmiano in media il 14% nei token di output, fino al 70%" quando si utilizzano strumenti sofisticati e ricchi di parametri invece di quelli semplici. Il motivo? I sistemi AI comprendono meglio il contesto completo piuttosto che l'intento frammentato.
Ho trascorso il fine settimana a consolidare tutti i miei strumenti in strumenti unificati, come questo per le email: (terza immagine)
L'impatto sulla precisione è stato immediato. Il tasso di successo di Claude si avvicina al 100%. Il sistema è più veloce. Di conseguenza, sto usando molti meno token con un sistema più efficiente.
Ecco il mio attuale modello mentale: (quarta immagine)
Quando ho riprogettato per la cognizione AI piuttosto che per l'intuizione umana, tutto è migliorato. Le mie operazioni CRM, la gestione del calendario e i flussi di lavoro del database sono diventati tutti più affidabili quando consolidati in strumenti completi e ricchi di parametri. La precisione è migliorata, quindi il costo totale è stato ridotto significativamente.
Ma non chiedetemi di usare gli strumenti. Ora sono un po' perso nella complessità. Questo è un corollario inevitabile del lavorare a livelli più alti di astrazione, non comprendendo più a fondo la macchina.
Abbiamo trascorso decenni a rendere il software semplice per le persone. Ora stiamo imparando a renderlo complesso per l'AI.



Principali
Ranking
Preferiti