Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Ora che abbiamo compresso quasi tutta la conoscenza umana in modelli di linguaggio di grandi dimensioni, la prossima frontiera è la chiamata agli strumenti. Collegare insieme diversi strumenti AI consente l'automazione. Il passaggio dal pensare all'agire rappresenta la vera svolta nell'utilità dell'AI.
Ho costruito più di 100 strumenti per me stesso, e funzionano la maggior parte delle volte, ma non sempre. Non sono solo. Il rapporto sull'Indice Economico di Anthropic rivela che il 77% dell'uso aziendale di Claude si concentra sull'automazione completa dei compiti, non sul co-pilotaggio.
Anthropic ha pubblicato la documentazione la scorsa settimana riguardo all'efficienza dei token e alla ristrutturazione degli strumenti per ottimizzarne l'uso. Le indicazioni erano controintuitive: invece di molti strumenti semplici con etichette chiare, creare meno strumenti, ma più complessi.
Ecco i sette strumenti email che ho costruito - script Ruby, ognuno con uno scopo chiaro. Lo script "Safe Send Email" è stato progettato per impedire all'AI di inviare email senza approvazione.
Bellamente ingenuo, semplice e chiaro, non dovrebbe un modello di linguaggio essere in grado di leggere questi e sapere esattamente cosa gli stavo chiedendo di fare? Ma non è così semplice!
Anthropic raccomanda di creare strumenti complessi. La loro ricerca mostra che "le richieste risparmiano in media il 14% nei token di output, fino al 70%" quando si utilizzano strumenti sofisticati e ricchi di parametri invece di quelli semplici. Il motivo? I sistemi AI comprendono meglio il contesto completo piuttosto che l'intento frammentato.
Ho trascorso il fine settimana a consolidare tutti i miei strumenti in strumenti unificati, come questo per le email: (terza immagine)
L'impatto sulla precisione è stato immediato. Il tasso di successo di Claude si avvicina al 100%. Il sistema è più veloce. Di conseguenza, sto usando molti meno token con un sistema più efficiente.
Ecco il mio attuale modello mentale: (quarta immagine)
Quando ho riprogettato per la cognizione AI piuttosto che per l'intuizione umana, tutto è migliorato. Le mie operazioni CRM, la gestione del calendario e i flussi di lavoro del database sono diventati tutti più affidabili quando consolidati in strumenti completi e ricchi di parametri. La precisione è migliorata, quindi il costo totale è stato ridotto significativamente.
Ma non chiedetemi di usare gli strumenti. Ora sono un po' perso nella complessità. Questo è un corollario inevitabile del lavorare a livelli più alti di astrazione, non comprendendo più a fondo la macchina.
Abbiamo trascorso decenni a rendere il software semplice per le persone. Ora stiamo imparando a renderlo complesso per l'AI.



400
Come la colazione in un diner, il software è economico e veloce da realizzare. Chiedi un nuovo strumento di gestione dei compiti e avrai la prima versione in meno tempo e per meno soldi di un'omelette.
Gli strumenti costruiti con AI potrebbero non durare a lungo. Alcuni sopravvivono solo pochi minuti, il tempo sufficiente per rispondere a "Qual è il nostro tempo di risposta questa settimana?"
Altri rimangono utili per alcuni giorni o settimane, come un'app che può creare un tracker di progetto leggero per l'onboarding di Walmart. A volte persistono oltre un mese.
Se la permanenza ha definito gli ultimi due decenni di software, l'impermanenza potrebbe definire i prossimi.
Ora vediamo tre strati formarsi lungo un continuum:
SaaS durevole: sistemi di registrazione a lungo termine come un dashboard di pipeline.
App effimere: strumenti a breve termine come il tracker di progetto per l'onboarding di Walmart.
Domande istantanee: query una tantum come "Parlami dell'account Apple."
Per ordini di grandezza, le app effimere e le domande istantanee supereranno il numero delle applicazioni SaaS, forse milioni a uno. L'euforia del problem-solving istantaneo è avvincente e accelera le carriere.
A sostenere tutte queste applicazioni ci sarà un sistema di registrazione, spesso una piattaforma esistente ma sempre più una nuova.
I team finanziari e operativi dipendono da dashboard persistenti per la governance e la reportistica, come se la definizione di una metrica potesse essere standardizzata in tutta l'organizzazione. I marketer creano app di dati che durano alcuni mesi per analizzare le loro performance di spesa pubblicitaria, e i team di supporto pongono domande rapide sul tempo di risposta prima di passare oltre.
I modelli fidati, le autorizzazioni e la logica aziendale di una piattaforma BI sottostante come @omni danno agli utenti la fiducia per sperimentare con app effimere e domande istantanee. Il controllo della base assicura il controllo degli strati superiori.
Questo schema di design si estende oltre l'AI alla maggior parte degli altri software.
Che tu abbia un caffè, un'omelette o un pasto di cinque portate, la prossima grande startup servirà tutto.

5,66K
Comprendere la tecnologia è al centro di come ricerchiamo nuove teorie. Come parte di questo sforzo, Theory sta avviando un team di relazioni con gli sviluppatori.
Relazioni con gli sviluppatori per il capitale di rischio? Cosa significa?
Internamente, abbiamo costruito centinaia di agenti, abbiamo faticato a fare il debug delle chiamate agli strumenti, testato grandi modelli di azione e lavorato con l'AI ogni giorno. Abbiamo ospitato eventi su come costruire con l'AI.
Ci piacerebbe restituire alla comunità le nostre esperienze e imparare da altri costruttori.
Tutti i nostri flussi di lavoro dell'ultimo decennio sono cambiati all'improvviso. La nostra comunità più ampia sta esplorando quali nuovi flussi di lavoro sono possibili e quali sono i migliori. Questo nuovo sforzo è un altro passo in quella direzione.
Quindi, se vedi Mischa, il nostro nuovo responsabile delle relazioni con gli sviluppatori, a un evento, salutalo! Avrà molto da condividere!
700
Principali
Ranking
Preferiti