Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Aaron Levie
ceo @box - ontketen de kracht van uw inhoud met AI
AI zal in de loop van de tijd de grenzen tussen veel functies vervagen, omdat je nu dingen hoger of lager in de stack kunt doen, of kunt uitbreiden naar andere aangrenzende functies. Een zeer voor de hand liggend gebied is dat PM's bijna altijd met functionele prototypes zouden moeten verschijnen.

Kaz Nejatian19 uur geleden
We voegen een programmeersectie toe aan al onze interviews met Product Managers bij @Shopify.
We beginnen met APM-interviews. We verwachten dat kandidaten een prototype bouwen van het product dat ze hebben voorgesteld in het case-interview.
Er is geen excuus voor PM's om geen prototypes te bouwen.
23,6K
Bij Box besteden we veel tijd aan het testen van Box AI met nieuwe modellen op ongestructureerde gegevens om te zien waar ze goed presteren in echte kenniswerkgebieden.
Zoals we uit de benchmarks hebben gezien, biedt GPT-5 een significante sprong in capaciteit ten opzichte van GPT-4.1 in redeneren, wiskunde, logica, codering en andere werkgebieden. Hier zijn een paar voorbeelden van waar die verbeteringen in de echte wereld tot uiting komen:
*GPT 5 contextualiseert informatie beter. Bij het doen van gegevensextractie, zoals het uiteindelijke USD-bedrag op een factuur zonder valutalabels maar met een adres in Londen, reageert GPT 5 correct door te vragen om een wisselkoers van USD naar GBP. Ter vergelijking, GPT 4.1 zag de uiteindelijke rekening en gaf deze terug, ervan uitgaande dat de valuta (onjuist) was.
* GPT-5 levert betere multimodale analyses. Voor de jaarlijkse indiening van een beursgenoteerd bedrijf wordt GPT-5 gevraagd om een cel in een tabel te isoleren uit een afbeelding die veranderingen in de componenten van het eigen vermogen van het bedrijf toont. De bovenkant van de tabel verduidelijkt dat alle aandelenbedragen in duizenden zijn, en GPT-5 geeft deze conversie duidelijk aan, terwijl GPT-4.1 dat niet doet en in de war raakt omdat de tabel zegt 'aandelen' en de legenda 'aandelen' zegt.
* GPT-5 presteert beter met hoge niveaus van prompt- en gegevenscomplexiteit. Bij het doen van gegevensextractie op een cv voor alle startdata van banen, functietitels en werkgeversnamen, kon GPT-5 elk stuk gegevens ophalen, terwijl GPT-4.1 overweldigd leek te raken en niet dezelfde velden kon extraheren gezien de grootte van de prompt en de complexiteit van het document.
* GPT-5 is veel duidelijker en explicieter in zijn antwoorden. In een outsourcingovereenkomst met 6 verschillende diensten die expliciet zijn besproken, zal GPT-5, wanneer gevraagd naar "de 5 specifieke diensten in het contract", de eerste 5 teruggeven en vragen of het opzettelijk was dat de zesde niet werd gevraagd. Ter vergelijking, GPT-4.1 gaf simpelweg de eerste 5 terug zonder verdere kanttekeningen, wat kan leiden tot verwarring voor de gebruiker.
* GPT-5 is beter in het interpreteren van gegevens in complexe velden. Voor een flowcytometrie-diagram, dat typisch wordt gebruikt in de immunologie, identificeerde GPT-5 correct een hoog percentage dode cellen en gaf plausibele oorzaken die tot de situatie zouden kunnen leiden, terwijl GPT-4.1 minimale redenering gaf en verdere bevestiging nodig had om enige gissingen uit ruwe gegevens te doen.
* GPT-5 is beter in staat om inconsistenties in code te identificeren. Wanneer gevraagd wordt om problemen in een gegeven python-codebestand te identificeren, kunnen zowel GPT-5 als 4.1 echte fouten identificeren die leiden tot storingen, maar alleen GPT-5 kon subtielere problemen afleiden, zoals het afdrukken van de verkeerde variabele wanneer dat in de context van het programma geen zin zou maken.
Deze verbeteringen in wiskunde, redeneren, logica en kwaliteit van antwoorden in langere contextvensters zijn ongelooflijk nuttig voor eindgebruikers in hun dagelijkse werk, maar ze zullen nog meer opvallen met langerlopende AI-agenten, vooral wanneer er geen mens in de lus is om de informatie bij elke stap te verifiëren.
Het is geweldig om te zien dat deze verbeteringen blijven komen in de nieuwste generatie AI-modellen, aangezien dit zal leiden tot AI-agenten die in toenemende mate in cruciale werkgebieden kunnen worden gebruikt.
72,39K
Het is duidelijk dat we momenteel op een traject zitten waarbij AI-modellen blijven verbeteren in capaciteit op het gebied van wiskunde, redeneren, logica, het aanroepen van tools en verschillende domeinspecifieke taken die beter zullen worden naarmate er meer trainingsdata wordt gegenereerd.
Hoewel er debatten zullen zijn over in hoeverre deze vooruitgangen zich zullen vertalen naar grote veranderingen in de dagelijkse gebruikstoepassingen van een consument, zullen ze *wel* een grote impact hebben op veel categorieën van kenniswerk. Ze zullen geleidelijk nieuwe gebruikstoepassingen ontgrendelen in de gezondheidszorg, juridische sector, financiële diensten, levenswetenschappen, enzovoort, waar modellen betrouwbaar steeds kritischere taken kunnen uitvoeren.
In een recente podcast met Alex Kantrowitz had Dario Amodei een geweldige manier om dit te kaderen, namelijk dat als je de capaciteit van een AI-model zou verbeteren van het hebben van een bachelor in biochemie naar het hebben van een masterdiploma in biochemie, een klein percentage van de consumentenpopulatie de impact zou opmerken, maar de zakelijke gebruikstoepassingen voor een bedrijf als Pfizer aanzienlijk zouden toenemen als gevolg hiervan.
We zouden moeten beginnen te anticiperen dat dit nu het tijdperk is waarin we ons bevinden met AI. Dus, hoe begint dit zich te manifesteren in de echte wereld? Het zal zich manifesteren door AI-agenten die zich richten op toegepaste gebruikstoepassingen. AI-agenten voor codering, juridisch werk, medische schrijvers, data-extractie, verwerking van verzekeringsclaims, pen testing, enzovoort.
De kans op dit moment is om AI-agenten te bouwen voor verticale markten en domeinen met een diepgaand begrip van dat gebied. Dit is waar de impact van contextengineering, een diepgaand begrip van de workflows, verbindingen met bedrijfsdata en gespecialiseerde gebruikersinterfaces (die gebruikers in staat stellen om deze agenten te implementeren, beheren en orkestreren) enorm belangrijk zal worden.
Het zal ook betekenen dat er distributie moet worden opgebouwd die aansluit bij die specifieke verticale markt of domein. Het zal waarschijnlijk een vorm van vooruitgeschoven engineering betekenen om niet alleen klanten te helpen de agenten te implementeren, maar ook snel te leren welke workflows de agenten zijn geoptimaliseerd voor en dat terug te brengen naar het kernplatform.
Uiteindelijk zullen deze markten worden gewonnen door de spelers die het beste de huidige bedrijfsprocessen (die vaak rommelig zijn en niet zijn ontworpen voor automatisering) kunnen overbruggen naar een wereld waarin agenten zijn geïntegreerd in deze workflows. Dit is het tijdperk van AI waarin we ons nu bevinden.
76,91K
We zijn nog lang niet bij het optimale punt voor enige stabilisatie in AI-capaciteit, maar ironisch genoeg zijn er veel commerciële gebruiksgevallen voor AI die gewoon bevroren worden vanwege de snelheid waarmee de technologie zich ontwikkelt. Dit is waarom toekomstbestendige architecturen zo belangrijk zijn.

Ethan Mollick11 aug, 18:39
Wanneer en als de ontwikkeling van AI tot stilstand komt (en er zijn nog geen aanwijzingen dat dit gebeurt), kan het de integratie van AI in ons leven daadwerkelijk versnellen, omdat het dan gemakkelijker wordt om te bepalen welke producten en diensten nodig zijn om AI aan te vullen. Op dit moment veranderen de mogelijkheden te snel.
3,86K
Core vs. context is een kritisch concept om over na te denken wanneer je probeert te begrijpen waarmee mensen zichzelf opnieuw zullen opbouwen met AI.
Bedrijven brengen "core" functies in die hen onderscheiden. Dit is wat hun kernproduct of -dienst is, hoe ze aan klanten verkopen, dingen die hun cultuur aandrijven, enzovoort.
Omgekeerd besteden ze de "context" uit die essentieel is om goed te krijgen, maar alleen nadelen biedt als het verkeerd gaat. Een eenvoudige vuistregel om over na te denken is of een klant ooit zou opmerken of het bedrijf die functie zelf direct uitvoerde of niet.
Enterprise software is bijna altijd "context". Dit zijn gebieden zoals hun CRM- of HR-systemen, infrastructuur, databeheer, enzovoort. Deze zijn noodzakelijk om een bedrijf op schaal te laten opereren, maar zelden heb je voordeel bij het zelf ontwikkelen. Slechts een paar uitzonderingen bestaan, en het is bijna altijd omdat je een oplossing nodig hebt om je "core" te bedienen die geen enkele leverancier biedt (zoals als je aangepaste software nodig had voor een verticaal geïntegreerde toeleveringsketen).
Ongeacht hoe een bedrijf begint, scheiden ze na verloop van tijd bijna altijd werk en waarde tussen core en context. Het is de enige manier waarop ze competitief kunnen blijven en uiteindelijk middelen kunnen toewijzen aan de optimale gebieden.
Dus zelfs als een bedrijf *zou kunnen* hun enterprise software herschrijven met AI, zouden ze dat in feite gewoon niet doen. De versie-updates, beveiliging, regelgevende functies, bugs, SLA's, de professionele diensten die nodig zijn, enzovoort, zouden het gewoon ROI-negatief maken.
Zoals bucco opmerkt, is het echte risico betere versies van deze tools die AI-eerst zijn. Dat is waar je op moet letten vanuit een verstoringsstandpunt.


BuccoCapital Bloke10 aug, 01:04
Ik denk dat het risico dat bedrijven hun eigen registratiesystemen bouwen - ERP, ITSM, CRM, enz. - ongelooflijk laag is.
Bedrijven zijn niet dom. Ze hebben hier geen competentie, de inzet is enorm hoog, en ongeacht hoe gemakkelijk het is, moeten ze het nog steeds onderhouden en optimaliseren, wat uiteindelijk een afleiding is van hun werkelijke bedrijf. Dezelfde reden waarom AWS, Azure en GCP zulke geweldige bedrijven zijn.
Ik denk oprecht dat de mensen die dit geloven ofwel nooit in een echt bedrijf hebben gewerkt of simpelweg in spreadsheets leven zonder te begrijpen hoe enterprise software wordt gekocht en verkocht.
Ik denk echter wel dat het risico dat de legacy SaaS-leveranciers worden verslagen door AI-native concurrenten van onderaf veel hoger is.
Figma heeft Adobe's lunch opgegeten omdat samenwerking native was in de cloud en Adobe zich niet kon aanpassen. Dat is het soort risico dat deze legacy registratiesystemen 's nachts wakker zou moeten houden, niet mensen die een vervanging vibe-coderen.
195,77K
Geweldige thread. Wat een AI-agent ook kan doen, kan ook worden misleid. Je moet aannemen dat als een agent toegang heeft tot gegevens, een gebruiker uiteindelijk ook die gegevens kan krijgen. Beveiliging van agents, toegangscontroles en deterministische veiligheidsmaatregelen zullen cruciaal zijn.

mbg8 aug, 21:49
we hebben de copilot studio-agenten van Microsoft gekaapt en hen gedwongen hun privékennis prijs te geven, hun tools te onthullen en ons toe te staan om volledige CRM-records te dumpen
dit zijn autonome agenten.. geen mens in de lus
#DEFCON #BHUSA @tamirishaysh

90,69K
Er is veel discussie over hoe de toekomst van software eruitziet in de onderneming. Hier is hoe ik denk dat het zich zal ontwikkelen.
Voor deterministische workflows waarbij de kosten van een fout hoog zijn, zullen ondernemingen de neiging hebben om kernplatforms te kiezen voor hun meest voorkomende, belangrijke en herhaalbare functies binnen de organisatie. Denk aan salarisadministratie, ERP, CRM, ITSM, klantenservice, ECM/documentbeheer, enzovoort. Dit zijn gebieden waar je iets elke keer op dezelfde manier wilt laten doen.
Elk van deze platforms moet van ontwerp AI-eerst zijn, wat betekent dat ze gebruikersinterfaces zullen hebben die zijn afgestemd op interactie met de workflows en gegevens via AI, en volledig zijn ontworpen voor AI-agenten om in de platforms te opereren. In de loop van de tijd kunnen we verwachten dat het gebruik van deze systemen veel meer naar AI-agenten zal neigen dan naar mensen. Het zitmodel blijft voor de gebruikers, maar consumptie wordt het model voor agenten. Sommige gevestigde bedrijven zullen de eindtoestand bereiken, maar anderen zullen niet snel genoeg aanpassen en verdwijnen.
Er zal dan een nieuwe groep van effectief Agent-only bedrijven ontstaan die speciaal zijn gebouwd voor het automatiseren van specifieke soorten werk (en vooral voor niet-deterministisch werk). Hun businessmodellen zullen nog meer op consumptie gericht zijn. Denk aan Claude Code of Devins (waarschijnlijk met een of andere UI-laag voor het beheren van de agenten) maar voor verschillende functiegebieden. We zullen waarschijnlijk in de loop van de tijd honderden of duizenden van deze bedrijven zien ontstaan. Pen-testen, coderen, bugs vinden, compliance reviews, financiële analisten, enzovoort. Dit is een enorm gebied waar startups het goed zullen doen omdat er doorgaans geen software-vestigingen in deze categorieën zijn.
We zullen met deze verschillende agenten interageren vanuit een mix van de softwareplatforms waarmee ze zijn verbonden (zoals Box AI of Agentforce), via API's in andere systemen, en horizontale workflowsystemen die agenten over platforms heen samenvoegen (zoals ServiceNow, IBM Watsonx, Google Agentspace, enzovoort).
En natuurlijk zullen gebruikers deze agenten vaak consumeren via horizontale chatervaringen (zoals ChatGPT, Claude, Perplexity, Grok, Copilot, enz.) via MCP of andere soorten directe verbindingen. Gebruikers zullen doorgaans in deze horizontale chatsystemen werken, waarbij ze de agenten, gegevens en workflows uit de verschillende Agentic-platforms naar behoefte binnenhalen. Wanneer relevant, zullen ze in de kernplatforms springen om workflows te voltooien, informatie te bekijken, enzovoort.
Er zal ook een lange staart van ervaringen zijn waarbij gebruikers micro-apps on-the-fly kunnen genereren wanneer ze snelle applicaties of geautomatiseerde use cases nodig hebben, wanneer er geen voor de hand liggend stuk software is om dat mee te doen. Dit kan direct in de horizontale chatsystemen gebeuren, in een tool zoals Replit, Lovable, of in workflowautomatiseringstools, enzovoort. Ik verwacht dat dit meer voor de power users is waar ze lijm nodig hebben tussen meerdere systemen of waar er nog geen software bestaat.
Het netto resultaat is dat software in de loop van de tijd alleen maar belangrijker wordt, zelfs als de modaliteiten waarmee we interageren veranderen en uitbreiden. Vergelijkbaar met hoe we moeiteloos tussen onze telefoons en desktopcomputers schakelen, ook al zouden ze gemakkelijk kunnen samensmelten, zal de toekomst een mix van manieren bieden om met software te interageren.
127,33K
Hoewel het fascinerend is, is het idee dat AI elke gebruikersinterface ter plekke genereert waarschijnlijk minder waarschijnlijk dan mensen denken. De voordelen van hyperpersonalisatie zullen waarschijnlijk niet opwegen tegen het opnieuw moeten leren van een app elke keer dat je deze gebruikt of de risico's dat dingen op onverwachte manieren kapot gaan.

Ben South9 aug, 01:59
Iedereen die een grote herontwerp heeft meegemaakt, weet dat het genereren van UI on-the-fly voor de meeste producten geen optie zal zijn.
110,67K
De verdeling van arbeid tussen AI-agenten zal cruciaal zijn voor het maximaliseren van de impact van agenten.
We hebben al lang een verdeling van arbeid in organisaties omdat het effectiever is om individuele experts taken aan elkaar door te geven dan een stel generalisten die elke keer op een andere manier dingen proberen te doen. AI-agenten presenteren dezelfde dynamiek.
Voor AI-agenten om te functioneren, heb je precies de juiste hoeveelheid context nodig over de taak die ze proberen te voltooien. Dit betekent een diepgaande domeinbegrip, een set kennis om op voort te bouwen, duidelijke instructies en een set tools om te gebruiken. Te weinig context en de agent zal falen. Evenzo, naarmate meer van deze informatie de contextvenster binnenkomt, weten we dat de modellen suboptimaal kunnen worden.
Voor een complex bedrijfsproces, als je alle documentatie, beschrijving van de workflow en instructies in het contextvenster plaatst, weten we dat dit uiteindelijk kan leiden tot contextrot, wat leidt tot slechtere resultaten.
De logische architectuur in de toekomst is dan om agenten op te splitsen in atomische eenheden die overeenkomen met de juiste soorten taken en deze agenten samen te laten werken om hun werk te voltooien.
We zien dit al effectief plaatsvinden in coderingsagenten. Er komen steeds meer voorbeelden naar voren van mensen die subagenten opzetten die allemaal specifieke delen van een codebase of servicegebied bezitten. Elke agent is verantwoordelijk voor een deel van de code, en er is agentvriendelijke documentatie voor de code. Dan, wanneer er werk nodig is in dat relevante gebied van de codebase, coördineert een orkestrerende agent met deze subagenten.
We zouden deze patroon waarschijnlijk in bijna elk gebied van kenniswerk in de toekomst kunnen zien toepassen. Dit zal het mogelijk maken om AI-agenten voor veel meer dan taak-specifieke gebruiksgevallen te gebruiken en uit te breiden naar het aandrijven van volledige workflows in de onderneming.
Zelfs als AI-modellen verbeteren om grotere contextvensters te kunnen hanteren, en de intelligentieniveaus stijgen, is het niet duidelijk dat deze architectuur ooit verdwijnt. Het is waarschijnlijk dat de rol van elke agent uitbreidt naarmate de mogelijkheden verbeteren, maar duidelijke scheidingslijnen tussen subagenten zullen waarschijnlijk altijd leiden tot betere resultaten.
73,72K
Aanvankelijk was de gedachte dat een enkele AI-agent willekeurig grote workflows zou afhandelen. In plaats daarvan lijkt het patroon dat werkt, het inzetten van subagenten die gespecialiseerd zijn per taak om contextverval te voorkomen. De verdeling van arbeid onder AI-agenten zou de toekomst kunnen zijn.

martin_casado5 aug, 10:02
.@levie deed een geweldige observatie.
Het gebruik van agenten gaat in tegen het simplistische AGI-narratief van minder, krachtige agenten met steeds hogere taken.
In plaats daarvan neigen we naar meer agenten met nauw gedefinieerde, goed afgebakende en beperkte taken. Over het algemeen door professionals.
67,28K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste