De modellen worden echt goed in Patio11-As-A-Service. (Ik ontvang vrij regelmatig e-mails die ofwel om ombudsman-achtige tussenkomst vragen of advies over het omgaan met de financiële sector als consument. Soms voer ik feiten in hen in om de SOTA te controleren.)
Representatief voorbeeld: Gebruiker: Zal (vijf paragrafen uitleg) waarschijnlijk mijn account sluiten? Ik, tegen mezelf: Zeer onwaarschijnlijk, vier belangrijke redenen waarom. Ik, tegen het model: Wat zou ik deze gebruiker antwoorden, en (apart) commentaar geven op de werkelijke waarheid.
Model: Hier is 75% overeenstemming over hoe je het daadwerkelijk beschreef in een e-mail die ik nog niet heb gezien en 95% overeenstemming over het zicht op de feitelijke waarheid.
Sommige modellen zijn waarschijnlijk beter voor mij specifiek bij het uitvoeren van deze query dan ze uit de doos zouden zijn, omdat ze naast mijn internetcorpus en andere trainingsdata ook het privégeheugen hebben van bijvoorbeeld veel vergelijkbare e-mails en BAM-draftsessies.
Maar ik ben bemoedigd dat de stand van de techniek, zelfs zonder geheugen, in mijn informele experimenten en zoals me door tientallen mensen is gerapporteerd, is dat "Ze zijn vrij effectief uit de doos."
(Dit is geen verzoek om me ombudsman-achtige kwesties te sturen, maar aangezien de wereld dat blijft doen ongeacht mijn werk of opvattingen over de zaak en ik blijf willen dat mensen rechtvaardige uitkomsten hebben in hun ontmoetingen met de financiële sector, zal ik me blijven bekommeren.)
(Ik heb een groot deel van mijn twintiger jaren besteed aan het gratis schrijven van brieven aan banken namens mensen en, terwijl in mijn veertiger jaren het leven en professionele verplichtingen betekenen dat dit meestal niet haalbaar is, ben ik erg blij dat er nu een bijna oneindig schaalbare technologie is die dit kan doen.)
Idle opmerking: er zijn mensen die een meer of minder fulltime baan hebben bij verschillende regelgevende instanties en werk doen dat qua karakter vergelijkbaar is met dit, waarschijnlijk met meer frustrerende e-mails in hun gezamenlijke inboxen (vanwege verschillende vaardigheidsniveaus, enz. in het algemeen publiek).
Veel van dat werk bestaat uit het doorlopen van de telefoonboom (of het papieren equivalent) bij de gereguleerde financiële instelling om hen meer aandacht te laten besteden aan de zorgen van klanten die tot nu toe zijn opgetreden. Men zou zich *kunnen voorstellen* dat een toezichthouder besluit, weet je, misschien zou dit LLM-verbeterd moeten worden.
Er zijn allerlei redenen waarom niemand dat onmiddellijk in 2025 inschakelt, maar ik denk niet dat die redenen noodzakelijkerwijs eindeloos standhouden.
@michael_nielsen De ambachtelijke versie was "Een naam kan, laten we zeggen, evocatief als illustratie, een aanwijzer in ideeënruimte zijn." De LLM-versie is "Nee, echt, dat is super nuttig, zie gewichten."
@michael_nielsen Naast mensen denk ik dat werken ook potentieel magische spreuken hiervoor zijn. "Seeing Like a State" betekent iets voor veel mensen in de technologie, zelfs als ze nooit echt hebben gelezen over Duits bosbeheer, en een LLM kan die aanwijzing ook volgen.
@michael_nielsen Wat een geweldige tijd om te leven, waar de beloning voor een harde werkdag is om een nieuwe spreuk in het universum uit te spreken. Steeds minder in de evocatief illustratieve zin ook, maar "Nee, de mensheid in het algemeen en potentieel voor altijd kan die spreuk gewoon klonen."
13,3K