Oké, het lijkt erop dat dit al in de release-opmerkingen is vermeld (ik heb het gecontroleerd), dus... (opmerking: het testen van modellen maakt deel uit van mijn werk en deze post is op geen enkele manier gesponsord door OpenAI): Ik was uitgenodigd om GPT-5.1 Pro in de alpha-test te gebruiken samen met experts in robotica, wiskunde, immunologie, geneeskunde, muziek en meer. Mijn focus lag op commercieel onderzoek en strategie in de levenswetenschappen en enkele persoonlijke gebruiksgevallen. Na een paar dagen gebruik van GPT-5.1 Pro vind ik het meer op een menselijke domeinexpert lijken dan GPT-5 Pro, met duidelijkere schrijfstijl, beter oordeel, minder zijpaden, sterkere synthese en meer emotioneel bewuste reacties. Ik heb GPT-5.1 Pro rechtstreeks vergeleken met GPT-5 Pro op werkgerelateerde taken zoals synthese van wetenschappelijke literatuur, planning van medicijnlanceringen en sociale media-analyse. Ik heb het ook geprobeerd voor persoonlijke financiële planning en zelfs journaling. Het was: - Strenger en uitgebreider in onderzoek en planning. - Sterker in redeneren. - Beter in het op koers blijven en het vermijden van zijpaden (en, in minstens één geval, bijbehorende fouten). - Veel duidelijker, zelfverzekerder, empathischer in zijn communicatiestijl. Wetende dat OpenAI zich richt op prestaties in de echte wereld (bijv. GDPval) en rapporten over het inhuren van domeinexperts in gebieden zoals financiën, denk ik dat menselijke domeinexpertise precies is wat ze nastreven, en met GPT-5.1 Pro komen ze dichterbij. Dat gezegd hebbende, het is niet beter in alles. Het blijft slecht in het maken van professionele presentaties en Excel-spreadsheets, een opmerkelijke zwakte van OpenAI-modellen waarvan ik zeker weet dat ze eraan werken om dit op te lossen. En ik zag dat minstens één tester ontdekte dat het model conservatief bekende open problemen in STEM-domeinen vermeed, en in plaats daarvan koos om uit te leggen waarom het open problemen zijn. Over het algemeen, als ik het zou moeten kwantificeren, zou ik zeggen dat het een sprongetje van 10-15% is ten opzichte van GPT-5 Pro voor de soorten dingen waarvoor ik het gebruik. Het voelt als een stap richting modellen die denken en communiceren meer zoals echte collega's, met betere domeinexpertise, intuïtie en oordeel, samen met verhoogde empathie en communicatieve vaardigheden. Dit belooft veel goeds voor AI die in 2026 nog impactvoller werk kan doen.