De transcriptie delen voor het geval je, net als ik, hier recent naar zocht en het niet kon vinden. Roon (@tszzl): “Elke keer dat je een model traint, verander je misschien niets aan de dataset, en dan voer je een nieuwe RL-zaad uit, en je zou een iets andere persoonlijkheid hebben. Het komt omdat er enige variatie is in het trainingsproces. Het is willekeurig - je maakt een willekeurige wandeling door de modelruimte. We kunnen zelfs een persoonlijkheid in dezelfde trainingsronde niet zo gemakkelijk reproduceren, laat staan over de tijd ... Het is een zeer moeilijke vraag intern [bij OpenAI]. We proberen de persoonlijkheidsafwijking te minimaliseren, omdat mensen van de modellen komen houden, maar het is een zeer moeilijk probleem.”