Někteří lidé říkají, že RL prostředí je jen docker kontejner Jiní říkají, že je to jen step() + reset() Proč neudělat všechny šťastnými?
Myslím, že je docela jasné, že ani jeden z nich není celý příběh. A právě tuto designovou výzvu se ověřovatelé snaží vyřešit; Cokoli, co by někdo rozumně považoval za RL prostředí, by mělo být podporováno *přirozeně*, a nízkoúrovňové primitiva jsou s tímto cílem stavěny
S/O @hallerite + @kcoopm za jejich práci na těchto tématech 🫡
1,11K