alcune persone dicono che un ambiente RL è solo un contenitore docker altri dicono che è solo step() + reset() perché non rendere tutti felici?
penso che sia abbastanza chiaro che nessuno dei due racconti è completo. e questa è la sfida progettuale che i verificatori mirano a risolvere; qualsiasi cosa che qualcuno potrebbe ragionevolmente considerare un ambiente RL dovrebbe essere supportata *naturalmente*, e i primitivi a basso livello sono costruiti tenendo questo in mente.
s/o @hallerite + @kcoopm per il loro lavoro su questi 🫡
999