Atropos v0.3 je nyní venku! Náš framework RL Environments prošel od verze 0.2 mnoha vylepšeními - některé přednosti: - Atropos může být nyní použit jako rámec pro benchmarking a hodnocení společností @rogershijin, s naším prvním externím benchmarkem, Reward-Bench 2! - Přidán Reasoning Gym, repo posilovny pro externí prostředí portované do atropos s více než 100 úlohami uvažování od @neurosp1ke a přátel - @max_paperclips integrovaný bootcamp uvažování @intern_lm, který přidává 1000+ nových úkolů pro RL - @dmayhem93 hlavní inženýr Atroposu přidal desítky oprav chyb a další vylepšení spolehlivosti a kompatibility, lepší podporu pro multi-environment a CI/CD - Mnoho prostředí hackathonu Atropos bylo sloučeno do /environments/community - jejich seznam by zabral většinu místa na obrazovce, ale některé zajímavosti: VR-CLI od @JakeABoggs, Filozofie RLAIF, Adaptivní učitelé LLM, WebVoyager, design proteinů od @hallerite, modelové směrovací prostředí od @gabinfay, více na štíhlé dokazování, catbot aréna, pokémon showdown, poker, užitečné doktory, sanskrtská poezie od @khoomeik a mnoho dalšího! - Mezi další pozoruhodná oficiálně podporovaná nová prostředí patří: Formát odpovědi podle prostředí Prostředí Pydantic do JSON portované z @MatternJustus práce Následující instrukce převzaté z práce @natolambert a @allen_ai Počítání dopisů - 47 zbrusu nových přispěvatelů! Podívejte se na kompletní changelog zde: