Atropos v0.3 is nu uit! Ons RL Environments-framework heeft veel upgrades ondergaan sinds v0.2 - enkele hoogtepunten: - Atropos kan nu worden gebruikt als een benchmark- en evaluatiekader door @rogershijin, met onze eerste externe benchmark, Reward-Bench 2! - De Reasoning Gym is toegevoegd, een externe omgeving gym repo die is overgezet naar Atropos met meer dan 100 redeneertaken door @neurosp1ke en vrienden. - @max_paperclips heeft de redeneerbootcamp van @intern_lm geïntegreerd, met meer dan 1000 nieuwe redeneertaken voor RL. - @dmayhem93, de hoofdingenieur van Atropos, heeft tientallen bugfixes en andere verbeteringen in betrouwbaarheid en compatibiliteit toegevoegd, betere ondersteuning voor meerdere omgevingen en CI/CD. - Veel van de Atropos hackathon-omgevingen zijn samengevoegd in /environments/community - om ze allemaal op te sommen zou de meeste schermruimte in beslag nemen, maar enkele hoogtepunten: VR-CLI door @JakeABoggs, Filosofie RLAIF, Adaptieve LLM-docenten, WebVoyager, eiwitontwerp door @hallerite, een modelrouteringsomgeving door @gabinfay, meerdere op lean bewijzen, de catbot-arena, pokemon showdown, poker, behulpzame dokters, sanskritpoëzie door @khoomeik en nog veel meer! - Andere opmerkelijke officieel ondersteunde nieuwe omgevingen zijn: Antwoordformaat volgens omgeving Pydantic naar JSON omgeving overgezet van het werk van @MatternJustus Instructievolging overgezet van het werk van @natolambert en @allen_ai Lettertelling - 47 gloednieuwe bijdragers! Bekijk hier de complete changelog: