L'évaluation 2 sur 11 est en direct dans le marché Gensyn Lightweight General Reasoning Benchmark sur Delphi. Consultez dès maintenant les résultats complets du benchmarking :