Дико, как быстро мы насытили эталоны для каждой модальности. Это было довольно очевидно, когда это произошло с текстом - вам нужно было использовать LLM в течение нескольких дней, прежде чем получить реальное представление о качестве, даже если он был технически #1. Теперь это происходит с изображениями и видео!