Kiwi-do, ймовірно, буде майбутньою моделлю Kimi-K2-VL
Я протестував деякі тести зору з бенчмарку VPCT від @ChaseBrowe32432
Kiwi-do вдалося правильно відповісти на всі те, що я тестував
Команда Moonshot вже підтвердила в AMA та на Hugging Face, що планує випустити модель K2-VL
4 нові моделі OpenAI «Emperor», «Rockhopper», «Mumble», «Macaroni» тестуються на DesignArena
Раціональний бюджет моделей:
Імператор: 512
Рокхоппер: 64
Макарони 16
Бурмотіння: 0
Раціональні бюджети можуть бути не на 100% точними, оскільки відповіді іноді різняться, хоча дуже ймовірно, що Імператор, здається, є моделлю з найбільшим бюджетом