Gemma 3 розуміє зображення, текст і відео - все відразу. У цьому глибокому зануренні ви дізнаєтеся, як модель інтегрує кілька джерел і виконує низку завдань — від відповідей на запитання про документи до детального опису візуальних сцен. Дізнайтеся, чому мультимодальність важлива.