Gemma 3 понимает изображения, текст и видео - все сразу. В этом углубленном исследовании узнайте, как модель интегрирует несколько источников и выполняет ряд задач, от ответов на вопросы о документах до детального описания визуальных сцен. Узнайте, почему мультимодальность важна.