Gemma 3 hiểu hình ảnh, văn bản và video - tất cả cùng một lúc. Trong bài phân tích sâu này, tìm hiểu cách mà mô hình tích hợp nhiều nguồn và thực hiện một loạt các nhiệm vụ từ việc trả lời câu hỏi về tài liệu đến mô tả chi tiết các cảnh vật. Khám phá lý do tại sao tính đa phương thức lại quan trọng.