Gemma 3 förstår bilder, text och video - allt på en gång. I den här djupdykningen får du lära dig hur modellen integrerar flera källor och utför en rad uppgifter, från att svara på frågor om dokument till att beskriva visuella scener i detalj. Utforska varför multimodalitet är viktigt.