Demis Hassabis sobre os próximos 12 meses: - Convergência multimodal total: Modelos como Gemini irão integrar e produzir texto, imagens, áudio e vídeo de forma fluida, com uma polinização cruzada que impulsiona o raciocínio + criatividade. - Avanço na inteligência visual: Modelos de imagem como Nano Banana Pro produzirão infográficos altamente precisos e mostrarão uma compreensão visual quase humana. - Fusão de linguagem + vídeo: Modelos de vídeo integrados com LLMs desbloqueiam análises mais ricas, narrativas e raciocínio visual passo a passo. - Modelos de mundo se tornam mainstream como o Genie 3 - Agentes se tornam confiáveis