Demis Hassabis sobre los próximos 12 meses: - Convergencia multimodal completa: Modelos como Gemini absorben y generan texto, imágenes, audio y vídeo sin interrupciones, con polinización cruzada que potencia el razonamiento + la creatividad. - Inteligencia visual innovadora: Modelos de imagen como Nano Banana Pro producen infografías muy precisas y muestran una comprensión visual casi humana. - Fusión de lenguaje + vídeo: Los modelos de vídeo integrados con LLMs desbloquean un análisis más rico, narración y razonamiento visual paso a paso. - Los modelos mundiales se vuelven mainstream como Genie 3 - Los agentes se vuelven fiables