Demis Hassabis über die nächsten 12 Monate: - Vollständige multimodale Konvergenz: Modelle wie Gemini werden nahtlos Text, Bilder, Audio und Video aufnehmen und ausgeben, mit einer Kreuzpollination, die das Denken + die Kreativität fördert. - Durchbruch in der visuellen Intelligenz: Bildmodelle wie Nano Banana Pro werden hochgenaue Infografiken erstellen und ein nahezu menschliches visuelles Verständnis zeigen. - Sprach- + Video-Fusion: Videomodelle, die mit LLMs integriert sind, ermöglichen reichhaltigere Analysen, Geschichtenerzählungen und schrittweises visuelles Denken. - Weltmodelle werden mainstream wie Genie 3 - Agenten werden zuverlässig