Dyskusja na temat efektywnej uwagi «Najbardziej prawdopodobny scenariusz … to fuzja dwóch ścieżek. Na przykład, użycie gęstej uwagi dla pobliskich tokenów, aby zapewnić jakość, oraz liniowych mechanizmów dla odległych tokenów, aby kontrolować koszty; lub stosowanie różnych strategii w różnych warstwach…»