Ich habe das Gefühl, dass sich die Robotikintelligenz und die LLMs weiter voneinander entfernen und nicht vereinen, aus den Gründen, die ich zuvor erklärt habe.
Ich finde es seltsam, dass die Leute denken, sie quantisieren Grenzmodelle - Meiner Meinung nach ist es fast 100 %, dass sie alle bereits auf fp4 laufen und alles, was weniger ist, nicht für NVIDIA-GPUs optimiert ist und ich würde annehmen, dass es auch für TPUs und Trainium usw. gilt.