Я думаю, що Саттон має рацію практично у всьому Наслідування у тварин – це не наслідування. Це мета для наслідування, а *рухові дії* засвоюються без будь-яких даних. Шпак не може імітувати рухові дії, він цього не бачить. Це мета для наслідування
Дуже важко змусити людей це зрозуміти І, до речі, не кажіть, що LLM використовують rl Вони не використовують RL у своєму житті Він на шляху туди, і подальший рух лише доводить його думку більш правильною
LLM, до речі, погані, з точки зору гіркого уроку, тому що вони в основному протилежні обчислювальним множникам. Я намагаюся допомогти вам зрозуміти.
@bftnad мовляв, йому ще треба з'ясувати, навчитися, дослідити, як робити справжні рухові команди
123,98K