DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Sholto Douglas (Anthropic) : "Au cours de l'année dernière, l'apprentissage par renforcement (RL) nous a enfin permis de prendre une boucle de rétroaction et de la transformer en un modèle qui est au moins aussi bon que les meilleurs humains dans un domaine étroit donné. Et vous le voyez avec les mathématiques et le code de compétition, qui sont les deux domaines les plus adaptés à cela - où rapidement les modèles deviennent des mathématiciens de compétition et des codeurs de compétition incroyablement compétents. Il n'y a rien d'intrinsèquement différent entre le code de compétition et les mathématiques. C'est juste qu'ils sont vraiment [plus] adaptés au RL que tout autre domaine. Mais il est important de noter qu'ils démontrent qu'il n'y a pas de plafond intellectuel sur les modèles. Ils sont capables de faire un raisonnement vraiment difficile donné la bonne boucle de rétroaction. Donc, nous pensons que cette même approche se généralise à pratiquement tous les autres domaines de l'effort intellectuel humain où, donné la bonne boucle de rétroaction, ces modèles deviendront au moins aussi bons que les meilleurs humains dans un domaine donné. Et une fois que vous avez quelque chose qui est au moins aussi bon que les meilleurs humains dans un domaine, vous pouvez simplement en faire fonctionner 1 000 en parallèle ou 100 fois plus vite et vous avez quelque chose qui, même avec cette condition, est substantiellement plus intelligent que n'importe quel humain donné. Et cela met complètement de côté la question de savoir s'il est possible de créer quelque chose de plus intelligent qu'un humain. Les implications de cela sont assez stupéfiantes, n'est-ce pas ? Dans les 2 ou 3 prochaines années, donné les bonnes boucles de rétroaction, donné le bon calcul, etc., nous pensons que nous, en tant qu'industrie de l'IA dans son ensemble, sommes en bonne voie pour créer quelque chose qui est au moins aussi capable que la plupart des humains dans la plupart des tâches informatiques, peut-être aussi bon que beaucoup de nos meilleurs scientifiques dans leurs domaines. Ce sera pointu et irrégulier, il y aura des exemples de choses qu'il ne peut pas [faire]. Mais le monde changera. ... Je pense que cela vaut la peine de crier sur tous les toits un peu - les gars, tout ce que nous pouvons mesurer semble s'améliorer très rapidement. Où cela nous mène-t-il dans 2 ou 3 ans ? Je ne peux pas le dire avec certitude. Mais je pense qu'il vaut la peine d'intégrer dans nos visions du monde qu'il y a une chance assez sérieuse que nous obtenions l'AGI."

Meilleurs

Classement

Favoris