puisque l'algorithme est de nouveau le sujet, je veux en faire la défense. pendant les vacances, j'ai fait une petite expérience, où j'ai pris quelques mèmes, bandes dessinées et œuvres que j'ai réalisées l'année dernière, et je les ai repostées en tant que nouveaux posts. environ 10 posts au total, avec 12 à 18 mois entre le post original et le nouveau post - couvrant donc une grande croissance de mes abonnés et de nombreux changements d'algorithme. c'était fou à quel point leurs métriques étaient similaires malgré cela ! il y avait un peu de bruit, mais beaucoup moins que ce à quoi on pourrait s'attendre. quelques posts ont mieux fonctionné la deuxième fois (un a obtenu environ 300 likes à l'origine et environ 6k la deuxième fois). aucun n'a fait moins bien. cela n'a pas de sens si vous modélisez l'algorithme comme un ensemble capricieux d'heuristiques. les heuristiques ont beaucoup changé au cours de l'année dernière. ils ont totalement réécrit l'algorithme ! alors comment les mêmes posts peuvent-ils bien fonctionner ? mais cela a parfaitement du sens si vous comprenez que l'"algorithme" que vous expérimentez n'est pas seulement, ou même principalement, le produit du code qui fonctionne sur les serveurs de X. l'"algorithme" est l'interaction de ce code avec la base d'utilisateurs à laquelle il montre des posts. cette base d'utilisateurs est ce qui génère les entrées pour le code de classement, et diverses boucles fonctionnent dynamiquement à partir de l'état de la machine d'état du système de recommandation vers la base d'utilisateurs et vice versa. (même grok, qui joue un rôle - présumément pour l'instant limité en calcul - dans le classement des posts, est à la fois informé par les préférences des utilisateurs et a accès à la recherche en direct.) la base d'utilisateurs est la plus grande entrée unique pour l'algorithme - plus précisément, c'est le substrat sur lequel l'algorithme fonctionne et interagit. l'algorithme est une roue qui tourne sur l'opinion des utilisateurs. cela signifie que "comment les gens se sentent à propos de ce post, posté par cette personne, à ce moment" devrait toujours être la première et principale partie de toute explication de pourquoi un post s'est comporté de la manière dont il l'a fait, et non un détail ésotérique des heuristiques du recsys ! alors pourquoi ces posts ont-ils bien fonctionné ? eh bien, regardez-les. la bande dessinée des pelles est drôle, mais elle est aussi facile à engager. c'était involontaire de ma part en la réalisant, mais il s'avère que le tweet de citation évident est de se moquer de l'industrie dans laquelle se trouve la personne. des tweets amusants à faire défiler les citations. le post sur le code des figures de Chladni a mieux fonctionné que mes autres posts de code - il a une vidéo - mais la vidéo n'est pas si engageante en soi, et le code golf est un intérêt de niche, donc le post s'est stabilisé plus bas. (c'est bien, j'aime ça, et je poste ce que j'aime.) le post sur la cuisinière à induction s'est stabilisé au milieu. c'est une bande dessinée en quatre panneaux, elle utilise mes personnages triangulaires reconnaissables, mais elle est plus de niche et invite moins à l'engagement que la bande dessinée des pelles. maintenant, ce ne sont pas mes préférences idéales pour ce que la plateforme récompenserait. évidemment, j'aimerais vivre dans un monde où le code golf des figures de Chladni ou mes posts de recherche sur ma persona LLM deviendraient hyperviraux. (nous pouvons l'appeler ThebesPOT.) mais ce n'est pas quelque chose sur lequel @nikitabier a du pouvoir ! il ne peut pas changer combien de personnes s'engagent différemment avec mes bandes dessinées à image unique par rapport à mes écrits longs, ou rendre les normies intéressés par le code golf ou l'analyse en composantes principales des représentations de modèles de base ou des histoires courtes sur la cosmologie yukaghir. et c'est bien ! je suis très reconnaissant d'obtenir même trois likes sur certains des écrits et fictions plus de niche que je poste - des choses que dans une vie précédente, je n'aurais jamais trouvé une autre âme pour comprendre, encore moins trois. comme autre exemple, prenons les "séries de posts", où quelques posts réussis consécutifs semblent booster votre prochain post. ceux-ci sont souvent attribués à une fonctionnalité explicite de la plateforme. (parfois même théorisés comme une tentative délibérée de garder les gens accros.) et peut-être que c'est le cas, je ne sais pas - mais vous pouvez en fait obtenir des séries de posts à partir d'un "algorithme" très simple qui ne suit même pas les séries, juste avec trois règles simples : 1. vos nouveaux posts sont préférentiellement montrés aux personnes qui ont interagi avec vous récemment 2. les posts ont "une dynamique", donc les interactions entraînent plus de personnes voyant le post 3. psychologiquement, les gens reconnaissent les noms et les photos de profil qu'ils ont vus récemment, et ralentissent dans le fil d'actualité pour voir ce que les gens qu'ils connaissent postent ces trois faits simples - le plus important n'étant même pas un fait sur le code ! - nous donnent une dynamique de poster. quand vous êtes en forme, les gens vous reconnaissent - peut-être inconsciemment, mais peut-être qu'ils pensent même "merde, ce gars est en forme, je devrais jeter un œil à ce post." parce que les gens vous reconnaissent, si votre post est bon, il peut gagner en dynamique beaucoup plus rapidement - et parce qu'il y a tant de spectateurs candidats provenant de posts récents, la dynamique peut continuer à attirer des gens qui vous reconnaissent plus longtemps, au lieu d'avoir besoin de rompre le confinement tôt. ces trois règles à elles seules produisent des séries, sans heuristique explicite ou même modèle dans le code d'une "série" - purement à partir de dynamiques émergentes. ...