Quel est votre numéro UNO ?

Vous l’avez peut-être remarqué, les résultats des Tops SensCritique ont pas mal bougé depuis lundi dernier. En effet, on a changé notre algorithme de manière à avoir des résultats qui collent mieux avec vos goûts.

Les Tops, c’est quoi ?

Les Tops SensCritique, ce sont des sondages qu’on effectue pour connaître les meilleures oeuvres d’une catégorie (des Meilleurs Livres de 2019, aux Meilleures Séries de Science-Fiction, en passant par Les meilleures affiches de films).

exemples de sondages

Comment ça marche ? Chaque personne vote pour son Top personnel des oeuvres qui lui paraissent correspondre le mieux (on peut mettre autant d’oeuvres qu’on veut mais seules les 10 premières comptent dans le classement du Top SensCritique) et nous on agrège les résultats grâce à un algorithme.

Quel intérêt ?

L’intérêt des Tops, c’est de mettre en lumière une thématique (qui peut être un genre, un artiste, une décennie, etc), et d’en proposer les oeuvres les plus marquantes. Le but est de faire ressortir les oeuvres qui traitent le mieux du sujet, qui sont appréciées, et qui sont connues. C’est un très bon complément à la note SensCritique, qui elle, évalue juste la qualité “brute” d’une oeuvre.

Les difficultés d’agréger les résultats

Quand on agrège les votes de différentes personnes, la popularité des oeuvres peut biaiser les résultats. Par exemple, un film comme Avengers : Endgame, qui est parmi les plus notés de l’année 2019, se retrouvera dans beaucoup de réponses au sondage des Meilleurs films de 2019. Il pourra donc se retrouver devant des films beaucoup moins connus mais mieux notés (Portrait de la Jeune Fille en Feu par exemple), même si les utilisateurs qui ont vu les deux films placent très majoritairement Portrait de la Jeune Fille en Feu devant Avengers : Endgame dans leur classement.

Le portrait des Avengers en feu

Notre réponse à ces problématiques

Il y a plusieurs manières de gérer ce genre de problématiques, et celle choisie par SensCritique il y a quelques années était de donner un bonus arbitraire aux oeuvres moins populaires. Problème : il est difficile de trouver une pondération efficace pour tous les Tops, notamment à cause du nombre de réponses qui varie de quelques dizaines à plusieurs milliers.

En conséquence, les Tops peu populaires (moins de 500 réponses) voyaient remonter de nombreuses oeuvres inconnues. On arrivait à des résultats incohérents, Harakiri étant par exemple mieux classé dans le Top des Meilleurs films des années 1960 (2°) que dans le Top des Meilleurs films de 1962 (16°).

Le nouvel algorithme

Donner un bonus aux films les moins populaires semble donc a posteriori être une mauvaise idée. Pour trouver une autre manière d’éviter de trop favoriser les films populaires, nous sommes allés chercher des réponses du côté de la théorie du vote, qui a les mêmes tenants et aboutissants que notre problématique. On a choisi d’utiliser un algorithme adapté du Compte de Borda modifié. En quelques mots, on associe un nombre maximal de points à l’oeuvre classée première par un utilisateur, puis un nombre décroissant de points aux oeuvre suivantes.

Le problème de popularité se règle en pénalisant les réponses qui ne contiennent pas 10 oeuvres, auxquelles on donne moins de points. Ainsi, on pondère à la hausse les personnes qui connaissent au moins 10 oeuvres qui sont dans le Top, et qui ont donc une connaissance plus vaste du domaine, et sont moins à même de voter pour la seule oeuvre qu’elles connaissent.

Et ça donne quoi ? Un cas pratique :

Voilà par exemple comment évolue le classement des Meilleurs films Coréens. On remarque que les 4 films qui progressent le plus sont Old Boy, Memories of Murder, Mademoiselle, et Parasite. Ce sont aussi les 4 mieux notés du top 10, ce qui semble montrer que le nouvel algorithme remplit mieux sa mission.

Et concrètement ça change quoi pour vous ?

Pour profiter de cette amélioration, le mieux que vous puissiez faire est de remplir vos Tops (même si vous n’avez pas 10 films à mettre, c’est toujours un début, et ça pourra vous motiver pour plus tard).

Quelques idées :