mtmx

Géographie du supportariat

Mathieu

October 27, 2014


Où cesse-t-on de supporter Lille pour passer du côté Lensois ? Y a-t-il des supporters marseillais partout en France ? La Lorraine est-elle (vraiment) grenat ? Toutes ces questions ont déjà été posées milles fois : la géographie ça sert d’abord à faire la guerre du foot !

Mais comment connaître ces liens qui unissent une équipe et ses fans ? Plutôt facile à l’échelle d’un club qui peut utiliser les adresses de ses abonnés pour détecter leur résidence d’origine, ou procéder à des enquêtes auprès des détenteurs de billets de matchs. Ou bien encore exploiter les données de téléphonie mobile pour comprendre d’où viennent les smartphones présents dans le stade au moment du match. Mais pour avoir une vision plus globale de l’histoire, les réseaux sociaux et Twitter en particulier sont bien utiles d’autant plus quand la moindre étude de « marché » est jalousement gardée secrète par les dits clubs.

Méthodologie

On part du postulat, très fort, qu’on suit un club sur Twitter lorsqu’on en est plutôt supporter alors qu’on peut bien sûr systématiquement troller son ennemi intime en le suivant sur twitter, c’est autorisé. Une autre limite réside dans la base d’utilisateurs plutôt jeune et urbaine de ce réseau social : Facebook aurait été sûrement plus représentatif mais apparemment seul le New York Times a le loisir de s’amuser avec ses données. Enfin la localisation déclarée dans la biographie des twittos semble sur-représentée dans les zones urbaines, voire à Paris où c’est probablement plus classe de se déclarer résident. Les scripts R sont en vrac ici.

Très rapidement les grandes étapes du processus :

  • recensement des comptes twitter officiels des 43 clubs de L1/L2 pour la saison 2018/2019 (oui ça date un peu) + 3 gros clubs de National (Tours FC, SC Bastia et Stade Lavallois)
  • requêtage de l’API Twitter pour récupérer la liste des comptes followers des 43 clubs (20 millions de followers au total) [via rtweet]
  • requêtage de l’API Twitter pour récupérer les métadonnées (language utilisé, biographie renseignée…) sur ces comptes (11 millions de followers distincts)
  • géocodage du référentiel des localisations indiquées dans les biographies des followers [via opencage]
  • affectation d’un poids de pondération des comptes followers selon la sur/sous représentation de leur commune de localisation (référence population Insee)
  • aggrégation des stats communales sur une grille de carreaux de 10 km de côté

Le PSG et les autres

D’abord un petit rappel sur les forces en présence : le club parisien est loin devant tout le monde et son envergure internationale en fait de loin le club le plus suivi à l’étranger. L’AS Monaco a la deuxième base étrangère mais relativement peu suivi en France.

Cartographie des aires d’influence des clubs de football

La carte qui suit permet d’afficher le club français qui compte le plus de fans dans chaque zone de 10 km de côté, la commune indiquée étant la plus peuplée de ce carré. Seuls ceux comptant plus de 10 twittos (ajustements compris, cf. méthodo) sont indiqués donc de nombreuses zones peu denses ne sont pas renseignées.

Club le plus populaire