Le potentiel des données de la téléphonie mobile pour la planification


Aujourd’hui, la majorité données socioéconomiques sur un territoire donnée proviennent des recensements, révélant entre autre, le nombre, la répartition géographique, le sexe ou l’âge des habitants d’une population. Cependant, un recensement requiert une organisation relativement lente, lourde, coûteuse, et doit se dérouler dans une société relativement stable. Cela rend difficile la récolte de données dans les territoires frappés par la guerre ou la pauvreté.

Ainsi, un intérêt grandissant des sociologues, économistes et experts en géopolitique est apparu en faveur d’un moyen moins coûteux et plus rapide pour recueillir des données. Une réponse à ces attentes pourrait être apportée avec l’émergence des téléphones mobiles. Les données issues des téléphones apportent des informations détaillées sur le déroulement d’une société et des individus qui la composent. Par exemple, des recherches portant les schémas de mobilité, les stratégies de reproduction humaine ou le niveau d’alphabétisation ont été menées à partir des données de téléphonie mobile.

Une étude publié par Hadrien Salat, Zbigniew Smoreda et Markus Schläpfer du Future Cities Laboratory à Singapour, publié le 9 juillet 2019 dans sa première version, analyse les données de téléphonie mobile du Sénégal et affirme qu’elles pourraient potentiellement aider à la planification des infrastructures pour l’ensemble du pays.

Les téléphones mobiles se sont largement répandus dans les « pays en développement » (developing countries »), plus rapidement que d’autres services tels que l’électrification. Au Sénégal, par exemple, seuls 24% des ménages sont électrifiés, mais 75% possèdent un téléphone portable.

La méthode employé ici consiste à rassembler les données de population du dernier recensement au Sénégal, datant de 2013 (comprenant la densité de population dans les 552 communes ou divisions administratives du pays), les données sur la consommation d’électricité, estimé à l’aide d’images satellite du pays la nuit et en mesurant la quantité de lumière produite dans chaque commune, et enfin, les données anonymisées sur les téléphones mobiles pour l’ensemble du pays (nombre d’appels et de SMS et localisation des mâts téléphoniques auxquels les appels ont été passés).

À partir de ce recueil de données, l’idée qui se pose ensuite est de savoir comment ces ensembles de données sont corrélés les uns aux autres.

L’étude dresse un tableau de corrélations entre les valeurs horaires moyennes du nombre de SMS et d’appels et de la longueur totale des appels par tour de communication, l’intensité d’éclairage nocturne moyenne pour l’année 2013 (servant ici d’estimation sur la consommation électrique) ainsi que la densité de population. Les zones de hautes et de faibles densités de population sont distinguées dans l’analyse.

Le coefficient de corrélation de Pearson au carré (R²) est utilisé dans les deux premiers calculs du tableau (appelé aussi coefficient de détermination, utilisé pour mesurer la qualité de la prédiction d’une régression linéaire). En se fiant à celui-ci, on constate que les données de la téléphonie ne sont que modérément corrélées à la densité de population du Sénégal. L’application d’un logarithme aux valeurs améliore les prévisions globales et les prévisions pour les zones à faible densité.

Dans la constitution des variables, celles-ci suivent quasiment le modèle de distribution de Poisson, une régression multi-Poisson est effectuée à partir des variables de densité de population et de données de téléphonie mobile. Les résultats sont ici indiquées dans les trois derniers calculs du tableau. Les prévisions sont légèrement améliorées (par rapport au calcul du R²) pour tous les types de zones.

L’étude se poursuit et explique également comment traiter les données de téléphonie pour mieux estimer la densité de population et la consommation d’électricité, même lorsque les données ne couvrent qu’un tiers de la population.

Cette étude montre un potentiel intéressant dans l’exploitation des données. L’exemple développé montre que les données de la téléphonie mobile sont un indicateur important de la consommation d’électricité dans les pays en développement.

Et il est simple d’actualiser ces données régulièrement à un coût relativement bas, en comparaison avec les données du recensement, qui sont coûteuses à rassembler et mises à jour relativement rarement.

Cependant, et comme l’affirment les auteurs de cette étude, les données de la téléphonie mobile ne proviennent que d’un seul opérateur (Sonatel) et on ignore également sa part de marché entre les différentes régions sénégalaises, donnant potentiellement des résultats plus précis lors de l’analyse.

Néanmoins de telles résultats obtenues à partir des téléphones portables pourraient potentiellement changer la façon dont les acteurs gouvernementaux, sociaux ou économiques se saisissent de la problématique de planification des pays dits « en développement ».

 

Sources :

Salat Hadrien , Smoreda Zbigniew , Schläpfer Markus, « Mobile phone data’s potential for informing infrastructure planning in developing countries », le 17 septembre 2019, Cornelle University
https://arxiv.org/abs/1907.04812

Emerging Technology from the arXiv, « How much electricity does a country use? Just ask cell-phone users. », le 29 juillet 2019, MIT Technology Review
https://www.technologyreview.com/s/613987/how-much-electricity-does-a-country-use-just-ask-cell-phone-users/