Google Street View est devenu un moyen utile de connaître le monde sans y entrer. Les gens l’utilisent pour planifier leurs voyages, explorer les destinations de vacances etc.
Mais les chercheurs ont trouvé des utilisations plus étonnantes. En 2017, une équipe de chercheurs a utilisé les images pour étudier la répartition des types de voitures aux États-Unis, puis a utilisé ces données pour déterminer la composition démographique du pays. Il s’avère que la voiture que vous conduisez est un indicateur fiable du niveau de revenu, d’études, de la profession et même de la façon de voter aux élections.
Aujourd’hui, ce sont Łukasz Kidziński de l’Université de Stanford en Californie et Kinga Kita-Wojciechowska de l’Université de Varsovie en Pologne qui ont utilisé des images Street View des logements de la population pour déterminer leur probabilité d’être impliquées dans un accident de voiture. C’est une information précieuse qu’une compagnie d’assurance pourrait utiliser pour fixer les primes.
En plus des compagnies d’assurance, les banques et les organisations de soins de santé peuvent améliorer considérablement leurs modèles de risque en analysant les images des maisons des titulaires d’assurance, d’après les chercheurs.
Démarche de recherche
La méthode des chercheurs est simple. Ils ont commencé avec un ensemble de données de 20 000 enregistrements de personnes ayant souscrit une assurance automobile en Pologne entre 2013 et 2015. Celles-ci ont été sélectionnées au hasard dans la base de données d’une compagnie d’assurance non divulguée.
Chaque enregistrement comprenait l’adresse du preneur d’assurance et le nombre de réclamations de dommages qu’il avait présenté au cours de la période 2013-2015. L’assureur a également partagé ses propres prévisions concernant les sinistres futurs, calculées à l’aide de son modèle de risque, qui prend en compte le code postal de l’assuré, l’âge du conducteur, le sexe, l’historique des sinistres, etc.
La question sur laquelle Kidziński et Kita-Wojciechowska ont enquêté est de savoir s’ils pourraient faire une prédiction plus précise à l’aide d’une image Google Street View du logement de l’assuré.

Exemples de logements différents ayant le même code postal et dont les résidents ont la même fréquence de réclamation attendue selon le modèle de l’assureur.
Pour le savoir, les chercheurs ont saisi l’adresse de chaque assuré dans Google Street View et ont téléchargé une image de la résidence. Ils ont classé cette habitation en fonction de son type (maison individuelle, maison mitoyenne, immeuble, etc.), de son âge et de son état. Enfin, les chercheurs ont procédé à une analyse approfondie de cet ensemble de données afin de déterminer la corrélation entre cet ensemble et la probabilité qu’un assuré présente une réclamation.

Annotations à partir de l’image Google Satellite View et Google Street View d’une adresse donnée.
Les résultats sont une surprise. Il s’avère que la résidence de l’assuré est un excellent prédicteur de la probabilité qu’il présente une réclamation. «Nous avons constaté que les caractéristiques visibles sur l’image d’une maison pouvaient permettre de prédire le risque d’accident de voiture, indépendamment des variables classiquement utilisées telles que l’âge ou le code postal», déclarent Kidziński et Kita-Wojciechowska.
Lorsque ces facteurs sont ajoutés au modèle de risque de l’assureur, il améliore son pouvoir de prévision de 2%. Pour mettre cela en perspective, le modèle de l’assureur est préférable à un modèle nul de seulement 8% et s’appuie sur un ensemble de données beaucoup plus vaste comprenant des variables telles que l’âge, le sexe et l’historique des réclamations.
La technique de Google Street View peut donc considérablement améliorer les prévisions. Et le travail actuel est simplement une preuve de principe. Les chercheurs disent que sa précision pourrait être améliorée en utilisant des ensembles de données plus volumineux et une meilleure analyse des données.
La question du consentement des données
Le résultat soulève d’importantes questions sur la manière dont les informations personnelles peuvent partir d’ensembles de données apparemment innocents et sur la possibilité pour les organisations de les utiliser à des fins commerciales.
L’approche des chercheurs soulève un certain nombre de questions importantes sur la manière dont les données personnelles doivent être utilisées. Les assurés polonais pourraient être surpris d’apprendre que l’adresse de leur domicile a été introduite dans Google Street View pour obtenir et analyser une image de leur domicile.
Une question intéressante est de savoir s’ils ont donné leur consentement éclairé à cette activité et si une compagnie d’assurance peut utiliser les données de cette manière, étant donné les lois strictes en vigueur en Europe sur la confidentialité des données. «Le consentement donné par les clients à l’entreprise pour stocker leurs adresses ne signifie pas nécessairement un consentement pour stocker des informations sur l’apparence de leurs maisons», déclarent Kidziński et Kita-Wojciechowska.
Et cette approche pourrait ouvrir une boîte de Pandore dans l’analyse de données . Si les compagnies d’assurance peuvent en bénéficier, pourquoi pas d’autres entreprises? «Les banques pourraient rapidement suivre l’industrie de l’assurance, car il existe une corrélation prouvée entre les modèles de risque d’assurance et la notation du risque de crédit», déclarent Kidziński et Kita-Wojciechowska.
La capacité à collecter, analyser et exploiter des informations a considérablement augmenté ces dernières années. Cette capacité a dépassé la compréhension de la plupart des populations sur ce qu’il est possible de faire avec leurs données est certainement plus rapide que la vitesse à laquelle une loi peut être adoptée pour le contrôler.
Bien entendu, Google n’est pas la seule entreprise à collecter des images au niveau de la rue. « Une telle pratique suscite toutefois des inquiétudes quant à la confidentialité des données stockées dans Google Street View, Microsoft, Bing Maps Streetside, Mapillary, ou dans des ensembles de données privés équivalents comme CycloMedia, accessibles au public », déclarent Kidziński et Kita-Wojciechowska. Ce type de travail est susceptible de poser la question de savoir si ces sociétés devraient être capables de collecter et de stocker ces images.
Sources:
https://www.technologyreview.com/s/613432/how-a-google-street-view-image-of-your-house-predicts-your-risk-of-a-car-accident/
https://arxiv.org/abs/1904.05270