“Dimmi come si presenta la casa dove vivi e ti dirò quante probabilità hai di fare un incidente stradale”. Sembra una frase senza senso e invece ha la sua logica, a dar retta a uno nuovo studio – abbastanza sorprendente! – di Łukasz Kidziński della Stanford University (Usa) e di Kinga Kita-Wojciechowska dell’Università di Varsavia (Polonia).
La loro ricerca si è basata sull’osservazione di immagini di Google Street View, e aveva come obiettivo trovare una eventuale correlazione tra il tipo di casa in cui una persona abita e la probabilità che, la stessa persona, ha di essere coinvolta in un incidente stradale.
Il teorema di Google Street View. Il tutto è partito analizzando i dati di 20.000 persone che avevano stipulato un’assicurazione auto in Polonia tra il 2013 e il 2015: i ricercatori e il loro team hanno cercato, per ogni assicurato, l’indirizzo dell’abitazione in Google Street View e, dopo averne scaricato un’immagine, l’hanno classificata in base al tipo (condominio, casa indipendente, casa a schiera ecc.), all’età e alle condizioni estetiche. Infine hanno incrociato questi dati con quelli forniti dall’assicurazione per estrapolare una eventuale correlazione con la probabilità che un assicurato presentasse un reclamo.
Effetto sorpresa. I risultati? Sorprendenti. Kidziński e Kita-Wojciechowska hanno scoperto che il tipo di casa in cui abita un assicurato è un buon predittore della probabilità che presenterà un reclamo all’assicurazione: “Le caratteristiche visibili su una foto di una casa possono essere predittive (ma lo studio non rivela nel dettaglio come, ndr) del rischio di incidenti automobilistici, indipendentemente dalle variabili classicamente usate come l’età o il codice postale”. Addirittura conoscere lo stato dell’abitazione potrebbe aumentare di un 10% la probabilità che un’assicuratore riesca a individuare un cliente propenso a presentare reclami. E secondo i ricercatori lo studio attuale è solo una “prova”: la sua accuratezza potrebbe essere migliorata utilizzando una quantità di dati maggiore e avvalendosi di un’analisi più precisa.
E la privacy? Usare dati come la facciata dell’abitazione in cui si vive – con le leggi attuali – va ben oltre i limite di ciò che può concedersi un’assicurazione nei confronti di chi la sceglie. “Il consenso dato dai clienti alla società per archiviare i loro indirizzi non significa necessariamente un consenso per memorizzare informazioni sull’aspetto delle loro case”, affermano gli stessi ricercatori. E la correlazione tra casa e incidenti potrebbe aprire un vaso di Pandora: anche altre aziende potrebbero approfittarne, con buon pace della privacy “Il settore assicurativo potrebbe essere rapidamente seguito dalle banche, poiché esiste una comprovata correlazione tra i modelli di rischio assicurativo e il punteggio del rischio di credito”.
Vota per Google Street! Non è la prima volta che i dati di Google Street View vengono utilizzati per carpire informazioni delicate e/o riservate. Due anni fa un altro ricercatore di Stanford, Timnit Gebru, ha utilizzato le immagini di Google Street View per capire come avessero votato alcune città degli Stati Uniti, partendo dalle foto delle auto in sosta. Grazie a un algoritmo, il team di Gebru è riuscito a cogliere la correlazione tra i tipi di veicoli e i dati del censimento degli Stati Uniti e le modalità di voto delle elezioni presidenziali di 35 città, in ciascun distretto esaminato.
La domanda a cui volevano rispondere era: dato lo schema dei veicoli in un’area, l’algoritmo potrebbe prevedere con precisione i dati demografici registrati nei dati del censimento USA e del voto presidenziale? La risposta è stata sì: “Osservando i veicoli a motore classificati in ogni quartiere, possiamo dedurre una vasta gamma di statistiche demografiche, attributi socioeconomici e preferenze politiche dei suoi residenti“, hanno spiegato i ricercatori. In questo caso, a differenza dello studio che mette in relazione le abitazioni con i profili dei clienti delle assicurazioni auto, era stato fornito qualche dettaglio in più: per esempio, le berline erano più strettamente associate ai democratici, mentre i pickup si “abbinavano” di più ai proprietari che hanno votato repubblicano. “Abbiamo scoperto che percorrendo una città per 15 minuti contando berline e camioncini, è possibile determinare in modo affidabile se la città ha votato democratico o repubblicano“, afferma Gebru.
Risultati che sollevano in entrambi i casi domande sul modo in cui da insiemi di dati apparentemente innocenti possono filtrare informazioni personali e quanto le organizzazioni dovrebbero essere in grado di usarli. E, soprattutto, cos’altro si può scoprire di noi usando una semplice web app o un social network?